平成のコロコロ表紙361冊を学習させてLightweight GANで生成したログ

2021年9月18日2023年5月22日

主旨

毎月表紙の雰囲気における類似性の高いコロコロコミックの表紙絵を128pxにして学習させLightweight GANで画像生成したログである。

目的

ページの目的を以下に記す。

前回と比べて学習データ同士の類似性が高い場合の結果を考察
予想とのずれを見ることにより、今後のGAN利用の事前に行う可否判断に生かす

期間

2021年9月10日～2021年9月12日

開発に用いたもの

Windows 10 Home
Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz 2.21 GHz
GeForce GTK 1050
CUDA Toolkit
Python（自分でコードを書いた部分はなし）
lightweight-gan

Pythonバージョン

Python 3.6.8
torch 1.8.0
torchaudio 0.8.0
torchvision 0.9.0
lightweight-gan 0.20.4
kornia 0.4.1

予想

題名

毎月「コロコロ」の位置が表紙の定位置にあるため、「コロコロ」という文字がはっきりわかるように画像が生成される。

「コロコロ」という文字の色は混ざり合ったものになる。

表紙絵

長年掲載されていた作品の影響が大きくでる。

特にドラえもんとでんじゃらすじーさんは表紙において占める割合が大きく、少なくとも青色と肌色は多い。

準備

コロコロオンラインの画像使用は、著作権法以上の規制がないことをコロコロオンラインの「画像使用・著作権」リンクである小学館の画像使用著作権ページで確認。

著作権法第三十条の四第二号より、著作物をAIの学習データに使用して著作者の利益を害さなければ問題ないと確認。

【年末年始特別企画!!】平成のコロコロ表紙361冊全部見せますSP！の画像を使用し、高さ128pxの大きさに変更。

幅を128pxにするために、左右の余白を均等に黒色で埋めたものを学習データとした。

操作

前回と同じ操作を行った。

mouseのゲーミングノートPCを使用してpythonのlightweight-ganを試したログ

主旨 StyleGANよりも、少ない学習データでの学習速度が速く、出力データも精巧であるLightweight GANを ...

https://kojichu.com/blog/2021/09/13/post-2984/

ログ

節目となっているステップ時の画像を掲載する。

開始時

E:\>lightweight_gan --data E:\gan --image-size 128 --batch-size 2 --amp
default<E:\gan>:   0%|                                                                      | 0/150000 [00:00<?, ?it/s]G: 11.78 | D: 3.29 | GP: 2.49 | SS: 0.55
default<E:\gan>:   0%|                                                          | 46/150000 [01:30<80:54:45,  1.94s/it]G: 6.18 | D: 0.00 | GP: 0.00 | SS: 0.22
default<E:\gan>:   0%|                                                          | 91/150000 [02:31<71:11:56,  1.71s/it]G: 5.47 | D: 0.04 | GP: 0.31 | SS: 0.23
default<E:\gan>:   0%|                                                         | 148/150000 [03:45<59:04:54,  1.42s/it]G: 5.52 | D: 0.24 | GP: 0.03 | SS: 0.24

0ステップ目

すべての学習でデータを混ぜただけのように見える。

1,000ステップ目経過画像

早くも「コロコロ」の文字が見えている。

70,000ステップ後

「コロコロ」の文字の色は混ざり合ったものもある。

処理が止まったが、続行すると最新のモデルが破壊されるようになった。続行不能によりここで学習を中断。

RuntimeError: Couldn't open shared file mapping: <torch_8628_3732569035>, error code: <1455>

考察

学習データの類似性について

「コロコロ」の文字以外明確に生成されなかった。

このことから、学習データ同士の雰囲気と色味だけが同じであるが、キャラクターの配置や大きさが毎回違ったため明瞭に生成されなかったと考えられる。

まとめ

明瞭に画像生成されなかった
より学習データ同士の類似性を高めるべきだ

参考文献

コロコロの表紙絵を利用したサイト。
- 【年末年始特別企画!!】平成のコロコロ表紙361冊全部見せますSP！ | コロコロオンライン｜コロコロコミック公式
上記に掲載されている画像の利用について
- 画像使用・著作権 | 小学館
AIの学習データとして使う画像の著作権について
- 無断でダウンロードしたデータでもAI開発に使える？　改正著作権法を弁護士が解説 - ＠IT

次回

Google Colabの無料版、有料版の速度を調査した。

Google Colaboratory 無料版（Tesla K80）・Pro（Tesla T4）とローカル（GTK1050）でL

主旨 Google Colaboratory 無料版（Tesla K80）・Pro（Tesla T4）とローカル（GTK1050）でLightweight ...

https://kojichu.com/blog/2021/09/22/post-3071/

他の回

「Lightweight GAN 連載記事」でタグ付けを行っている。

Lightweight GAN 連載記事 | 工事中.com

工事中.com | Lightweight GAN 連載記事 Tag

https://kojichu.com/blog/tag/lightweight-gan-連載記事/

主旨

目的

期間