平成のコロコロ表紙361冊を学習させてLightweight GANで生成したログ

2023年5月22日

Google Ad

主旨

毎月表紙の雰囲気における類似性の高いコロコロコミックの表紙絵を128pxにして学習させLightweight GANで画像生成したログである。

目的

ページの目的を以下に記す。

  • 前回と比べて学習データ同士の類似性が高い場合の結果を考察
  • 予想とのずれを見ることにより、今後のGAN利用の事前に行う可否判断に生かす

期間

2021年9月10日~2021年9月12日

開発に用いたもの

  • Windows 10 Home
  • Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz 2.21 GHz
  • GeForce GTK 1050
  • CUDA Toolkit
  • Python(自分でコードを書いた部分はなし)
  • lightweight-gan

Pythonバージョン

  • Python 3.6.8
  • torch 1.8.0
  • torchaudio 0.8.0
  • torchvision 0.9.0
  • lightweight-gan 0.20.4
  • kornia 0.4.1

予想

題名

毎月「コロコロ」の位置が表紙の定位置にあるため、「コロコロ」という文字がはっきりわかるように画像が生成される。

「コロコロ」という文字の色は混ざり合ったものになる。

表紙絵

長年掲載されていた作品の影響が大きくでる。

特にドラえもんとでんじゃらすじーさんは表紙において占める割合が大きく、少なくとも青色と肌色は多い。

準備

コロコロオンラインの画像使用は、著作権法以上の規制がないことをコロコロオンラインの「画像使用・著作権」リンクである小学館の画像使用著作権ページで確認。

著作権法第三十条の四第二号より、著作物をAIの学習データに使用して著作者の利益を害さなければ問題ないと確認。

【年末年始特別企画!!】平成のコロコロ表紙361冊全部見せますSP! の画像を使用し、高さ128pxの大きさに変更。

幅を128pxにするために、左右の余白を均等に黒色で埋めたものを学習データとした。

操作

前回と同じ操作を行った。

ログ

節目となっているステップ時の画像を掲載する。

開始時

E:\>lightweight_gan --data E:\gan --image-size 128 --batch-size 2 --amp
default<E:\gan>:   0%|                                                                      | 0/150000 [00:00<?, ?it/s]G: 11.78 | D: 3.29 | GP: 2.49 | SS: 0.55
default<E:\gan>:   0%|                                                          | 46/150000 [01:30<80:54:45,  1.94s/it]G: 6.18 | D: 0.00 | GP: 0.00 | SS: 0.22
default<E:\gan>:   0%|                                                          | 91/150000 [02:31<71:11:56,  1.71s/it]G: 5.47 | D: 0.04 | GP: 0.31 | SS: 0.23
default<E:\gan>:   0%|                                                         | 148/150000 [03:45<59:04:54,  1.42s/it]G: 5.52 | D: 0.24 | GP: 0.03 | SS: 0.24

0ステップ目

すべての学習でデータを混ぜただけのように見える。

1,000ステップ目経過画像

早くも「コロコロ」の文字が見えている。

70,000ステップ後

「コロコロ」の文字の色は混ざり合ったものもある。

処理が止まったが、続行すると最新のモデルが破壊されるようになった。続行不能によりここで学習を中断。

RuntimeError: Couldn't open shared file mapping: <torch_8628_3732569035>, error code: <1455>

考察

学習データの類似性について

「コロコロ」の文字以外明確に生成されなかった。

このことから、学習データ同士の雰囲気と色味だけが同じであるが、キャラクターの配置や大きさが毎回違ったため明瞭に生成されなかったと考えられる。

まとめ

  • 明瞭に画像生成されなかった
  • より学習データ同士の類似性を高めるべきだ

参考文献

次回

Google Colabの無料版、有料版の速度を調査した。

他の回

「Lightweight GAN 連載記事」でタグ付けを行っている。

広告

コロコロ創刊の話。

広告