平成のコロコロ表紙361冊を学習させてLightweight GANで512pxの画像を生成したログ・比較

2023年5月22日

Google Ad

主旨

毎月表紙の雰囲気における類似性の高いコロコロコミックの表紙絵を512pxにして学習させLightweight GANで画像生成したログである。

目的

今回の目的を以下に記す。

  • 128pxの場合と出力を比較・考察
  • 予想とのずれを見ることにより、今後のGAN利用の事前に行う可否判断に生かす

期間

2021年9月14日~2021年9月17日

開発に用いたもの

Google Colaboratory Pro

開発環境

Pythonバージョン

  • Python 3.7
  • torch 1.9.0+cu102
  • torchvision 0.10.0+cu102
  • lightweight-gan 0.20.4

予想

題名

毎月「コロコロ」の位置が表紙の定位置にあるため、「コロコロ」という文字がはっきりわかるように画像が生成される。

「コロコロ」という文字の色は混ざり合ったものになる。

表紙絵

長年掲載されていた作品の影響が大きくでる。

特にドラえもんとでんじゃらすじーさんは表紙において占める割合が大きく、少なくとも青色と肌色は多い。

大きなイラストが一つ出力画像のどこかにある状態になる。

準備

コロコロオンラインの画像使用は、著作権法以上の規制がないことをコロコロオンラインの「画像使用・著作権」リンクである小学館の画像使用著作権ページで確認。

著作権法第三十条の四第二号より、著作物をAIの学習データに使用して著作者の利益を害さなければ問題ないと確認。

【年末年始特別企画!!】平成のコロコロ表紙361冊全部見せますSP! の画像を使用し、高さ512pxの大きさに変更。

幅を512pxにするために、左右の余白を均等に黒色で埋めたものを学習データとした。

操作

前回と同様の操作をGoogle Colaboratory Proで512px指定、マルチGPUで行った。

ログ

以下のURLに今回のログがある。

ファイル名の末尾が実行順である。

中断と再開を何度か行ったため3つのファイルが存在するが、すべて同じ操作である。

節目となっているステップ時の画像を掲載する。

開始時

!lightweight_gan --data ./korokoro --image-size 512 --amp --multi-gpus

0ステップ目

早くもコロコロらしさのある画像が出力される。

40,000ステップ後

「コロコロ」の文字が見えてきた。

48,000ステップ後

ドラえもんが見え隠れしている。

82,000ステップ後

抽象的な人間の顔が出現。

以降

これ以上の進展がなかったため、102,000ステップで終了。

考察

学習データの類似性について

今回は前回と違い、「コロコロ」の文字以外も生成された。

人間の顔が曲がりなりにも生成されるようになった。

しかし、この二点のみが明確に生成されたにすぎない。

この理由は、学習データ同士の類似性が、「コロコロ」という文字が存在することと、大きな顔が一つあること以外に高くないことが考えられる。

128pxで学習を行ったときとの結果の相違について

前回の128pxで学習を行ったときと比較すると、大きな顔らしきものが生成した画像の中に出るようになった。

今回は前回より8倍大きい画像を生成している。

したがって、大きな顔らしきものの有無が8倍大きく生成されるようになり、判別機による判定で重要になったと考えられる。

まとめ

  • 128pxのときより512pxのときのほうがコロコロコミックの特徴がでた
  • データ同士の類似性が高い学習データでしか画像生成できないことが分かった

次回予告

  • 何か別のデータを使うはず

他の回

「Lightweight GAN 連載記事」でタグ付けを行っている。

広告

コロコロコミックのことがわかりそうな本。

広告