敵対的生成ネットワーク

2.3. 敵対的生成ネットワーク#

敵対的生成ネットワークgenerative adversarial network; GAN)は、2014 年に Ian Goodfellow らによって提案された、データ生成を目的とした深層学習モデルです2。GAN は高品質な画像生成技術として注目され、現在では画像処理のみならず、多岐にわたる分野に応用されています。

GANは、生成器generator)と識別器discriminator)の 2 つのニューラルネットワークを競争させることで学習を進めます。生成器は、ノイズベクトル \(z\) を入力として、データ \(G(z)\) を生成します。この \(z\) はランダムな値で、通常は正規分布や一様分布からサンプリングされます。生成器の目標は、識別器を騙して、本物のデータに見えるようなデータを作り出すことです。一方、識別器は、生成されたデータ \(G(z)\) と実際の学習データを比較し、それが本物か偽物かを判定する役割を果たします。識別器は、生成器によって作られたデータを見破る能力を向上させるように訓練されます。

学習過程では、生成器と識別器が互いに競争します。生成器は識別器を欺こうと試み、識別器は生成器を見破る精度を上げようとします。この「敵対的」な競争を通じて、生成器は現実のデータと区別がつかないレベルの高品質なデータを生成できるようになります。最終的に、識別器が生成されたデータと本物のデータを区別できなくなる状態に収束することを目指します。この学習の仕組みは、次のような損失関数で定式化されます。

\[ \min_G \max_D V(D, G) = \mathbb{E}_{x \sim p_{data}(x)}[\log D(x)] + \mathbb{E}_{z \sim p_z(z)}[\log(1 - D(G(z)))] \]

GAN の学習にはいくつかの課題があります。モード崩壊mode collapse)と呼ばれる現象では、生成器が特定のパターンを持ったデータのみを生成し、多様性が失われることがあります。また、生成器と識別器のバランスが崩れ、一方が優位になりすぎると学習が進まなくなることもあります。さらに、高品質なデータ生成には、大規模なデータセットと計算リソースが必要です。これらの課題を克服するために、Wasserstein GAN(WGAN)1、StyleGAN4 や 拡散モデル(Diffusion Model)3などのアルゴリズムが提案されています。

GAN は現在、さまざまな分野で活用されています。例えば、画像生成では、キーワードから画像を生成する、モノクロ写真をカラー化する、低解像度画像を高解像度化する(超解像技術)といった応用があります。アニメーションやゲームキャラクターのデザイン、広告や映像制作にも利用されています。また、医療分野では、CT や MRI 画像の生成や、疾患部位の合成によるトレーニングデータの拡張に使われています。さらに、GAN は画像以外にも応用が広がっており、音声合成やテキスト生成、さらにはデータ拡張にも利用されています。一方で、倫理的な問題も指摘されています。たとえば、GAN を用いて生成されたディープフェイクは、偽情報の拡散に悪用される可能性があるため、社会的な影響に配慮した利用が求められています。

2.3.1. 参照文献#

[1]

Martin Arjovsky, Soumith Chintala, and Léon Bottou. Wasserstein gan. 2017. URL: https://arxiv.org/abs/1701.07875, arXiv:1701.07875.

[2]

Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial networks. 2014. URL: https://arxiv.org/abs/1406.2661, arXiv:1406.2661.

[3]

Jonathan Ho, Ajay Jain, and Pieter Abbeel. Denoising diffusion probabilistic models. 2020. URL: https://arxiv.org/abs/2006.11239, arXiv:2006.11239.

[4]

Tero Karras, Samuli Laine, and Timo Aila. A style-based generator architecture for generative adversarial networks. 2019. URL: https://arxiv.org/abs/1812.04948, arXiv:1812.04948.