データ分析手法 - 敵対的生成ネットワーク

敵対的生成ネットワーク

敵対的生成ネットワーク(GAN)とは、用意されたデータから繰り返しデータ生成を行い、本物のようなデータを生成することができる生成モデルです。GANを利用することで元画像に近い画像を生成することや、低画質の画像から高画質の画像へ復元することなどが可能です。

手法について

敵対的生成ネットワーク(GAN)とは生成モデルの一種であり、GereratorとDiscriminatorと呼ばれる2種類のネットワークを戦わせることで本物と見分けがつかないような新しい画像を生成していきます。Generatorは潜在空間のランダムベクトルを受け取りDiscriminatorが間違えるような新しい画像を作成するよう学習し、DiscriminatorはGeneratorが作成した画像を受け取り偽物の新しい画像を見抜けるよう学習していきます。
GANを使うことで高画質の画像生成やリアルタイムでの画像変換、ディープフェイクを用いて本人が話しているような動画を作成することが可能です。

手順・式

GANの構造として一般に、Generatorと呼ばれる画像を生成する部分とDiscriminatorと呼ばれる画像を判別する部分に分かれています。
Discriminatorは入力された画像がGeneratorから生成された偽物の画像か、実際に採取されたの本物の画像かどうかを判別します。その後、画像が偽物かどうかの判別がうまくできるように学習を行います。
一方、Generatorは乱数を入力として画像を生成し、Discriminatorに画像を渡します。
GeneratorはDiscriminatorが行う偽物かどうかの判別を誤らせるように画像の生成を改善していきます。
敵対するGeneratorとDiscriminatorを交互に学習させることで、Generatorはより本物に近い画像を生成することが可能となります。

メリット・デメリット

【メリット】

①新規のデータや情報を生成可能
 既存のデータをもとに新規のデータや情報を生成することができます。
 少ないデータから多くのデータを作成することができるため、豊富なデータを揃えることができます。

②ほかの技術と併用可能
 GANはほかの技術と組み合わせて使用することができます。
 例として、word2vecとGANを組み合わせることで画像ラベルから演算までを行うことが可能です。

【デメリット】

①判断基準がわかりにくい
 画像が似ているかの判別が不透明であり、コンピュータの判断基準が人間の判断基準と異なる場合もあります。

データ分析手法 ー 敵対的生成ネットワーク