Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

HoloGAN: Unsupervised learning of 3D representations from natural images #56

Open
kogaki opened this issue Apr 5, 2019 · 1 comment

Comments

@kogaki
Copy link
Member

kogaki commented Apr 5, 2019

学習データは2D画像からのみで、3D表現(いろいろな方向へのレンダリング)を得る

論文本体・著者

解きたい問題

  • 2D画像だけのデータセットから3D表現を得る
    • ランダムなzと目的の方向θをいれて画像生成する。z固定でθを動かせば色んな方向の画像が生成できる

新規性

  • 高品質な様々な向きの画像を、学習データが2D画像だけから生成できる

実装

image
論文 Fig. 3 より
    1. スタイルzはAdaINを用いて複数のレイヤーに入力する、StyleGANに似た構造
    1. 3D表現のレイヤー(オレンジ)と2D表現のレイヤー(緑)をProjection Unitでつなぐ
    • なお、Projection Unitのパラメタも学習対象。なぜならカメラパラメタは未知だから
    1. 3D表現のレイヤーにランダムな回転(3D Transform)を加える。これにより、様々な方向に破綻のない3D表現が得られる
    • 例えばCarデータセットではy軸周りの回転を360度, x軸周りの回転を35度からランダムサンプリング
  • ロスについて

      1. もちろん2Dデータセットと出力2DとのDiscriminator
      1. G,Dに加えて、画像からzを逆推定するEncoder Fを作り、F(G(z))とzの距離を縮める
      • 生成された画像にzが反映されていることを担保する
      1. "スタイル"のDiscriminatorも学習。中間層のfeatureの平均と分散を入力としてDiscriminate

実験・議論

image
論文 Fig. 6 より.上から、提案手法、ランダム回転なし、AdaINなし
  • 当たり前だが、ランダム回転が、正面以外の生成に寄与している
  • zをスタイルとしていれることで、同じ見た目の別向きの画像が安定して生成できている

読んだ中での不明点などの感想

  • disentangle + 事前知識(回転不変であってほしい) はかなり未来のあるテーマに感じる

関連論文

  • Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization
    • AdaINの論文
@sinAshish
Copy link

Is there any implementation available?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants