グーグルのクラウドを支えるテクノロジー > 第27回 スケッチデータを用いたディープラーニングモデル Sketch-RNN(パート2

※この記事は読者によって投稿されたユーザー投稿です:
  • 編集部の見解や意向と異なる内容の場合があります
  • 編集部は内容について正確性を保証できません
  • 画像が表示されない場合、編集部では対応できません
  • 内容の追加・修正も編集部では対応できません

CTC教育サービスはコラム「 グーグルのクラウドを支えるテクノロジー > 第27回 スケッチデータを用いたディープラーニングモデル Sketch-RNN(パート2」を公開しました。

はじめに
 前回に続いて、2017年に公開された論文「A Neural Representation of Sketch Drawings」をもとにして、ディープラーニングを用いて簡単なスケッチ(線画)を再現する機械学習モデルを解説します。前回説明したように、入力データに対して類似性のあるデータを出力する「オートエンコーダー」とよばれる仕組みが基礎となります。

Sketch-RNNの構造
 図1は、前回紹介したSketch-RNNと呼ばれる機械学習モデルの全体像です。左側の青色の部分が、前回の図3における「エンコーダー」に相当する部分で、入力データから特徴量を抽出する処理を行います。最終的に得られる特徴量は、128次元(具体的な次元数はモデルによって異なります)のベクトル値、すなわち、128個の数値の集まりですが、このモデルでは、ここに乱数の要素を取り入れています。どういうことかと言うと、入力データから直接に特徴量を計算するのではなく、まずはじめに、特徴量空間における「平均 μ」と「標準偏差 σ」を計算します。その後、これらを用いた正規分布の乱数(μ を中心として、σ 程度の広がりを持つ乱数)を生成して、これを特徴量とします。σ の値が大きいほど、生成される特徴量の「ゆらぎ」が大きくなります。また、入力データから μ と σ を計算する部分には、時系列データを取り扱う「RNN(Recurrent Neural Network)」を使用しています。つまり、線画を描く順序も考慮したデータ処理が行われます。

この続きは以下をご覧ください
https://www.school.ctc-g.co.jp/columns/nakai2/nakai227.html

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

今日の用語

ロイヤルティ
英語で、忠誠、忠実を意味し、長期の良好な顧客体験に基づいて、ユーザーが特定のブラ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]