Root NationニュースITニュース映画のように: Google の新しい写真処理 AI により、スケーリングと拡張が実現します

映画のように: Google の新しい写真処理 AI により、スケーリングと拡張が実現します

-

ファンタジー映画やテレビ番組で、主人公が顔やナンバー プレート、その他の重要な詳細を表示するために、画像を拡大して結果を改善するように要求するのを見たことがあるでしょう。 Google の最新の人工知能 (AI) システムは、いわゆる 拡散モデル、このトリックを実行できます。

他の同様の画像に基づいた超スマートな推測を使用して、カメラが最初にキャプチャしなかった画像に本質的に詳細を追加するため、マスターするのは難しいプロセスです.

でログイン

Google では、この手法を自然画像合成と呼び、この特定のシナリオでは超高解像度画像と呼んでいます。 小さなピクセル化された写真から始めて、シャープでクリアで自然な写真に仕上げます。 正確にはオリジナルではないかもしれませんが、人間の目には十分にリアルに見えます。

Google は、この仕事のために 3 つの新しい AI ツールを導入しました。 3 つ目は SR、または反復リファインメントによる超解像度と呼ばれ、画像にノイズを追加してから削除することで機能します。 画像の大規模なデータベースといくつかの機械学習マジックに基づく一連の確率計算を通じて、SR は低解像度ピクセル画像の超高解像度バージョンがどのように見えるかを想像できます。

3 番目のツールは、CDM、またはカスケード拡散モデルです。 Google は、これらを「パイプライン」として説明しており、SR を含む拡散モデルを高品質の画像アップスケーリングに向けることができます。 改善モデルを取得し、それらをより大きな画像にします。

でログイン

Google によると、異なる解像度で異なる拡張モデルを使用することにより、CDM アプローチは代替の画像アップスケーリング方法よりも優れた性能を発揮することができます。 新しい AI エンジンは、視覚オブジェクト認識の研究に一般的に使用されるトレーニング画像の巨大なデータベースである ImageNet でテストされました。

SR3 と CDM の最終結果は印象的です。 50 人の人間のボランティアによる標準的なテストでは、SR3 によって生成された人間の顔の画像は、約 50% の確率で本物の写真と間違えられました。 これらの強化された画像は、元の画像と完全に一致するものではなく、確率の数学に基づいて慎重に計算されたシミュレーションであることを繰り返す価値があります。

でログイン

Google は、顔やその他の自然物の画像を増強するという点だけでなく、確率的モデリングの他の分野においても、新しい AI エンジンと関連技術からさらに多くのことを約束します。

また読む:

サインアップ
について通知する
ゲスト

0 コメント
埋め込まれたレビュー
すべてのコメントを表示