ジェネレーティブ AI は電話市場を充電できるか? - セミウィキ

ジェネレーティブ AI は電話市場を充電できるか? – セミウィキ

ソースノード: 2926005

スマートフォン市場に関するコンセンサスは、わずかな減少とわずかな成長の間で推移しており、より力強い成長をもたらす明らかな推進力が欠如していることを示しています。 ビジネスチャンスとしては、この魅力のない状態は、膨大な量(ある情報源によると500年に2023億ドル)によってある程度相殺されますが、中国以外ではすでに普及のピークに近づいているため、携帯電話メーカーにとっての本当の質問は「次のキラーは何か」ということになるはずです。針を動かすことができるアプリはありますか?

ジェネレーティブ AI は電話市場を充電できるか

私たち消費者は気まぐれなところが多く、エンターテインメントは必需品リストの上位にランクされているようです。 アームは モバイルゲームに賭ける。 別の可能性としては、画像の作成/操作のための生成 AI が考えられます。 クアルコム すでに電話ベースの機能を実証済み 一方、Apple を含む他の企業は依然として大規模な言語モデルのアプリに焦点を当てています。 私にとって、生成 AI が本格化する場合にもう少し知識を得るために、生成 AI の画像の側面を詳しく調べる価値はあります。 楽しみのために、ここでは Microsoft Bing の Image Creator を使用して画像を生成しました。

拡散による発電

LLM と比較しながら概念を説明してみます。 LLM はテキスト シーケンス (必然的に線形) でトレーニングします。 たくさんあります。 そして、彼らはトークン化されたテキストに取り組み、特定のトークンのシーケンスを見たときに、そのシーケンスに一般的に何が続くかを学習します。 テキストには最適ですが、2D で一般的にトークン化できない画像には適していないため、トレーニングのアプローチは異なる必要があります。 拡散ベースのトレーニングでは、最初のノイズがトレーニング画像に徐々に追加され (順拡散)、変更された画像のノイズを除去して各元の画像を復元することでネットワークがトレーニングされます (逆拡散)。 面倒に聞こえますが、明らかにノイズ除去方法 (確率微分方程式を解く) は明確に定義されており、堅牢です。 一例として、安定拡散モデルが公開されています。

その後、ランダム ノイズ画像から始めて、このトレーニングされたネットワークから新しい画像を生成することが可能になります。 次に、どのような画像を生成するかをガイドするメソッドが必要です。 Dall.E-2、Midjourney、および Stable Diffusion はすべてテキスト プロンプトを受け取ることができます。 これらは、トレーニング画像とともに提供されるテキスト ラベルから取得したトレーニングに依存します。 推論には、最終画像を推論するパスの注意プロセスにプロンプ​​ト情報が含まれます。 LLM と同様に、これらのシステムもトランスフォーマーを使用するため、この機能をサポートするには新しいハードウェアが必要になります。

生成は、イメージを最初から作成することに限定されません。 と呼ばれるテクニック 修復 画像の一部を改善したり置き換えたりするために使用できます。 これは、スマートフォンですでに普及している画像編集の AI ベースのバージョンと考えてください。 基本的な色、ライトバランス、フォトボムの切り抜きなどだけでなく、より困難な問題を解決したり、コスプレ衣装で自分自身を再ドラフトしたりするなど、何でもできます。 今ではとても人気があることがわかります。

生成 AI は針を動かすでしょうか?

私にはわかりません – 気まぐれな消費者に関する上記のコメントを参照してください。 繰り返しになりますが、視覚的な刺激、特に自分自身の周りでの遊びは、ほぼすべての人にアピールします。 携帯電話でこれができるなら、なぜやらないのでしょうか? AI は急速に変化する分野であり、大きな賭けを奨励しているように見えます。 私はこの可能性に賭けたくはありません。

また、ジェネレーティブ イメージングは​​、特に医療分野において、ノイズの多い CAT スキャンを修復したり、骨の構造によってブロックされている可能性のある詳細を回復したりするために使用できるなど、すでにより深刻な用途に使用されていることにも言及しておく必要があります。 このテクノロジーがフォレンジックツールキットに組み込まれることさえ想像できます。 私たちは皆、テレビ番組で、アビーやアンジェラが、目に見えるものから訓練されたデータを推定することによって、写真の欠けている詳細を埋めるのを見たことがあるでしょう。 ジェネレーティブ イメージングならそれが可能になるかもしれません。

この投稿を共有する:

タイムスタンプ:

より多くの セミウィキ