ユーザーは JAX を最速の Speech-to-Text API としてささやきます

ユーザーは JAX を最速の Speech-to-Text API としてささやきます

ソースノード: 2607028

Mark Zuckerberg は「メタバース」という用語を広めたかもしれませんが、Meta の創設者兼 CEO は、以前のように熱意を持ってユーザーや広告主にメタバースを売り込んでいない可能性があります。 というかそうらしい。 最近、Meta はジェネレーティブ AI に注目しています。

ジェネレーティブ AI は、コンピューターがテキストを生成したり、絵を描いたり、人間の出力に似た他のメディアを作成したりできる一連の機械学習技術です。 現在、Meta はユーザーと広告主を TikTok のような短編動画と AI ツールに夢中にさせようとしています。

最近、カリフォルニアに本拠を置くテクノロジー企業 発表の 人工知能に焦点を当てた新しい製品ユニット、Meta AI の作成。 この部門は、現在の最高製品責任者である Chris Cox が率いており、Meta の複数のチームを統合しています。

また、お読みください。 AI チャットボットの誇大宣伝を追って、大手テック企業が Metaverse を終了

MetaがDinoV2を発表

Meta チームは、さまざまな方法でユーザーを支援できる AI ペルソナを開発していると Zuckerberg は主張しています。 これには、WhatsApp と Messenger での AI チャット エクスペリエンス、Instagram での AI 画像フィルターと広告フォーマット、AI ビデオとマルチモーダル エクスペリエンスのトライアルが含まれます。

昨年、Meta AI は Make-A-Video を導入しました。これは、ユーザーがテキスト プロンプトからビデオを生成できる人工知能システムです。 最近では、DinoV2 や SAM など、いくつかの AI 製品を発売しました。

17 月 2 日にリリースされた DinoV3 は、仮想世界の XNUMXD アセットを迅速に生成できるジェネレーティブ AI モデルです。 によると ブログ投稿、モデルは、画像やビデオなどのデータから、トポロジ、豊富な幾何学的詳細、およびテクスチャを使用して 3 次元 (XNUMXD) 形状を作成できます。

DinoV2 は自己教師あり学習を使用します。これは、モデルが外部のラベル付け支援なしで大量のラベル付けされていないデータから学習できるようにする手法です、と Meta は言います。 このツールは、ビデオ コンテンツの作成者やその他のアプリケーションで非常に役立ちます。

メタは、モデルを共同で使用したと述べました 前方に復元 「大陸のサイズの領域にわたって、森林を木ごとにマッピングする」こと。 DinoV2 は、人、ペット、その他のアイテムなど、ビデオ内のさまざまなオブジェクトを識別して認識することができます。 また、これらのオブジェクトとシーン全体の関係を識別することもできます。

デジタル起業家アバ 記載された このモデルは、「業界レベルのコンピューター ビジョン モデルの実現に向けた画期的な一歩」として Twitter に投稿されました。 自己教師あり学習の使用はゲームチェンジャーであり、テクノロジー業界に波を起こすことは間違いありません。」

農業、医療、その他の産業で DinoV2 を使用することに関心を示した人もいます。 SAM一方、は、画像内から個々のオブジェクトを識別できる新しい AI モデルです。 研究者が使用できる画像注釈のデータセットが付属しています。

メタのメタバースの問題

ここ数か月、新しい AI チャットボットの流行に焦点が移るにつれて、ますます多くの大手テクノロジー企業がメタバースで冷静になっています。

XNUMX月、中国のハイテク大手 テンセントホールディングス 拡張現実 (XR) 部門のスタッフを削減し、仮想現実 (VR) ハードウェアの計画を立て直しました。 Meta と Microsoft はどちらも、メタバース計画を大幅に縮小しました。

VR とメタバースに焦点を当てたビジネスの一部である Meta の Reality Labs 部門は、創業以来損失を出し続けており、昨年は 13.7 億ドル以上の損失を報告しました。 同社は今年、21,000人以上の人員削減に向けて順調に進んでいます。

Microsoft VR メタバース部門の AltspaceVR を 10 月 XNUMX 日に閉鎖し、人気のある拡張現実プロジェクトである HoloLens と Mixed Reality Tool Kit (MRTK) のスタッフ全員を解雇しました。

削減は、OpenAI のブレークアウト ヒットに端を発した AI チャットボットを取り巻く現在の誇大広告と一致しています。 AI言語モデルを活用してコードのデバッグからデータの異常検出まで、. Microsoft は AI 技術への支出を先導しており、Bing 検索用の ChatGPT パワーの取得に数十億ドルが注がれています。

世界的なテクノロジー大手の流出により、メタバースが勢いを失っているのではないかという疑問が生じる中、メタバースの野望を逆説的に強化する可能性のある動きで、メタは AI 開発により積極的になってきました。

DinoV2 のようなジェネレーティブ ツールへの同社の参入は、メタバース (人々が現実の世界と同じように相互にやり取りできる仮想世界) への移行と見なされる可能性があります。 Meta は、DinoV2 を使用して、ユーザーにより没入型のエクスペリエンスを作成し、AI テクノロジで可能なことの境界を押し広げたいと考えています。

AI競争がヒートアップ

企業が自社の製品やサービスに人工知能を組み込むことを競う中、Meta の AI フォーカスは、テクノロジー業界におけるより大きなトレンドの一部です。 たとえば、Adobe は最近、Adobe を含むいくつかの AI ツールを発表しました。 先生.

以前の MetaNews として 報告、Sensei は機械学習を使用してタスクを自動化し、ユーザー エクスペリエンスを向上させます。 Adobe の AI ツールには、ユーザーが自分のプロジェクトに適した画像を見つけるのに役立つ AI を利用したツールである Adob​​e Stock も含まれています。

また、AI を使用してカスタマー エクスペリエンスをパーソナライズする Adob​​e Experience Cloud もあります。 ただし、Adobe には、DinoV2 または SAM に直接匹敵する製品はありません。

ただし、DinoV2 が大量のデータを必要とするという事実は、不正確または矛盾したデータがモデルのパフォーマンスと精度に悪影響を及ぼす可能性があるため、データの精度が AI モデルにとって大きな課題になる可能性があることも意味します。

タイムスタンプ:

より多くの メタニュース