IIT マドラスに関連する AI 研究ラボである AI4Bharat は、ヒンディー語向けに調整された命令モデルである Airavata を最近立ち上げました。このモデルは、Sarvam AI の微調整から派生したものです。 オープンハシは、多様な命令調整ヒンディー語データセットを組み込むことで、支援タスクのパフォーマンスを向上させることを目的としています。
アイラーヴァタの開発アプローチ
AI4Bharat は、アイラーヴァタの開発に対する持続可能なアプローチを重視しています。モデルの開発には、GPT-4 などの商用モデルから生成されたデータを避けて、人間が厳選し、ライセンスに優しい命令に調整されたデータセットが含まれます。このアプローチにより、費用対効果が保証され、ライセンス制限がないため、ダウンストリーム アプリケーションでの無制限の使用が容易になります。
また読む: インドの AI リープ 🇮🇳 : インドで構築された 6 つの LLM
ヒンディー語の言語の課題に取り組む
インド言語向けの高度なオープンソース機械翻訳モデルである IndicTrans2 を活用して、チームは、適切に構築された英語教師付き命令チューニング データセットをヒンディー語に翻訳します。この手法は、インド言語モデルの進歩を促進するという AI4Bharat の取り組みに沿って、ヒンディー語のデータ不足という課題に取り組みます。
アイラーヴァタの包括的リリース
AI4Bharat は、Airavata を導入しただけでなく、モデルの命令調整データセットも共有しました。このステップにより、インド言語モデル領域の革新が促進され、研究者や開発者がヒンディー語言語モデルの進化に貢献できるようになります。
より大きなコンテキスト
AI4Bharat によるこのリリースは、世界中で大規模な言語モデルへの関心が高まっているときに行われました。最近は英語中心のモデルに重点が置かれており、インド言語のサポートにはギャップが残っています。 OpenHathi を立ち上げるための Sarvam AI との協力によって基礎が築かれ、現在、AI4Bharat は Airavata と協力して、 言語モデル ヒンディー語のニーズ。
今後
AI4Bharat が AI 研究の限界を押し広げ続ける中、Airavata はイノベーションと持続可能性に対する同研究所の取り組みの証となります。自然言語理解 (NLU) タスクにおけるモデルのパフォーマンスは注目に値し、さまざまなドメインでのより広範なアプリケーションの可能性を示しています。
また読む: 安定性 LM 2 1.6B 言語モデルによる安定性 AI の小さいながらも大きな飛躍
私たちの言う
Airavata の発売は AI4Bharat にとってマイルストーンであり、インド言語モデルの進歩への道を切り開きます。これは、より包括的な言語モデルへの世界的な移行と一致しており、英語中心のアプローチを超えた包括的なソリューションを強調しています。 Airavata のヒンディー語言語処理への影響は、AI 言語モデルのより広範な状況におけるさらなる進歩をもたらす可能性があります。
フォローをお願いします グーグルニュース AI、データサイエンス、その他の世界の最新のイノベーションを常に最新の状態に保つため ゲンアイ.
関連記事
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.analyticsvidhya.com/blog/2024/01/ai4bharat-introduces-airavata-an-advanced-hindi-language-model/
- :持っている
- :は
- :not
- 1
- a
- アドレッシング
- 高度な
- 進歩
- AI
- 愛の研究
- 目指して
- 整列
- 整列
- また
- an
- および
- アプローチ
- アプローチ
- です
- AS
- 関連する
- At
- き
- 越えて
- 境界
- より広い
- 内蔵
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- 挑戦する
- クリア
- 環境、テクノロジーを推奨
- comes
- コマーシャル
- コミットメント
- 包括的な
- 続ける
- 貢献する
- 可能性
- データ
- データサイエンス
- データセット
- 派生
- 開発者
- 開発
- 開発
- 異なる
- ドメイン
- ドメイン
- 原因
- 強調
- 強調
- 有効にする
- 励ます
- 高めます
- 確実に
- 進化
- 促進する
- フォーカス
- フォワード
- 助長
- Foundation
- から
- さらに
- ギャップ
- 生成された
- グローバル
- でログイン
- 成長
- 関心の高まり
- ハイ
- ヒンディー語
- HTTPS
- 影響
- in
- 包括的
- インディアン
- 示します
- 革新的手法
- イノベーション
- 関心
- に
- 導入
- 紹介します
- 関与
- IT
- ラボ
- 風景
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 大
- より大きい
- 最新の
- 起動する
- 打ち上げ
- 跳躍
- 残す
- ライセンシング
- ような
- 機械
- 機械翻訳
- 最大幅
- 方法
- 強大な
- マイルストーン
- モデル
- 他には?
- ナチュラル
- 自然言語
- 自然言語理解
- ヌル
- 注目に値する
- 今
- of
- on
- の
- オープンソース
- 舗装
- パフォーマンス
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 潜在的な
- 処理
- プッシュ
- 読む
- 最近
- 最近
- リリース
- 研究
- 研究者
- 制限
- 希少性
- 科学
- shared
- シフト
- 重要
- 小さい
- ソリューション
- 安定した
- スタンド
- 滞在
- 操舵
- 手順
- サポート
- 持続可能性
- 持続可能な
- SVG
- タックル
- テーラード
- 取得
- タスク
- チーム
- 遺言
- それ
- 世界
- そこ。
- この
- 介して
- 時間
- 〜へ
- に向かって
- インタビュー
- 理解する
- 更新しました
- us
- 使用法
- さまざまな
- 仕方..
- いつ
- 世界
- ゼファーネット