AI4Bharat が高度なヒンディー語言語モデルである Airavata を導入

AI4Bharat が高度なヒンディー語言語モデルである Airavata を導入

ソースノード: 3084980

IIT マドラスに関連する AI 研究ラボである AI4Bharat は、ヒンディー語向けに調整された命令モデルである Airavata を最近立ち上げました。このモデルは、Sarvam AI の微調整から派生したものです。 オープンハシは、多様な命令調整ヒンディー語データセットを組み込むことで、支援タスクのパフォーマンスを向上させることを目的としています。

AI4Bharat が高度なヒンディー語言語モデルである Airavata を導入

アイラーヴァタの開発アプローチ

AI4Bharat は、アイラーヴァタの開発に対する持続可能なアプローチを重視しています。モデルの開発には、GPT-4 などの商用モデルから生成されたデータを避けて、人間が厳選し、ライセンスに優しい命令に調整されたデータセットが含まれます。このアプローチにより、費用対効果が保証され、ライセンス制限がないため、ダウンストリーム アプリケーションでの無制限の使用が容易になります。

また読む: インドの AI リープ 🇮🇳 : インドで構築された 6 つの LLM

ヒンディー語の言語の課題に取り組む

インド言語向けの高度なオープンソース機械翻訳モデルである IndicTrans2 を活用して、チームは、適切に構築された英語教師付き命令チューニング データセットをヒンディー語に翻訳します。この手法は、インド言語モデルの進歩を促進するという AI4Bharat の取り組みに沿って、ヒンディー語のデータ不足という課題に取り組みます。

アイラーヴァタの包括的リリース

AI4Bharat は、Airavata を導入しただけでなく、モデルの命令調整データセットも共有しました。このステップにより、インド言語モデル領域の革新が促進され、研究者や開発者がヒンディー語言語モデルの進化に貢献できるようになります。

アイラバタ

より大きなコンテキスト

AI4Bharat によるこのリリースは、世界中で大規模な言語モデルへの関心が高まっているときに行われました。最近は英語中心のモデルに重点が置かれており、インド言語のサポートにはギャップが残っています。 OpenHathi を立ち上げるための Sarvam AI との協力によって基礎が築かれ、現在、AI4Bharat は Airavata と協力して、 言語モデル ヒンディー語のニーズ。

今後

AI4Bharat が AI 研究の限界を押し広げ続ける中、Airavata はイノベーションと持続可能性に対する同研究所の取り組みの証となります。自然言語理解 (NLU) タスクにおけるモデルのパフォーマンスは注目に値し、さまざまなドメインでのより広範なアプリケーションの可能性を示しています。

また読む: 安定性 LM 2 1.6B 言語モデルによる安定性 AI の小さいながらも大きな飛躍

私たちの言う

Airavata の発売は AI4Bharat にとってマイルストーンであり、インド言語モデルの進歩への道を切り開きます。これは、より包括的な言語モデルへの世界的な移行と一致しており、英語中心のアプローチを超えた包括的なソリューションを強調しています。 Airavata のヒンディー語言語処理への影響は、AI 言語モデルのより広範な状況におけるさらなる進歩をもたらす可能性があります。

フォローをお願いします グーグルニュース AI、データサイエンス、その他の世界の最新のイノベーションを常に最新の状態に保つため ゲンアイ.

タイムスタンプ:

より多くの 分析Vidhya