スポンサードコンテンツ
ChatGPT および大規模言語モデル (LLM) に基づく同様のツールは素晴らしいです。しかし、それらは万能のツールではありません。
それは、構築や作成のための他のツールを選択するのと同じです。仕事に適したものを選択する必要があります。ハンマーでボルトを締めたり、泡立て器でハンバーガーのパティをひっくり返したりしようとはしないでしょう。このプロセスは厄介であり、結果として厄介な失敗を引き起こす可能性があります。
LLM のような言語モデルは、生成 AI と予測 AI の両方を含む、より広範な機械学習ツールキットの一部にすぎません。タスクの要件を満たすには、正しいタイプの機械学習モデルを選択することが重要です。
LLM が、ビジネスの最も重要な予測モデリング タスクに取り組むよりも、テキストの下書きやギフトのアイデアのブレインストーミングを支援するのに適している理由をさらに深く掘り下げてみましょう。 LLM よりも前から存在し、ビジネスにおいてその価値が繰り返し証明されてきた「伝統的な」機械学習モデルには依然として重要な役割が残っています。また、これらのツールを一緒に使用するための先駆的なアプローチ、つまり Pecan が呼ぶエキサイティングな開発についても検討します。 予測GenAI.
LLM は数値ではなく単語用に設計されています
機械学習では、さまざまな数学的手法を使用して、いわゆる「トレーニング データ」、つまりデータ アナリストやデータ サイエンティストが解決したい問題を表す初期データセットを分析します。
トレーニング データの重要性は、どれだけ強調してもしすぎることはありません。その中には、後で新しいまだ見たことのないデータが与えられたときに、機械学習モデルが結果を予測するために「学習」するパターンと関係が保持されています。
では、LLM とは具体的に何でしょうか?大規模言語モデル (LLM) は、機械学習の範疇に含まれます。これらは深層学習に由来しており、その構造は自然言語処理用に特別に開発されています。
言葉という土台の上に成り立っていると言えるかもしれません。彼らの目的は単に、一連の単語の中でどの単語が次に来るかを予測することです。たとえば、iOS 17 の iPhone のオートコレクト機能では、LLM を使用して、次に入力する可能性が最も高い単語をより適切に予測できるようになりました。
ここで、あなたが機械学習モデルであると想像してください。 (大げさであることは承知しています。) あなたは単語を予測する訓練を受けてきました。あなたは、あらゆる種類のトピックに関する膨大な情報源から何百万もの単語を読んで研究してきました。メンター (別名開発者) は、単語を予測し、ユーザーの要求に合った新しいテキストを作成するための最良の方法を学ぶのを手伝ってくれました。
しかし、ここにひねりがあります。ユーザーは、数百万行の数値を含む顧客データと取引データの巨大なスプレッドシートを提供し、この既存のデータに関連する数値を予測するように求めます。
あなたの予想はどうなると思いますか?まず、このタスクが、あなたが苦労して学んだ内容と一致しないことにおそらくイライラするでしょう。 (幸いなことに、私たちが知る限り、LLM にはまだ感情がありません。)さらに重要なのは、あなたが学んだことと一致しないタスクを行うように求められているということです。そして、おそらくそれほど良いパフォーマンスはできないでしょう。
トレーニングとタスクの間のギャップは、LLM が、ほとんどの企業が収集する主要なデータ形式である数値表データを含む予測タスクに適していない理由を説明するのに役立ちます。代わりに、このタイプのデータを処理するために特別に作成され、微調整された機械学習モデルの方が効果的です。文字通り、このために訓練されてきました。
LLM の効率と最適化の課題
従来の機械学習手法は、数値データとの適合性が高いことに加えて、LLM よりもはるかに効率的で、パフォーマンス向上のための最適化が容易です。
LLM になりすました経験に戻りましょう。これらすべての単語を読んで、そのスタイルや順序を研究するのは、大変な作業のように思えますよね?これらすべての情報を自分の中に取り込むには多大な労力が必要です。
同様に、LLM の複雑なトレーニングにより、数十億のパラメータを持つモデルが作成される可能性があります。その複雑さにより、これらのモデルは人間の言語の微妙なニュアンスを理解し、応答することができます。ただし、負荷の高いトレーニングには、LLM が応答を生成するときに負荷の高い計算要求が伴います。デシジョン ツリーやニューラル ネットワークなどの数値指向の「従来の」機械学習アルゴリズムでは、必要なコンピューティング リソースがはるかに少なくなる可能性があります。そして、これは「大きいほど良い」というものではありません。たとえ LLM が数値データを処理できたとしても、この違いは、従来の機械学習手法のほうが高速で、効率的で、環境的に持続可能で、コスト効率が高いことを意味します。
さらに、ChatGPT が特定の応答を提供することをどのようにして知ったのかを ChatGPT に尋ねたことがありますか?その答えはおそらく少しあいまいになるでしょう:
ライセンスされたデータ、人間のトレーナーによって作成されたデータ、および公開されているデータの組み合わせに基づいて応答を生成します。私のトレーニングには、人間の言語についての幅広い理解を発展させるために、書籍、ウェブサイト、その他のテキストなどのさまざまなソースから取得した大規模なデータセットも含まれていました。トレーニング プロセスには、数週間または数か月にわたって数千の GPU で計算を実行することが含まれますが、正確な詳細とタイムスケールは OpenAI が独占しています。
その回答に反映されている「知識」のうち、人間のトレーナーから得たもの、公開データから得たもの、書籍から得たものはどれくらいあるでしょうか? ChatGPT 自体でも定かではありません。「これらのソースの相対的な割合は不明であり、どの特定の文書が私のトレーニング セットの一部であったかについては詳細に把握できません。」
ChatGPT があなたの質問に対して自信を持って答えてくれるものの、特定のソースへの応答を追跡できないのは少し不安です。 LLM の解釈可能性と説明可能性が限られているため、特定のビジネス ニーズに合わせて LLM を最適化する際にも課題が生じます。彼らの情報や予測の背後にある理論的根拠を理解するのは難しい場合があります。さらに状況を複雑にしているのは、一部の企業はモデルの予測に影響を与える要因を説明できなければならないという規制上の要求と格闘していることです。全体として、これらの課題は、従来の機械学習モデル (一般に解釈しやすく説明しやすい) がビジネス ユースケースにより適している可能性があることを示しています。
企業の予測ツールキットにおける LLM の適切な場所
では、LLM を単語関連のタスクに任せて、予測ユースケースについては忘れるべきでしょうか?結局のところ、彼らは顧客離れや顧客生涯価値の予測を支援できないように思えるかもしれません。
問題は次のとおりです。「従来の機械学習モデル」と言うと、これらの手法が広く理解され、使いやすく聞こえるように聞こえますが、Pecan での経験から、これらのより馴染みのある形式の AI ですら、企業が導入するのに依然として大部分が苦労していることがわかっています。
Workday による最近の調査では、北米の企業の 42% が AI の使用を開始していないか、選択肢を検討する初期段階にあることが明らかになりました。そして、機械学習ツールが企業にとってよりアクセスしやすくなってから XNUMX 年以上が経過しました。彼らには時間があり、さまざまなツールが利用可能です。
データ サイエンスと AI に関する大規模な話題にもかかわらず、何らかの理由で AI の導入が成功することは驚くほど稀であり、ビジネスに大きな影響を与える可能性が認められています。 AI による約束とそれを生産的に実装する能力との間のギャップを埋めるのに役立つ重要なメカニズムがいくつか欠けています。
そしてまさにそこにおいて、LLM が重要な橋渡しの役割を果たすことができると私たちは信じています。 LLM は、ビジネス ユーザーが解決すべきビジネス上の問題の特定と予測モデルの開発の間の溝を越えるのに役立ちます。
LLM が注目されるようになったことで、機械学習モデルをハンドコーディングする能力や能力を持たないビジネス チームやデータ チームも、ニーズをより適切にモデルに変換できるようになりました。親がよく言うように、子どもたちは「自分の言葉を使う」ことで、モデル化のプロセスをスタートさせることができます。
ビジネス データを活用するために構築された機械学習技術と LLM を融合する
その機能が Pecan の Predictive GenAI に導入されました。これは、LLM の長所と、すでに高度に洗練され自動化された機械学習プラットフォームを融合させています。 LLM を利用した予測チャットは、ビジネス ユーザーからの入力を収集して、予測質問 (ユーザーがモデルを使用して解決したい特定の問題) の定義と開発をガイドします。
次に、GenAI を使用して、当社のプラットフォームは予測ノートブックを生成し、モデリングへの次のステップをさらに容易にします。繰り返しますが、LLM 機能を利用して、ノートブックには、予測モデルのトレーニング データを選択するための事前入力された SQL クエリが含まれています。 Pecan の自動化されたデータ準備、特徴量エンジニアリング、モデル構築、展開機能は、残りのプロセスを記録的な速さで実行でき、他の予測モデリング ソリューションよりも速く実行できます。
つまり、Pecan の Predictive GenAI は、LLM の比類のない言語スキルを使用して、クラス最高の予測モデリング プラットフォームをビジネス ユーザーにとってはるかにアクセスしやすく、使いやすいものにしています。私たちは、このアプローチがより多くの企業が AI でどのように成功するのに役立つかを見ることに興奮しています。
したがって、LLM が 一人で すべての予測ニーズを処理するのには適していませんが、AI プロジェクトを前進させる上で強力な役割を果たすことができます。 Pecan の Predictive GenAI は、ユースケースを解釈し、自動生成された SQL コードで有利なスタートを切ることで、これらのテクノロジーの統合において先導しています。あなたはできる 無料トライアルで今すぐチェックしてください.
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.kdnuggets.com/2024/01/pecan-llms-used-alone-cant-address-companys-predictive-needs?utm_source=rss&utm_medium=rss&utm_campaign=why-llms-used-alone-cant-address-your-companys-predictive-needs
- :持っている
- :は
- :not
- :どこ
- 視聴者の38%が
- 17
- a
- 能力
- できる
- 私たちについて
- アクセス可能な
- 認め
- 添加
- 住所
- 採用
- 後
- 再び
- AI
- 別名
- アルゴリズム
- 整列する
- すべて
- ことができます
- 一人で
- 既に
- また
- 驚くべき
- アメリカ
- an
- アナリスト
- 分析します
- および
- 回答
- 回答
- どれか
- アプローチ
- です
- 周りに
- 到着
- AS
- アシスト
- At
- 自動化
- 自動機械学習
- 自動的に
- 利用できます
- バック
- ベース
- BE
- くま
- になりました
- き
- 開始
- 背後に
- さ
- 信じる
- BEST
- より良いです
- の間に
- 億
- ビット
- ボルト
- 本
- 両言語で
- ブレインストーム
- BRIDGE
- ブリッジ
- より広い
- 建物
- 内蔵
- ビジネス
- ビジネスへの影響
- ビジネス
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- コール
- 来ました
- 缶
- 機能
- 機能
- 容量
- キャリー
- 場合
- 例
- 一定
- 課題
- 割れ目
- チャット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- 選択する
- コード
- 収集する
- 来ます
- 企業
- 会社の
- 複雑な
- 複雑さ
- 計算的
- 計算
- コンピューティング
- 確信して
- 構成します
- 含まれています
- 正しい
- コスト効率の良い
- 可能性
- 細工された
- 作ります
- 作成した
- 作成
- 重大な
- Cross
- 重大な
- 顧客
- データ
- データアナリスト
- データの準備
- データサイエンス
- データサイエンティスト
- データセット
- 十年
- 決定
- 深いです
- 深い学習
- より深い
- 定義
- 需要
- 展開
- 設計
- にもかかわらず
- 詳細な
- 細部
- 開発する
- 発展した
- 開発者
- 開発
- 開発
- 違い
- 異なります
- DIG
- do
- ドキュメント
- そうではありません
- ドン
- ドント
- ドラフト
- 描画
- 早い
- 容易
- 簡単に
- 効果的な
- 効率
- 効率的な
- 努力
- どちら
- 包含する
- エンジニアリング
- 環境的に
- エーテル(ETH)
- さらに
- EVER
- 例
- Excel
- 興奮した
- エキサイティング
- 既存の
- 体験
- 説明する
- 説明可能
- 探る
- 探る
- 要因
- 不良解析
- 秋
- おなじみの
- 遠く
- 速いです
- 特徴
- 感情
- より少ない
- 名
- フィット
- フィット
- フリップ
- 形式でアーカイブしたプロジェクトを保存します.
- フォーム
- 幸いにも
- フォワード
- Foundation
- 無料版
- 優しい
- から
- さらに
- 融合
- ギャップ
- ゲンナイ
- 一般に
- 生成する
- 生成された
- 生成
- 生々しい
- 生成AI
- ギフト
- 与えられた
- 与える
- 与え
- Go
- 目標
- GPU
- ガイド
- 持っていました
- ハンマー
- ハンドル
- ハンドリング
- ハード
- 持ってる
- 避難所
- 頑丈な
- 助けます
- 助けました
- 助け
- ことができます
- 非常に
- 保持している
- 期待している
- 認定条件
- しかしながら
- HTTPS
- 人間
- i
- 考え
- 識別
- if
- 絵
- 影響
- 実装する
- 実装
- 重要
- 重要なこと
- in
- 含めて
- 影響する
- 情報
- 初期
- 開始
- を取得する必要がある者
- 予定
- に
- 関係する
- 関与
- 関与
- iOS
- IT
- ITS
- 自体
- ジョブ
- ただ
- KDナゲット
- 知っている
- 既知の
- 言語
- 大
- 大規模
- 主として
- 後で
- 主要な
- LEARN
- 学んだ
- 学習
- コメントを残す
- ライセンス供与
- 一生
- ような
- 可能性が高い
- 限定的
- たくさん
- 機械
- 機械学習
- 機械学習テクニック
- 製
- make
- 作る
- 多くの
- 大規模な
- 一致
- 数学的
- 意味する
- メカニズム
- メンター
- メソッド
- かもしれない
- 何百万
- 行方不明
- 混合
- モデリング
- モデル
- ヶ月
- 他には?
- もっと効率的
- 最も
- 移動する
- ずっと
- しなければなりません
- my
- ナチュラル
- 自然言語
- 自然言語処理
- 必要
- ニーズ
- ネットワーク
- ニューラル
- ニューラルネットワーク
- 新作
- 次の
- ノース
- 北米
- ノート
- 今
- ニュアンス
- 番号
- 得
- of
- on
- ONE
- の
- OpenAI
- 最適化
- 最適化
- 最適化
- オプション
- or
- その他
- 私たちの
- でる
- 成果
- が
- 誇張した
- パラメータ
- 両親
- 部
- 特定の
- パターン
- 実行する
- パフォーマンス
- 選ぶ
- 画像
- 先駆者
- 場所
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- 潜在的な
- 強力な
- 正確に
- 予測する
- 予測
- 予測
- 予測的
- 準備
- 主要な
- 多分
- 問題
- プロセス
- 処理
- プロジェクト(実績作品)
- 約束
- 所有権
- 実績のある
- 提供します
- 公共
- 公然と
- クエリ
- 質問
- 質問
- 範囲
- 珍しい
- 根拠
- 読む
- リーディング
- 理由
- 記録
- 洗練された
- 反映
- レギュレータ
- 関連する
- の関係
- 相対
- 繰り返し
- 表します
- 要求
- 要件
- 研究
- リソース
- 反応します
- 応答
- 回答
- REST
- 結果
- 結果として
- 明らかに
- 右
- 職種
- ランニング
- s
- 言う
- 格言
- 科学
- 科学者
- 思われる
- select
- 選択
- シーケンス
- セッションに
- ショート
- すべき
- 表示する
- 意義
- 重要
- 同様の
- 単に
- から
- スキル
- So
- 溶液
- 解決する
- 一部
- 音
- 音
- ソース
- 特定の
- 特に
- スプレッドシート
- SQL
- ステージ
- start
- 開始
- 手順
- まだ
- 強み
- 構造
- 苦労して
- 研究
- 勉強
- 成功する
- 成功した
- そのような
- 確か
- 持続可能な
- T
- タックル
- 取る
- 仕事
- タスク
- チーム
- テクニック
- テクノロジー
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- アプリ環境に合わせて
- それら
- ボーマン
- 彼ら
- もの
- 物事
- 考える
- この
- それらの
- 数千
- 締め付ける
- 時間
- 〜へ
- 一緒に
- トン
- ツールキット
- 豊富なツール群
- トピック
- に向かって
- トレース
- 伝統的な
- 訓練された
- トレーニング
- トランザクション
- 翻訳する
- 樹木類
- 試します
- 順番
- ツイスト
- type
- 傘
- 下
- わかる
- 理解する
- 理解された
- 団結
- 未知の
- 圧倒的な
- us
- つかいます
- 使用事例
- 中古
- ユーザー
- users
- 使用されます
- 値
- 多様
- さまざまな
- 広大な
- 視認性
- 極めて重要な
- vs
- 望んでいる
- 仕方..
- 方法
- we
- ウェブサイト
- ウィークス
- WELL
- した
- この試験は
- 何ですか
- いつ
- which
- while
- なぜ
- 広く
- 意志
- 以内
- Word
- 言葉
- 仕事
- 働いていました
- 価値
- でしょう
- まだ
- 貴社
- あなたの
- ゼファーネット