GPT4All はドキュメント用のローカル ChatGPT で、無料です。 - KDnuggets

プラトン再発行

フォロワー： 0

この記事では、学習します CPU のみのコンピューターに GPT4All モデルを展開して使用する方法 (私が使用しているのは のMacBook Pro GPUなしで!)

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
コンピューターで GPT4All を使用する — 写真提供: 著者

この記事では、ローカルコンピューターに GPT4All (強力な LLM) をインストールし、Python でドキュメントを操作する方法を説明します。 PDF またはオンライン記事のコレクションが、質問と回答のナレッジベースになります。

ノーザンダイバー社の公式ウェブサイト GPT4All それは次のように説明されています 無料で使用でき、ローカルで実行され、プライバシーを意識したチャットボットです。 GPU やインターネットは必要ありません。

GTP4All はトレーニングとデプロイのためのエコシステムです 強力な および カスタマイズ 実行される大規模な言語モデル 局部的に コンシューマーグレードの CPU で。

当社の GPT4All モデルは 4GB ファイルで、ダウンロードして GPT4All オープンソースエコシステムソフトウェアにプラグインできます。 ノミックAI 高品質で安全なソフトウェアエコシステムを促進し、個人や組織が独自の大規模な言語モデルをローカルで簡単にトレーニングして実装できるようにする取り組みを推進します。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
GPT4All を使用した QnA のワークフロー — 著者が作成

このプロセスは (わかっていれば) 非常に簡単で、他のモデルでも繰り返すことができます。手順は次のとおりです。

GPT4All モデルをロードします
つかいます ラングチェーン ドキュメントを取得してロードするため
埋め込みによって消化できる小さなチャンクにドキュメントを分割する
FAISS を使用して、埋め込みを含むベクトルデータベースを作成します。
GPT4All に渡したい質問に基づいて、ベクトルデータベースで類似性検索 (セマンティック検索) を実行します。これは、 コンテキスト 私たちの質問に対して
質問とコンテキストを GPT4All にフィードします。 ラングチェーン そして答えを待ちます。

したがって、必要なのは埋め込みです。埋め込みとは、テキスト、ドキュメント、画像、音声などの情報を数値的に表現したものです。この表現は、埋め込まれているものの意味論的な意味を捉えており、これがまさに必要なものです。このプロジェクトでは、重い GPU モデルに依存することはできません。そのため、Alpaca ネイティブモデルをダウンロードして、から使用します。 ラングチェーン 　 ラマCpp埋め込み。心配しないで！すべてが段階的に説明されています

仮想環境を作成する

新しい Python プロジェクト用の新しいフォルダーを作成します (例: GPT4ALL_Fabio) (名前を入力してください)。

mkdir GPT4ALL_Fabio
cd GPT4ALL_Fabio

次に、新しい Python 仮想環境を作成します。複数の Python バージョンがインストールされている場合は、希望のバージョンを指定します。この場合、Python 3.10 に関連付けられたメインのインストールを使用します。

python3 -m venv .venv

コマンド python3 -m venv .venv という名前の新しい仮想環境を作成します .venv (ドットは venv という隠しディレクトリを作成します)。

仮想環境では、分離された Python インストールが提供されます。これにより、システム全体の Python インストールや他のプロジェクトに影響を与えることなく、特定のプロジェクトのみにパッケージと依存関係をインストールできます。この分離により、一貫性が維持され、異なるプロジェクト要件間の潜在的な競合を防ぐことができます。

仮想環境が作成されたら、次のコマンドを使用してアクティブ化できます。

source .venv/bin/activate

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
アクティブ化された仮想環境

インストールするライブラリ

私たちが構築しているプロジェクトでは、それほど多くのパッケージは必要ありません。必要なのは以下だけです:

GPT4All の Python バインディング
ドキュメントを操作するための Langchain

LangChain は、言語モデルを利用してアプリケーションを開発するためのフレームワークです。これにより、API 経由で言語モデルを呼び出すだけでなく、言語モデルを他のデータソースに接続し、言語モデルがその環境と対話できるようになります。

pip install pygpt4all==1.0.1
pip install pyllamacpp==1.0.6
pip install langchain==0.0.149
pip install unstructured==0.6.5
pip install pdf2image==1.16.3
pip install pytesseract==0.3.10
pip install pypdf==3.8.1
pip install faiss-cpu==1.7.4

LangChain については、バージョンも指定していることがわかります。このライブラリは最近多くの更新を受け取っているため、セットアップが明日も確実に動作するようにするには、正常に動作することがわかっているバージョンを指定することをお勧めします。非構造化は PDF ローダーに必要な依存関係であり、 ピテセラクト および pdf2画像 同様に。

注意: GitHub リポジトリには、requirements.txt ファイルがあります (推奨: JL ACR) このプロジェクトに関連付けられたすべてのバージョン。次のコマンドを使用してメインプロジェクトファイルディレクトリにダウンロードした後、インストールを XNUMX 回で実行できます。

pip install -r requirements.txt

記事の最後に作成したのは、トラブルシューティングのセクション。 GitHub リポジトリには、これらすべての情報が記載された更新された READ.ME もあります。

一部のことに留意してください ライブラリにはPythonのバージョンに応じて利用可能なバージョンがあります 仮想環境上で実行されています。

モデルを PC にダウンロードする

これは本当に重要なステップです。

このプロジェクトには GPT4All が必ず必要です。 Nomic AI で説明されているプロセスは非常に複雑で、(私のように) 誰もが持っているわけではないハードウェアが必要です。それでここにモデルへのリンクがありますすでに変換されており、すぐに使用できます。ダウンロードをクリックするだけです。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
GPT4All モデルをダウンロードする

冒頭で簡単に説明したように、埋め込み用のモデル、つまりクラッシュせずに CPU 上で実行できるモデルも必要です。クリック alpaca-native-7B-ggml をダウンロードするにはここにリンクしてくださいすでに 4 ビットに変換されており、埋め込みのモデルとして使用する準備ができています。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
の横にあるダウンロード矢印をクリックします ggml-model-q4_0.bin

なぜ埋め込みが必要なのでしょうか? フロー図を覚えていると思いますが、ナレッジベースのドキュメントを収集した後、必要な最初のステップは次のとおりです。 埋め込みます 彼ら。この Alpaca モデルの LLamaCPP 埋め込みは、このジョブに完全に適合しており、このモデルも非常に小さい (4 Gb) です。ちなみに、QnA にアルパカモデルを使用することもできます。

更新 2023.05.25: Mani Windows ユーザーは、llamaCPP 埋め込みを使用する際に問題に直面しています。これは主に、次のような Python パッケージ llama-cpp-python のインストール中に発生します。

pip install llama-cpp-python

pip パッケージはライブラリのソースからコンパイルされます。通常、Windows にはデフォルトで CMake または C コンパイラがインストールされていません。でも心配しないでください、解決策はあります

Windows 上で llamaEmbeddings を使用した LangChain に必要な llama-cpp-python のインストールを実行する CMake C コンパイラはデフォルトではインストールされないため、ソースからビルドすることはできません。

Xtools を使用する Mac ユーザーと Linux では、通常、C コンパイラは OS ですでに利用可能です。

問題を回避するには 事前にコンパイルされたホイールを使用する必要があります.

ここに行きます https://github.com/abetlen/llama-cpp-python/releases

そして、あなたのアーキテクチャとPythonのバージョンに準拠したホイールを探してください。 Weels バージョン 0.1.49 を取得する必要があります それより上位のバージョンには互換性がないためです。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
スクリーンショット https://github.com/abetlen/llama-cpp-python/releases

私の場合、Windows 10、64ビット、Python 3.10を使用しています。

したがって、私のファイルは llama_cpp_python-0.1.49-cp310-cp310-win_amd64.whl です

この問題は GitHub リポジトリで追跡されています

ダウンロード後、以下に示すように、XNUMX つのモデルを models ディレクトリに配置する必要があります。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
ディレクトリ構造とモデルファイルの配置場所

GPT モデルで対話を制御したいので、Python ファイル (これを Python ファイルと呼びます) を作成する必要があります。 pygpt4all_test.py)、依存関係をインポートし、モデルに指示を与えます。それは非常に簡単であることがわかります。

from pygpt4all.models.gpt4all import GPT4All

これはモデルの Python バインディングです。これで、それを呼び出して質問を開始できます。創造的なものを試してみましょう。

モデルからコールバックを読み取る関数を作成し、GPT4All に文を完成させるよう依頼します。

def new_text_callback(text): print(text, end="") model = GPT4All('./models/gpt4all-converted.bin')
model.generate("Once upon a time, ", n_predict=55, new_text_callback=new_text_callback)

最初のステートメントは、モデルを見つける場所をプログラムに指示しています (上のセクションで行ったことを思い出してください)。

XNUMX 番目のステートメントは、モデルに応答を生成し、プロンプト「昔々、」を完了するように要求しています。

これを実行するには、仮想環境がまだアクティブ化されていることを確認し、単に次を実行します。

python3 pygpt4all_test.py

モデルの読み込みテキストと文の完成を確認する必要があります。ハードウェアリソースによっては、少し時間がかかる場合があります。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。

結果はあなたのものとは異なるかもしれません…しかし私たちにとって重要なのは、LangChain が機能し、LangChain を使って高度なものを作成できるということです。

注意事項（2023.05.23更新）: pygpt4all に関連するエラーが発生した場合は、このトピックのトラブルシューティングセクションで提供される解決策を確認してください。ラジニーシュ・アガルワル or オスカー・チョン著。

LangChain フレームワークは本当に素晴らしいライブラリです。それは提供します コンポーネント 使いやすい方法で言語モデルを操作できるほか、以下の機能も提供します。 チェーン。チェーンは、特定の使用例を最適に達成するために、これらのコンポーネントを特定の方法で組み立てるものと考えることができます。これらは、ユーザーが特定のユースケースを簡単に開始できる、より高レベルのインターフェイスを目的としています。これらのチェーンはカスタマイズできるように設計されています。

次の Python テストでは、 プロンプトテンプレート。言語モデルはテキストを入力として受け取ります。そのテキストは一般にプロンプトと呼ばれます。通常、これは単にハードコードされた文字列ではなく、テンプレート、いくつかの例、およびユーザー入力の組み合わせです。 LangChain は、プロンプトの構築と操作を容易にするいくつかのクラスと関数を提供します。私たちにもそれができる方法を見てみましょう。

新しい Python ファイルを作成して呼び出します my_langchain.py

# Import of langchain Prompt Template and Chain
from langchain import PromptTemplate, LLMChain # Import llm to be able to interact with GPT4All directly from langchain
from langchain.llms import GPT4All # Callbacks manager is required for the response handling from langchain.callbacks.base import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler local_path = './models/gpt4all-converted.bin' callback_manager = CallbackManager([StreamingStdOutCallbackHandler()])

GPT モデルと直接対話できるように、LangChain からプロンプトテンプレートとチェーン、および GPT4All llm クラスをインポートしました。

次に、(以前と同様に) llm パスを設定した後、クエリに対する応答をキャッチできるようにコールバックマネージャーをインスタンス化します。

テンプレートの作成は非常に簡単です。ドキュメントチュートリアルこのようなものを使用できます…

template = """Question: {question} Answer: Let's think step by step on it. """
prompt = PromptTemplate(template=template, input_variables=["question"])

　 template variable は、モデルとの対話構造を含む複数行の文字列です。中括弧内に外部変数をテンプレートに挿入します。このシナリオでは、質問.

これは変数であるため、ハードコードされた質問であるか、ユーザー入力の質問であるかを決定できます。ここでは XNUMX つの例を示します。

# Hardcoded question
question = "What Formula 1 pilot won the championship in the year Leonardo di Caprio was born?" # User input question...
question = input("Enter your question: ")

テスト実行では、ユーザーが入力したものにコメントを付けます。あとは、テンプレート、質問、言語モデルをリンクするだけです。

template = """Question: {question}
Answer: Let's think step by step on it. """ prompt = PromptTemplate(template=template, input_variables=["question"]) # initialize the GPT4All instance
llm = GPT4All(model=local_path, callback_manager=callback_manager, verbose=True) # link the language model with our prompt template
llm_chain = LLMChain(prompt=prompt, llm=llm) # Hardcoded question
question = "What Formula 1 pilot won the championship in the year Leonardo di Caprio was born?" # User imput question...
# question = input("Enter your question: ") #Run the query and get the results
llm_chain.run(question)

仮想環境がまだアクティブであることを忘れずに確認し、次のコマンドを実行してください。

python3 my_langchain.py

私とは異なる結果が得られるかもしれません。驚くべきことは、GPT4All が答えを得ようとしている推論全体を確認できることです。質問を調整すると、より良い結果が得られる場合もあります。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。

GPT4All のプロンプトテンプレートを使用した Langchain

ここからが驚くべき部分の始まりです。質問に応答するチャットボットとして GPT4All を使用してドキュメントと対話することになるからです。

手順のシーケンスは、以下を参照してください。 GPT4All を使用した QnA のワークフロー、pdf ファイルをロードし、チャンクに分割することです。その後、埋め込み用の Vector Store が必要になります。情報を取得するには、チャンク化されたドキュメントをベクターストアにフィードする必要があります。その後、LLM クエリのコンテキストとして、類似性検索とともにそれらのドキュメントをこのデータベースに埋め込みます。

この目的のために、FAISS を直接使用します。 ラングチェーン 図書館。 FAISS は、Facebook AI Research のオープンソースライブラリであり、高次元データの大きなコレクションから類似のアイテムを迅速に見つけるように設計されています。データセット内で最も類似したアイテムをより簡単かつ迅速に見つけるためのインデックス作成および検索方法を提供します。それは簡素化されるので、私たちにとって特に便利です 情報検索 作成したデータベースをローカルに保存できるようにします。これは、最初の作成後、その後の使用のために非常に高速にロードされることを意味します。

ベクトルインデックスDBの作成

新しいファイルを作成して呼び出します my_knowledge_qna.py

from langchain import PromptTemplate, LLMChain
from langchain.llms import GPT4All
from langchain.callbacks.base import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler # function for loading only TXT files
from langchain.document_loaders import TextLoader # text splitter for create chunks
from langchain.text_splitter import RecursiveCharacterTextSplitter # to be able to load the pdf files
from langchain.document_loaders import UnstructuredPDFLoader
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import DirectoryLoader # Vector Store Index to create our database about our knowledge
from langchain.indexes import VectorstoreIndexCreator # LLamaCpp embeddings from the Alpaca model
from langchain.embeddings import LlamaCppEmbeddings # FAISS library for similaarity search
from langchain.vectorstores.faiss import FAISS import os #for interaaction with the files
import datetime

最初のライブラリは以前に使用したものと同じです。さらに、 ラングチェーン ベクターストアインデックス作成の場合、 ラマCpp埋め込み Alpaca モデル (4 ビットに量子化され、cpp ライブラリでコンパイルされた) および PDF ローダーと対話します。

また、LLM を独自のパス (埋め込み用とテキスト生成用) でロードしましょう。

# assign the path for the 2 models GPT4All and Alpaca for the embeddings gpt4all_path = './models/gpt4all-converted.bin' llama_path = './models/ggml-model-q4_0.bin' # Calback manager for handling the calls with the model
callback_manager = CallbackManager([StreamingStdOutCallbackHandler()]) # create the embedding object
embeddings = LlamaCppEmbeddings(model_path=llama_path)
# create the GPT4All llm object
llm = GPT4All(model=gpt4all_path, callback_manager=callback_manager, verbose=True)

テストとして、すべての pfd ファイルを読み取ることができたかどうかを確認してみましょう。最初のステップは、それぞれの単一ドキュメントで使用される 3 つの関数を宣言することです。 XNUMX つ目は抽出されたテキストをチャンクに分割すること、XNUMX つ目はメタデータ (ページ番号など) を含むベクトルインデックスを作成すること、そして最後のものは類似性検索をテストすることです (後ほど詳しく説明します)。

# Split text def split_chunks(sources): chunks = [] splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=32) for chunk in splitter.split_documents(sources): chunks.append(chunk) return chunks def create_index(chunks): texts = [doc.page_content for doc in chunks] metadatas = [doc.metadata for doc in chunks] search_index = FAISS.from_texts(texts, embeddings, metadatas=metadatas) return search_index def similarity_search(query, index): # k is the number of similarity searched that matches the query # default is 4 matched_docs = index.similarity_search(query, k=3) sources = [] for doc in matched_docs: sources.append( { "page_content": doc.page_content, "metadata": doc.metadata, } ) return matched_docs, sources

これで、ドキュメントのインデックス生成をテストできます。 ドキュメント ディレクトリ: すべての PDF をそこに置く必要があります。 ラングチェーン ファイルの種類に関係なく、フォルダー全体をロードする方法もあります。後処理が複雑なので、LaMini モデルに関する次の記事で説明します。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。

私のdocsディレクトリには4つのPDFファイルが含まれています

関数をリストの最初のドキュメントに適用します。

# get the list of pdf files from the docs directory into a list format
pdf_folder_path = './docs'
doc_list = [s for s in os.listdir(pdf_folder_path) if s.endswith('.pdf')]
num_of_docs = len(doc_list)
# create a loader for the PDFs from the path
loader = PyPDFLoader(os.path.join(pdf_folder_path, doc_list[0]))
# load the documents with Langchain
docs = loader.load()
# Split in chunks
chunks = split_chunks(docs)
# create the db vector index
db0 = create_index(chunks)

最初の行では、os ライブラリを使用して PDFファイルのリスト docs ディレクトリ内。次に、最初のドキュメントをロードします (ドキュメントリスト[0]) docs フォルダーから ラングチェーン、チャンクに分割し、次のベクトルデータベースを作成します。ラマ埋め込み。

ご覧のとおり、私たちは pyPDF メソッド。これは、ファイルを XNUMX つずつロードする必要があるため、使用するのに少し時間がかかりますが、次を使用して PDF をロードします。 pypdf ドキュメントの配列にすると、各ドキュメントにページのコンテンツとメタデータが含まれる配列を作成できます。 page 番号。これは、クエリで GPT4All に与えるコンテキストのソースを知りたいときに非常に便利です。ここでは readthedocs の例を示します。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
スクリーンショットラングチェーンのドキュメント

ターミナルからコマンドを使用して Python ファイルを実行できます。

python3 my_knowledge_qna.py

埋め込み用のモデルをロードした後、インデックス作成のためにトークンが動作しているのがわかります。特に私のように CPU のみで実行する場合は時間がかかりますので、慌てる必要はありません (8 分かかりました)。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
最初のベクトルデータベースの完成

説明したように、pyPDF メソッドは遅いですが、類似性検索のための追加データを提供します。すべてのファイルを反復処理するには、異なるデータベースをマージできる FAISS の便利なメソッドを使用します。ここで行うことは、上記のコードを使用して最初のデータベースを生成することです (これを db0) そして、for ループを使用して、リスト内の次のファイルのインデックスを作成し、それをすぐにマージします。 db0.

コードは次のとおりです。を使用して進行状況を示すためにいくつかのログを追加したことに注意してください。 datetime.datetime.now（） 終了時間と開始時間の差分を出力して、操作にかかった時間を計算します (気に入らない場合は削除できます)。

マージ手順は次のとおりです

# merge dbi with the existing db0
db0.merge_from(dbi)

最後の手順の XNUMX つは、データベースをローカルに保存するためのものです。生成全体には数時間かかることもあります (ドキュメントの数によって異なります)。そのため、これを XNUMX 回だけ実行すればよいのは非常に良いことです。

# Save the databasae locally
db0.save_local("my_faiss_index")

コード全体は次のとおりです。フォルダーからインデックスを直接ロードする GPT4All と対話するときに、その多くの部分をコメントします。

# get the list of pdf files from the docs directory into a list format
pdf_folder_path = './docs'
doc_list = [s for s in os.listdir(pdf_folder_path) if s.endswith('.pdf')]
num_of_docs = len(doc_list)
# create a loader for the PDFs from the path
general_start = datetime.datetime.now() #not used now but useful
print("starting the loop...")
loop_start = datetime.datetime.now() #not used now but useful
print("generating fist vector database and then iterate with .merge_from")
loader = PyPDFLoader(os.path.join(pdf_folder_path, doc_list[0]))
docs = loader.load()
chunks = split_chunks(docs)
db0 = create_index(chunks)
print("Main Vector database created. Start iteration and merging...")
for i in range(1,num_of_docs): print(doc_list[i]) print(f"loop position {i}") loader = PyPDFLoader(os.path.join(pdf_folder_path, doc_list[i])) start = datetime.datetime.now() #not used now but useful docs = loader.load() chunks = split_chunks(docs) dbi = create_index(chunks) print("start merging with db0...") db0.merge_from(dbi) end = datetime.datetime.now() #not used now but useful elapsed = end - start #not used now but useful #total time print(f"completed in {elapsed}") print("-----------------------------------")
loop_end = datetime.datetime.now() #not used now but useful
loop_elapsed = loop_end - loop_start #not used now but useful
print(f"All documents processed in {loop_elapsed}")
print(f"the daatabase is done with {num_of_docs} subset of db index")
print("-----------------------------------")
print(f"Merging completed")
print("-----------------------------------")
print("Saving Merged Database Locally")
# Save the databasae locally
db0.save_local("my_faiss_index")
print("-----------------------------------")
print("merged database saved as my_faiss_index")
general_end = datetime.datetime.now() #not used now but useful
general_elapsed = general_end - general_start #not used now but useful
print(f"All indexing completed in {general_elapsed}")
print("-----------------------------------")

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。 Python ファイルの実行には 22 分かかりました

ドキュメントについて GPT4All に質問する

今、私たちはここにいます。インデックスがあり、それをロードし、プロンプトテンプレートを使用して GPT4All に質問に答えるように依頼できます。ハードコーディングされた質問から始めて、入力された質問をループしていきます。

次のコードを Python ファイル内に配置します db_loading.py ターミナルからコマンドで実行します python3 db_loading.py

from langchain import PromptTemplate, LLMChain
from langchain.llms import GPT4All
from langchain.callbacks.base import CallbackManager
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
# function for loading only TXT files
from langchain.document_loaders import TextLoader
# text splitter for create chunks
from langchain.text_splitter import RecursiveCharacterTextSplitter
# to be able to load the pdf files
from langchain.document_loaders import UnstructuredPDFLoader
from langchain.document_loaders import PyPDFLoader
from langchain.document_loaders import DirectoryLoader
# Vector Store Index to create our database about our knowledge
from langchain.indexes import VectorstoreIndexCreator
# LLamaCpp embeddings from the Alpaca model
from langchain.embeddings import LlamaCppEmbeddings
# FAISS library for similaarity search
from langchain.vectorstores.faiss import FAISS
import os #for interaaction with the files
import datetime # TEST FOR SIMILARITY SEARCH # assign the path for the 2 models GPT4All and Alpaca for the embeddings gpt4all_path = './models/gpt4all-converted.bin' llama_path = './models/ggml-model-q4_0.bin' # Calback manager for handling the calls with the model
callback_manager = CallbackManager([StreamingStdOutCallbackHandler()]) # create the embedding object
embeddings = LlamaCppEmbeddings(model_path=llama_path)
# create the GPT4All llm object
llm = GPT4All(model=gpt4all_path, callback_manager=callback_manager, verbose=True) # Split text def split_chunks(sources): chunks = [] splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=32) for chunk in splitter.split_documents(sources): chunks.append(chunk) return chunks def create_index(chunks): texts = [doc.page_content for doc in chunks] metadatas = [doc.metadata for doc in chunks] search_index = FAISS.from_texts(texts, embeddings, metadatas=metadatas) return search_index def similarity_search(query, index): # k is the number of similarity searched that matches the query # default is 4 matched_docs = index.similarity_search(query, k=3) sources = [] for doc in matched_docs: sources.append( { "page_content": doc.page_content, "metadata": doc.metadata, } ) return matched_docs, sources # Load our local index vector db
index = FAISS.load_local("my_faiss_index", embeddings)
# Hardcoded question
query = "What is a PLC and what is the difference with a PC"
docs = index.similarity_search(query)
# Get the matches best 3 results - defined in the function k=3
print(f"The question is: {query}")
print("Here the result of the semantic search on the index, without GPT4All..")
print(docs[0])

印刷されたテキストは、クエリに最もよく一致する 3 つの情報源のリストであり、文書名とページ番号も示されます。

GPT4All はドキュメント用のローカル ChatGPT であり、無料です。
ファイルを実行したセマンティック検索の結果 db_loading.py

これで、プロンプトテンプレートを使用して、クエリのコンテキストとして類似性検索を使用できるようになりました。 3 つの関数の後に、すべてのコードを次のものに置き換えるだけです。

# Load our local index vector db
index = FAISS.load_local("my_faiss_index", embeddings) # create the prompt template
template = """
Please use the following context to answer questions.
Context: {context}
---
Question: {question}
Answer: Let's think step by step.""" # Hardcoded question
question = "What is a PLC and what is the difference with a PC"
matched_docs, sources = similarity_search(question, index)
# Creating the context
context = "n".join([doc.page_content for doc in matched_docs])
# instantiating the prompt template and the GPT4All chain
prompt = PromptTemplate(template=template, input_variables=["context", "question"]).partial(context=context)
llm_chain = LLMChain(prompt=prompt, llm=llm)
# Print the result
print(llm_chain.run(question))

実行すると、次のような結果が得られます (ただし、異なる場合があります)。すごいですね！

Please use the following context to answer questions.
Context: 1.What is a PLC
2.Where and Why it is used
3.How a PLC is different from a PC
PLC is especially important in industries where safety and reliability are
critical, such as manufacturing plants, chemical plants, and power plants.
How a PLC is different from a PC
Because a PLC is a specialized computer used in industrial and
manufacturing applications to control machinery and processes.,the
hardware components of a typical PLC must be able to interact with
industrial device. So a typical PLC hardware include:
---
Question: What is a PLC and what is the difference with a PC
Answer: Let's think step by step. 1) A Programmable Logic Controller (PLC), also called Industrial Control System or ICS, refers to an industrial computer that controls various automated processes such as manufacturing machines/assembly lines etcetera through sensors and actuators connected with it via inputs & outputs. It is a form of digital computers which has the ability for multiple instruction execution (MIE), built-in memory registers used by software routines, Input Output interface cards(IOC) to communicate with other devices electronically/digitally over networks or buses etcetera
2). A Programmable Logic Controller is widely utilized in industrial automation as it has the ability for more than one instruction execution. It can perform tasks automatically and programmed instructions, which allows it to carry out complex operations that are beyond a Personal Computer (PC) capacity. So an ICS/PLC contains built-in memory registers used by software routines or firmware codes etcetera but PC doesn't contain them so they need external interfaces such as hard disks drives(HDD), USB ports, serial and parallel communication protocols to store data for further analysis or report generation.

ユーザー入力の質問で行を置き換えたい場合

question = "What is a PLC and what is the difference with a PC"

次のようなもので：

question = input("Your question: ")

実験してみましょう。ドキュメントに関連するすべてのトピックについてさまざまな質問をして、結果を確認してください。確かにプロンプトとテンプレートには改善の余地が大きくあります。ぜひご覧ください。インスピレーションを得るためにここに。しかし ラングチェーン ドキュメントは本当に素晴らしいです（私はそれを理解することができました!!）。

記事のコードに従うか、で確認できます。私のgithubリポジトリ.

ファビオ・マトリカルディ 教育者、教師、エンジニア、学習愛好家。彼は 15 年間若い学生に教えてきましたが、現在は Key Solution Srl で新入社員の研修を行っています。彼は 2010 年に産業オートメーションエンジニアとして私のキャリアをスタートさせました。XNUMX 代の頃からプログラミングに情熱を持っていた彼は、何かに命を吹き込むためのソフトウェアとヒューマンマシンインターフェイスを構築することの美しさを発見しました。最新の管理スキルを備えた情熱的なリーダーになる方法を勉強するだけでなく、ティーチングとコーチングも私の日課の一部です。エンジニアリングのライフサイクル全体を通じて、機械学習と人工知能を使用した、より優れた設計、予測システム統合を目指す旅に私と一緒に参加しましょう。

元の。許可を得て転載。

このトピックの詳細

SEO を活用したコンテンツと PR 配信。今日増幅されます。
EVMファイナンス。分散型金融のための統一インターフェイス。こちらからアクセスしてください。
クォンタムメディアグループ。 IR/PR増幅。こちらからアクセスしてください。
プラトアイストリーム。 Web3 データインテリジェンス。知識増幅。こちらからアクセスしてください。
情報源： https://www.kdnuggets.com/2023/06/gpt4all-local-chatgpt-documents-free.html?utm_source=rss&utm_medium=rss&utm_campaign=gpt4all-is-the-local-chatgpt-for-your-documents-and-it-is-free

タイムスタンプ： 2023 年 6 月 8 日

タイムスタンプ： 2021 年 10 月 11 日

データエンジニアとデータサイエンティストの本当の違いは何ですか？

ソースクラスター：

KDナゲット

ソースノード： 1079313

タイムスタンプ： 2021 年 9 月 16 日

ビッグデータがリアルタイムで命を救う方法: IoV データ分析が事故の防止に役立つ – KDnuggets

ソースクラスター：

KDナゲット

ソースノード： 2982723

タイムスタンプ： 2023 年 11 月 28 日

データサイエンティストの仕事の給与分析

ソースクラスター：

KDナゲット

ソースノード： 2599438

タイムスタンプ： 2023 年 4 月 21 日

プラトン再発行

スタンフォード大学でコンピューターサイエンスの確率を無料で学ぶ – KDnuggets

効果的で信頼性の高い機械学習システムを設計してください! – KDnuggets

データガバナンスは AI 疲労に対処できるか? – KDnuggets

トップストーリー、27月3日〜XNUMX月XNUMX日：フルスタックデータサイエンスへの道

ChatGPT コードインタープリター: データサイエンスを数分で実行 – KDnuggets

SQLを使用してPandasDataFrameをクエリする

データエンジニアとデータサイエンティストの本当の違いは何ですか？

データサイエンティストの仕事の給与分析

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー