Giới thiệu
Trong bối cảnh phát triển nhanh chóng của AI sáng tạo, vai trò then chốt của cơ sở dữ liệu vectơ ngày càng trở nên rõ ràng. Bài viết này đi sâu vào sức mạnh tổng hợp năng động giữa cơ sở dữ liệu vectơ và các giải pháp AI tổng quát, khám phá cách những nền tảng công nghệ này đang định hình tương lai của sự sáng tạo trí tuệ nhân tạo. Hãy tham gia cùng chúng tôi trong cuộc hành trình tìm hiểu những vấn đề phức tạp của liên minh hùng mạnh này, khám phá những hiểu biết sâu sắc về tác động biến đổi mà cơ sở dữ liệu vectơ mang lại cho các giải pháp AI đổi mới.
Mục tiêu học tập
Bài viết này giúp bạn hiểu các khía cạnh của Cơ sở dữ liệu Vector dưới đây.
- Tầm quan trọng của Cơ sở dữ liệu Vector và các thành phần chính của nó
- Nghiên cứu chi tiết so sánh cơ sở dữ liệu Vector với cơ sở dữ liệu truyền thống
- Khám phá các Vector nhúng từ quan điểm ứng dụng
- Xây dựng cơ sở dữ liệu vector bằng Pincone
- Triển khai cơ sở dữ liệu Pinecone Vector bằng mô hình LLM langchain
Bài báo này đã được xuất bản như một phần của Blogathon Khoa học Dữ liệu.
Mục lục
Cơ sở dữ liệu Vector là gì?
Cơ sở dữ liệu vectơ là một dạng thu thập dữ liệu được lưu trữ trong không gian. Tuy nhiên, ở đây, nó được lưu trữ dưới dạng biểu diễn toán học vì định dạng được lưu trữ trong cơ sở dữ liệu giúp các mô hình AI mở ghi nhớ đầu vào dễ dàng hơn và cho phép ứng dụng AI mở của chúng tôi sử dụng tìm kiếm nhận thức, đề xuất và tạo văn bản cho các trường hợp sử dụng khác nhau trong các ngành công nghiệp chuyển đổi kỹ thuật số. Việc lưu trữ và truy xuất dữ liệu được gọi là “Nhúng Vector” hoặc “Nhúng”. Hơn nữa, điều này được thể hiện dưới dạng mảng số. Việc tìm kiếm dễ dàng hơn nhiều so với cơ sở dữ liệu truyền thống được sử dụng cho các quan điểm AI với khả năng lập chỉ mục lớn.
Đặc điểm của cơ sở dữ liệu vectơ
- Nó tận dụng sức mạnh của việc nhúng vectơ này, dẫn đến việc lập chỉ mục và tìm kiếm trên một tập dữ liệu khổng lồ.
- Có thể thu gọn với tất cả các định dạng dữ liệu (hình ảnh, văn bản hoặc dữ liệu).
- Vì nó điều chỉnh các kỹ thuật nhúng và các tính năng được lập chỉ mục cao nên nó có thể cung cấp giải pháp hoàn chỉnh để quản lý dữ liệu và đầu vào cho vấn đề nhất định.
- Cơ sở dữ liệu vectơ tổ chức dữ liệu thông qua các vectơ chiều cao chứa hàng trăm chiều. Chúng ta có thể cấu hình chúng rất nhanh chóng.
- Mỗi thứ nguyên tương ứng với một tính năng hoặc thuộc tính cụ thể của đối tượng dữ liệu mà nó đại diện.
Truyền thống Vs. Cơ sở dữ liệu vectơ
- Hình ảnh hiển thị quy trình làm việc cấp cao của cơ sở dữ liệu vector và truyền thống
- Các tương tác cơ sở dữ liệu chính thức xảy ra thông qua SQL các câu lệnh và dữ liệu được lưu trữ ở dạng hàng và dạng bảng.
- Trong cơ sở dữ liệu Vector, các tương tác xảy ra thông qua văn bản thuần túy (ví dụ: tiếng Anh) và dữ liệu được lưu trữ dưới dạng biểu diễn toán học.
Sự giống nhau của cơ sở dữ liệu truyền thống và vectơ
Chúng ta phải xem xét cơ sở dữ liệu Vector khác với cơ sở dữ liệu truyền thống như thế nào. Hãy thảo luận về vấn đề này ở đây. Một điểm khác biệt nhanh chóng mà tôi có thể đưa ra là trong cơ sở dữ liệu thông thường. Dữ liệu được lưu trữ chính xác như hiện trạng; chúng tôi có thể thêm một số logic nghiệp vụ để điều chỉnh dữ liệu và hợp nhất hoặc phân chia dữ liệu dựa trên các yêu cầu hoặc nhu cầu kinh doanh. Tuy nhiên, cơ sở dữ liệu vectơ có sự biến đổi lớn và dữ liệu trở thành biểu diễn vectơ phức tạp.
Đây là bản đồ cho sự hiểu biết và quan điểm rõ ràng của bạn với Cơ sở dữ liệu quan hệ chống lại cơ sở dữ liệu vector. Hình ảnh bên dưới giúp bạn hiểu cơ sở dữ liệu vectơ bằng cơ sở dữ liệu truyền thống. Nói tóm lại, chúng ta có thể thực hiện các thao tác chèn và xóa vào cơ sở dữ liệu vectơ chứ không phải các câu lệnh cập nhật.
Sự tương tự đơn giản để hiểu cơ sở dữ liệu vectơ
Dữ liệu được tự động sắp xếp theo không gian theo độ tương đồng về nội dung trong thông tin được lưu trữ. Vì vậy, hãy xem xét cửa hàng bách hóa để tương tự với cơ sở dữ liệu vectơ; Tất cả các sản phẩm được sắp xếp trên kệ dựa trên tính chất, mục đích, cách sản xuất, cách sử dụng và số lượng. Trong một hành vi tương tự, dữ liệu được
được sắp xếp tự động trong cơ sở dữ liệu vectơ theo cách sắp xếp tương tự, ngay cả khi thể loại không được xác định rõ ràng trong khi lưu trữ hoặc truy cập dữ liệu.
Cơ sở dữ liệu vectơ cho phép mức độ chi tiết và kích thước nổi bật trên những điểm tương đồng cụ thể, do đó khách hàng tìm kiếm sản phẩm, nhà sản xuất cũng như số lượng mong muốn và giữ mặt hàng đó trong giỏ hàng. Cơ sở dữ liệu vector lưu trữ tất cả dữ liệu trong một cấu trúc lưu trữ hoàn hảo; ở đây, các kỹ sư Machine Learning và AI không cần gắn nhãn hoặc gắn thẻ nội dung được lưu trữ theo cách thủ công.
Các lý thuyết cơ bản đằng sau Cơ sở dữ liệu Vector
- Vector nhúng và phạm vi của chúng
- Yêu cầu lập chỉ mục
- Tìm hiểu về ngữ nghĩa và tìm kiếm tương tự
Nhúng vectơ và phạm vi của chúng
Việc nhúng vectơ là một biểu diễn vectơ dưới dạng các giá trị số. Ở định dạng nén, phần nhúng nắm bắt các thuộc tính và mối liên kết vốn có của dữ liệu gốc, khiến chúng trở thành yếu tố chính trong các trường hợp sử dụng Trí tuệ nhân tạo và Học máy. Thiết kế các phần nhúng để mã hóa thông tin thích hợp về dữ liệu gốc vào không gian có chiều thấp hơn đảm bảo tốc độ truy xuất cao, hiệu quả tính toán và lưu trữ hiệu quả.
Nắm bắt bản chất của dữ liệu theo cách có cấu trúc giống hệt nhau hơn là quá trình nhúng vectơ, hình thành 'Mô hình nhúng'. Cuối cùng, các mô hình này xem xét tất cả các đối tượng dữ liệu, trích xuất các mẫu và mối quan hệ có ý nghĩa trong nguồn dữ liệu và chuyển đổi chúng thành các vectơ nhúng . Sau đó, các thuật toán tận dụng việc nhúng vectơ này để thực hiện các tác vụ khác nhau. Nhiều mô hình nhúng được phát triển cao, có sẵn trực tuyến dưới dạng miễn phí hoặc trả tiền khi bạn sử dụng, tạo điều kiện thuận lợi cho việc thực hiện việc nhúng vectơ.
Phạm vi nhúng Vector từ quan điểm ứng dụng
Các phần nhúng này nhỏ gọn, chứa thông tin phức tạp, kế thừa mối quan hệ giữa dữ liệu được lưu trữ trong cơ sở dữ liệu vectơ, cho phép phân tích xử lý dữ liệu hiệu quả để hỗ trợ hiểu biết và ra quyết định, đồng thời xây dựng linh hoạt các sản phẩm dữ liệu đổi mới khác nhau trong bất kỳ tổ chức nào.
Kỹ thuật nhúng vectơ rất cần thiết trong việc kết nối khoảng cách giữa dữ liệu có thể đọc được và các thuật toán phức tạp. Với các loại dữ liệu là vectơ số, chúng tôi có thể khai thác tiềm năng cho nhiều ứng dụng AI sáng tạo cùng với các mô hình AI mở có sẵn.
Nhiều công việc với việc nhúng Vector
Việc nhúng vectơ này giúp chúng tôi thực hiện nhiều công việc:
- Truy xuất thông tin: Với sự trợ giúp của các kỹ thuật mạnh mẽ này, chúng tôi có thể xây dựng các công cụ tìm kiếm có sức ảnh hưởng có thể giúp chúng tôi tìm thấy phản hồi dựa trên truy vấn của người dùng từ các tệp, tài liệu hoặc phương tiện được lưu trữ
- Hoạt động tìm kiếm tương tự: Điều này được tổ chức và lập chỉ mục tốt; nó giúp chúng ta tìm ra sự giống nhau giữa các lần xuất hiện khác nhau trong dữ liệu vectơ.
- Phân loại và phân cụm: Bằng cách sử dụng các kỹ thuật nhúng này, chúng tôi có thể thực hiện các mô hình này để đào tạo các thuật toán học máy có liên quan, nhóm và phân loại chúng.
- Hệ thống khuyến nghị: Vì các kỹ thuật nhúng được tổ chức hợp lý nên hệ thống đề xuất có liên quan chính xác đến các sản phẩm, phương tiện và bài viết dựa trên dữ liệu lịch sử.
- Phân tích cảm xúc: Mô hình nhúng này giúp chúng tôi phân loại và rút ra các giải pháp tình cảm.
Yêu cầu lập chỉ mục
Như chúng ta đã biết, việc lập chỉ mục sẽ cải thiện dữ liệu tìm kiếm từ bảng trong cơ sở dữ liệu truyền thống, tương tự như cơ sở dữ liệu vectơ và cung cấp các tính năng lập chỉ mục.
Cơ sở dữ liệu vectơ cung cấp “Chỉ số phẳng”, là biểu diễn trực tiếp của việc nhúng vectơ. Khả năng tìm kiếm rất toàn diện và không sử dụng các cụm được đào tạo trước. Nó thực hiện vectơ truy vấn được thực hiện trên mỗi lần nhúng vectơ đơn và K khoảng cách được tính cho mỗi cặp.
- Vì sự dễ dàng của chỉ mục này nên cần phải tính toán tối thiểu để tạo ra các chỉ mục mới.
- Thật vậy, chỉ mục phẳng có thể xử lý các truy vấn một cách hiệu quả và cung cấp thời gian truy xuất nhanh chóng.
Tìm hiểu về ngữ nghĩa và tìm kiếm tương tự
Chúng tôi thực hiện hai tìm kiếm khác nhau trong cơ sở dữ liệu vectơ: tìm kiếm ngữ nghĩa và tìm kiếm tương tự.
- Tìm kiếm ngữ nghĩa: Trong khi tìm kiếm thông tin, thay vì tìm kiếm theo từ khóa, bạn có thể tìm kiếm dựa trên phương pháp hội thoại ý nghĩa. Kỹ thuật nhanh chóng đóng một vai trò quan trọng trong việc chuyển đầu vào tới hệ thống. Tìm kiếm này chắc chắn cho phép tìm kiếm chất lượng cao hơn và kết quả có thể được cung cấp cho các ứng dụng sáng tạo, SEO, tạo văn bản và Tóm tắt.
- Tìm kiếm sự tương đồng: Luôn luôn trong phân tích dữ liệu, tìm kiếm tương tự cho phép các bộ dữ liệu không có cấu trúc, được cung cấp tốt hơn nhiều. Về cơ sở dữ liệu vectơ, chúng ta phải xác định sự gần gũi của hai vectơ và chúng giống nhau như thế nào: bảng, văn bản, tài liệu, hình ảnh, từ ngữ và tệp âm thanh. Trong quá trình tìm hiểu, sự giống nhau giữa các vectơ được bộc lộ là sự giống nhau giữa các đối tượng dữ liệu trong tập dữ liệu đã cho. Bài tập này giúp chúng ta hiểu được sự tương tác, xác định các mẫu, rút ra những hiểu biết sâu sắc và đưa ra quyết định từ các góc độ ứng dụng. Tìm kiếm Ngữ nghĩa và Tương tự sẽ giúp chúng tôi xây dựng các ứng dụng bên dưới vì lợi ích của ngành.
- Truy xuất thông tin: Bằng cách sử dụng Cơ sở dữ liệu Vector và AI mở, chúng tôi sẽ xây dựng các công cụ tìm kiếm để truy xuất thông tin bằng cách sử dụng các truy vấn của người dùng doanh nghiệp hoặc người dùng cuối và các tài liệu được lập chỉ mục bên trong cơ sở dữ liệu vectơ.
- Phân loại và phân cụm:Việc phân loại hoặc phân cụm các điểm dữ liệu hoặc nhóm đối tượng tương tự liên quan đến việc gán chúng vào nhiều danh mục dựa trên các đặc điểm chung.
- Phát hiện bất thường: Phát hiện những điểm bất thường từ các mẫu thông thường bằng cách đo lường mức độ tương tự của các điểm dữ liệu và phát hiện những điểm bất thường.
Các loại thước đo độ tương tự trong cơ sở dữ liệu vectơ
Các phương pháp đo lường phụ thuộc vào bản chất của dữ liệu và ứng dụng cụ thể. Thông thường, ba phương pháp được sử dụng để đo lường mức độ tương đồng và mức độ quen thuộc với Machine Learning.
Khoảng cách Euclide
Nói một cách đơn giản, khoảng cách giữa hai vectơ là khoảng cách đường thẳng giữa hai điểm vectơ đo st.
chấm sản phẩm
Điều này giúp chúng ta hiểu được sự liên kết giữa hai vectơ, cho biết chúng hướng cùng hướng, ngược chiều hay vuông góc với nhau.
Cosine tương tự
Nó đánh giá sự giống nhau của hai vectơ bằng cách sử dụng góc giữa chúng, như trong hình. Trong trường hợp này, giá trị và độ lớn của vectơ không đáng kể và không ảnh hưởng đến kết quả; chỉ có góc được xem xét trong tính toán.
Cơ sở dữ liệu truyền thống Tìm kiếm các kết quả khớp câu lệnh SQL chính xác và truy xuất dữ liệu ở định dạng bảng. Đồng thời, chúng tôi xử lý cơ sở dữ liệu vectơ để tìm kiếm vectơ tương tự nhất với truy vấn đầu vào bằng tiếng Anh đơn giản bằng cách sử dụng các kỹ thuật Kỹ thuật nhắc nhở. Cơ sở dữ liệu sử dụng thuật toán tìm kiếm Hàng xóm gần nhất (ANN) để tìm dữ liệu tương tự. Luôn cung cấp kết quả có độ chính xác hợp lý với hiệu suất, độ chính xác và thời gian phản hồi cao.
Cơ chế làm việc
- Cơ sở dữ liệu vectơ trước tiên chuyển đổi dữ liệu thành các vectơ nhúng, lưu trữ dữ liệu đó trong cơ sở dữ liệu vectơ và tạo chỉ mục để tìm kiếm nhanh hơn.
- Một truy vấn từ ứng dụng sẽ tương tác với vectơ nhúng, tìm kiếm dữ liệu lân cận gần nhất hoặc dữ liệu tương tự trong cơ sở dữ liệu vectơ bằng cách sử dụng chỉ mục và truy xuất kết quả được chuyển đến ứng dụng.
- Dựa trên các yêu cầu kinh doanh, dữ liệu được truy xuất sẽ được tinh chỉnh, định dạng và hiển thị cho nguồn cấp dữ liệu phía người dùng cuối hoặc truy vấn hoặc (các) hành động.
Tạo cơ sở dữ liệu vectơ
Hãy kết nối với Pinecone.
Bạn có thể kết nối với Pinecone bằng Google, GitHub hoặc Microsoft ID.
Tạo thông tin đăng nhập người dùng mới cho việc sử dụng của bạn.
Sau khi đăng nhập thành công, bạn sẽ đến trang Index; bạn có thể tạo chỉ mục cho mục đích Cơ sở dữ liệu Vector của mình. Nhấp vào nút Tạo chỉ mục.
Tạo chỉ mục mới của bạn bằng cách cung cấp Tên và Thứ nguyên.
Trang danh sách chỉ mục,
Chi tiết chỉ mục – Tên, Vùng và Môi trường – Chúng tôi cần tất cả các chi tiết này để kết nối cơ sở dữ liệu vectơ của chúng tôi từ mã xây dựng mô hình.
Chi tiết cài đặt dự án,
Bạn có thể nâng cấp tùy chọn của mình cho nhiều chỉ mục và khóa cho mục đích dự án.
Cho đến nay, chúng ta đã thảo luận về việc tạo chỉ mục và cài đặt cơ sở dữ liệu vector trong Pinecone.
Triển khai cơ sở dữ liệu vectơ bằng Python
Bây giờ chúng ta hãy thực hiện một số mã hóa.
Nhập thư viện
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.llms import OpenAI
from langchain.vectorstores import Pinecone
from langchain.document_loaders import TextLoader
from langchain.chains.question_answering import load_qa_chain
from langchain.chat_models import ChatOpenAI
Cung cấp khóa API cho cơ sở dữ liệu OpenAI và Vector
import os
os.environ["OPENAI_API_KEY"] = "xxxxxxxx"
PINECONE_API_KEY = os.environ.get('PINECONE_API_KEY', 'xxxxxxxxxxxxxxxxxxxxxxx')
PINECONE_API_ENV = os.environ.get('PINECONE_API_ENV', 'gcp-starter')
api_keys="xxxxxxxxxxxxxxxxxxxxxx"
llm = OpenAI(OpenAI=api_keys, temperature=0.1)
Bắt đầu LLM
llm=OpenAI(openai_api_key=os.environ["OPENAI_API_KEY"],temperature=0.6)
Khởi tạo quả thông
import pinecone
pinecone.init(
api_key=PINECONE_API_KEY,
environment=PINECONE_API_ENV
index_name = "demoindex"
Đang tải tệp .csv để xây dựng cơ sở dữ liệu vectơ
from langchain.document_loaders.csv_loader import CSVLoader
loader = CSVLoader(file_path="/content/drive/My Drive/Colab_Notebooks/cereal.csv"
,source_column="name")
data = loader.load()
Chia văn bản thành Chunks
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=20)
text_chunks = text_splitter.split_documents(data)
Tìm văn bản trong text_chunk
text_chunks
Đầu ra
[Tài liệu(page_content='name: 100% Brannmfr: Nntype: Cncalories: 70nprotein: 4nfat: 1nsodium: 130nfiber: 10ncarbo: 5nsugars: 6npotass: 280nvitamins: 25nshelf: 3nweight: 1ncups: 0.33nrated: 68.402973nrecommendation: Kids ', siêu dữ liệu={ 'nguồn': '100% Cám', 'hàng': 0}), , …..
Xây dựng nhúng
embeddings = OpenAIEmbeddings()
Tạo một phiên bản Pinecone cho cơ sở dữ liệu vector từ ‘data’
vectordb = Pinecone.from_documents(text_chunks,embeddings,index_name="demoindex")
Tạo một công cụ truy xuất để truy vấn cơ sở dữ liệu vectơ.
retriever = vectordb.as_retriever(score_threshold = 0.7)
Lấy dữ liệu từ cơ sở dữ liệu vector
rdocs = retriever.get_relevant_documents("Cocoa Puffs")
rdocs
Sử dụng Nhắc và truy xuất dữ liệu
from langchain.prompts import PromptTemplate
prompt_template = """Given the following context and a question,
generate an answer based on this context only.
,Please state "I don't know." Don't try to make up an answer.
CONTEXT: {context}
QUESTION: {question}"""
PROMPT = PromptTemplate(
template=prompt_template, input_variables=["context", "question"]
)
chain_type_kwargs = {"prompt": PROMPT}
from langchain.chains import RetrievalQA
chain = RetrievalQA.from_chain_type(llm=llm,
chain_type="stuff",
retriever=retriever,
input_key="query",
return_source_documents=True,
chain_type_kwargs=chain_type_kwargs)
Hãy truy vấn dữ liệu.
chain('Can you please provide cereal recommendation for Kids?')
Đầu ra từ truy vấn
{'query': 'Can you please provide cereal recommendation for Kids?',
'result': [Document(page_content='name: Crispixnmfr: Kntype: Cncalories: 110nprotein: 2nfat: 0nsodium: 220nfiber: 1ncarbo: 21nsugars: 3npotass: 30nvitamins: 25nshelf: 3nweight: 1ncups: 1nrating: 46.895644nrecommendation: Kids', metadata={'row': 21.0, 'source': '/content/drive/My Drive/Colab_Notebooks/cereal.csv'}), ..]
Kết luận
Hy vọng bạn có thể hiểu cách hoạt động của cơ sở dữ liệu vectơ, các thành phần, kiến trúc và đặc điểm của Cơ sở dữ liệu vectơ trong các giải pháp Generative AI. Hiểu cơ sở dữ liệu vectơ khác với cơ sở dữ liệu truyền thống như thế nào và so sánh với các thành phần cơ sở dữ liệu thông thường. Thật vậy, sự tương tự giúp bạn hiểu rõ hơn về cơ sở dữ liệu vectơ. Cơ sở dữ liệu vectơ Pinecone và các bước lập chỉ mục sẽ giúp bạn tạo cơ sở dữ liệu vectơ và mang lại chìa khóa cho việc triển khai mã sau.
Chìa khóa chính
- Có thể thu gọn với dữ liệu có cấu trúc, không cấu trúc và bán cấu trúc.
- Nó thích ứng với các kỹ thuật nhúng và các tính năng được lập chỉ mục cao.
- Các tương tác diễn ra thông qua văn bản thuần túy bằng lời nhắc (ví dụ: tiếng Anh). Và dữ liệu được lưu trữ dưới dạng biểu diễn toán học.
- Độ tương tự được hiệu chỉnh trong Cơ sở dữ liệu vectơ thông qua – Khoảng cách Euclide, Độ tương tự Cosine và Tích số chấm.
Những câu hỏi thường gặp
A. Cơ sở dữ liệu vectơ lưu trữ một tập hợp dữ liệu trong không gian. Nó giữ dữ liệu trong các biểu diễn toán học. vì định dạng được lưu trữ trong cơ sở dữ liệu giúp các mô hình AI mở ghi nhớ các dữ liệu đầu vào trước đó dễ dàng hơn và cho phép ứng dụng AI mở của chúng tôi sử dụng tìm kiếm nhận thức, đề xuất và tạo văn bản chính xác cho các trường hợp sử dụng khác nhau trong các ngành chuyển đổi kỹ thuật số.
A. Một số đặc điểm là: 1. Nó tận dụng sức mạnh của việc nhúng vectơ này, dẫn đến việc lập chỉ mục và tìm kiếm trên một tập dữ liệu khổng lồ. 2. Có thể kết hợp với dữ liệu có cấu trúc, không cấu trúc và bán cấu trúc. 3. Cơ sở dữ liệu vectơ tổ chức dữ liệu thông qua các vectơ nhiều chiều chứa hàng trăm chiều
A. Cơ sở dữ liệu ==> Bộ sưu tập
Bảng==> Không gian vectơ
Hàng==>Cector
Cột==>Kích thước
Có thể chèn và xóa trong cơ sở dữ liệu Vector, giống như trong cơ sở dữ liệu truyền thống.
Cập nhật và Tham gia không nằm trong phạm vi.
– Truy xuất thông tin để thu thập dữ liệu lớn một cách nhanh chóng.
– Hoạt động tìm kiếm ngữ nghĩa và tương tự từ các tài liệu có kích thước khổng lồ.
– Ứng dụng phân loại và phân cụm.
– Hệ thống phân tích khuyến nghị và tình cảm.
Câu trả lời 5: Dưới đây là ba phương pháp để đo lường mức độ tương tự:
– Khoảng cách Euclide
- Tương tự cosin
– Sản phẩm chấm
Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định riêng của Tác giả.
Sản phẩm liên quan
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://www.analyticsvidhya.com/blog/2023/12/vector-databases-in-generative-ai-solutions/
- : có
- :là
- :không phải
- $ LÊN
- 1
- 10
- 12
- 13
- 46
- 7
- 8
- 9
- a
- Có khả năng
- Giới thiệu
- truy cập
- chính xác
- chính xác
- chính xác
- ngang qua
- thích nghi
- thêm vào
- ảnh hưởng đến
- AI
- Mô hình AI
- thuật toán
- thuật toán
- liên kết
- Tất cả
- Liên minh
- cho phép
- cho phép
- dọc theo
- luôn luôn
- trong số
- an
- phân tích
- phân tích
- Phân tích Vidhya
- và
- trả lời
- bất kì
- api
- rõ ràng
- Các Ứng Dụng
- ứng dụng cụ thể
- các ứng dụng
- gần đúng
- kiến trúc
- LÀ
- bố trí
- Mảng
- bài viết
- bài viết
- nhân tạo
- trí tuệ nhân tạo
- Trí tuệ nhân tạo và học máy
- AS
- các khía cạnh
- đánh giá
- các hiệp hội
- At
- âm thanh
- tự động
- có sẵn
- dựa
- BE
- trở nên
- trở thành
- hành vi
- sau
- được
- phía dưới
- Lợi ích
- Hơn
- giữa
- cuộc thi viết blog
- mang lại
- xây dựng
- Xây dựng
- kinh doanh
- nút
- by
- tính
- phép tính
- gọi là
- CAN
- khả năng
- khả năng
- nắm bắt
- trường hợp
- trường hợp
- đố
- chuỗi
- chuỗi
- đặc điểm
- rõ ràng
- phân loại
- Phân loại
- Nhấp chuột
- tập hợp
- mã
- Lập trình
- nhận thức
- bộ sưu tập
- thông thường
- nhỏ gọn
- so sánh
- sự so sánh
- hoàn thành
- phức tạp
- các thành phần
- toàn diện
- tính toán
- tính toán
- Kết nối
- Kết nối
- Hãy xem xét
- xem xét
- chứa
- nội dung
- bối cảnh
- thông thường
- Conversation
- chuyển đổi
- tương ứng
- có thể
- tạo
- Tạo
- sáng tạo
- khách hàng
- dữ liệu
- phân tích dữ liệu
- điểm dữ liệu
- xử lý dữ liệu
- Cơ sở dữ liệu
- cơ sở dữ liệu
- bộ dữ liệu
- nhiều
- Ra quyết định
- quyết định
- nhu cầu
- lấy được
- thiết kế
- mong muốn
- chi tiết
- Phát hiện
- phát triển
- khác nhau
- sự khác biệt
- khác nhau
- kỹ thuật số
- kích thước
- kích thước
- trực tiếp
- hướng
- hướng
- khám phá
- tùy ý
- thảo luận
- thảo luận
- hiển thị
- khoảng cách
- do
- tài liệu
- làm
- don
- DOT
- năng động
- năng động
- e
- mỗi
- dễ dàng
- dễ dàng hơn
- hiệu quả
- hiệu quả
- hiệu quả
- hay
- các yếu tố
- nhúng
- cho phép
- cuối
- Kỹ Sư
- Kỹ sư
- Động cơ
- Tiếng Anh
- đảm bảo
- Môi trường
- bản chất
- thiết yếu
- Ether (ETH)
- Ngay cả
- phát triển
- thi hành
- Tập thể dục
- Khám phá
- trích xuất
- tạo điều kiện
- Tính quen thuộc
- xa
- Đặc tính
- Tính năng
- Fed
- Hình
- Tập tin
- Các tập tin
- Tìm kiếm
- Tên
- bằng phẳng
- tiếp theo
- Trong
- đi đầu
- hình thức
- định dạng
- Miễn phí
- từ
- tương lai
- khoảng cách
- tạo ra
- thế hệ
- thế hệ
- Trí tuệ nhân tạo
- thể loại
- GitHub
- Cho
- được
- Nhóm
- Các nhóm
- xử lý
- xảy ra
- Có
- giúp đỡ
- giúp
- tại đây
- Cao
- cấp độ cao
- cao
- lịch sử
- Độ đáng tin của
- Tuy nhiên
- HTTPS
- lớn
- Hàng trăm
- i
- ID
- xác định
- if
- hình ảnh
- Va chạm
- thực hiện
- nhập khẩu
- nâng cao
- in
- lên
- chỉ số
- lập chỉ mục
- chỉ số
- chỉ ra
- CHỈ SỐ
- các ngành công nghiệp
- ngành công nghiệp
- Có ảnh hưởng
- thông tin
- vốn có
- sáng tạo
- đầu vào
- đầu vào
- Chèn
- trong
- những hiểu biết
- ví dụ
- thay vì
- Sự thông minh
- tương tác
- tương tác
- tương tác
- trong
- phức tạp
- liên quan đến
- IT
- ITS
- việc làm
- tham gia
- Tham gia với chúng tôi
- cuộc hành trình
- chỉ
- Key
- phím
- từ khóa
- trẻ em
- Biết
- nhãn
- Quốc gia
- cảnh quan
- lớn
- hàng đầu
- Dẫn
- học tập
- Tỉ lệ đòn bẩy
- đòn bẩy
- Lượt thích
- Danh sách
- loader
- logic
- đăng nhập
- máy
- học máy
- chính
- làm cho
- LÀM CHO
- Làm
- quản lý
- cách thức
- thủ công
- nhà chế tạo
- bản đồ
- lớn
- diêm
- toán học
- có ý nghĩa
- đo
- các biện pháp
- đo lường
- cơ chế
- Phương tiện truyền thông
- đi
- Phương pháp luận
- phương pháp
- microsoft
- tối thiểu
- kiểu mẫu
- mô hình
- chi tiết
- Hơn thế nữa
- hầu hết
- nhiều
- nhiều
- phải
- tên
- Thiên nhiên
- Cần
- Mới
- tại
- nhiều
- vật
- đối tượng
- of
- cung cấp
- on
- ONE
- những
- Trực tuyến
- có thể
- mở
- OpenAI
- Hoạt động
- đối diện
- or
- cơ quan
- Tổ chức
- tổ chức
- nguyên
- OS
- Nền tảng khác
- vfoXNUMXfipXNUMXhfpiXNUMXufhpiXNUMXuf
- sở hữu
- trang
- đôi
- một phần
- thông qua
- Đi qua
- mô hình
- hoàn hảo
- thực hiện
- hiệu suất
- thực hiện
- thực hiện
- quan điểm
- quan điểm
- hình ảnh
- quan trọng
- Trơn
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- đóng
- xin vui lòng
- Điểm
- điểm
- có thể
- tiềm năng
- quyền lực
- mạnh mẽ
- Thực tế
- Ứng dụng thực tế
- cần
- Chính xác
- ưu đãi
- trước
- Vấn đề
- quá trình
- Sản phẩm
- Sản phẩm
- dự án
- nổi bật
- nhắc nhở
- đúng
- tài sản
- tài sản
- cho
- cung cấp
- cung cấp
- công bố
- bánh xốp
- mục đích
- mục đích
- số lượng, lượng
- truy vấn
- câu hỏi
- Nhanh chóng
- nhanh hơn
- Mau
- nhanh chóng
- Khuyến nghị
- khuyến nghị
- về
- khu
- quan hệ
- Mối quan hệ
- có liên quan
- đại diện
- đại diện
- đại diện cho
- cần phải
- Yêu cầu
- phản ứng
- phản ứng
- kết quả
- Kết quả
- Tiết lộ
- Vai trò
- HÀNG
- s
- tương tự
- Khoa học
- phạm vi
- Tìm kiếm
- Công cụ tìm kiếm
- tìm kiếm
- tìm kiếm
- tình cảm
- SEO
- thiết lập
- Hình dạng
- định hình
- chia sẻ
- kệ
- ngắn
- thể hiện
- Chương trình
- bên
- tương tự
- tương
- Đơn giản
- kể từ khi
- duy nhất
- Kích thước máy
- So
- giải pháp
- Giải pháp
- một số
- nguồn
- Không gian
- riêng
- tốc độ
- chia
- đốm
- SQL
- Tiểu bang
- Tuyên bố
- báo cáo
- Các bước
- Vẫn còn
- là gắn
- hàng
- lưu trữ
- cửa hàng
- cấu trúc
- cấu trúc
- Học tập
- Sau đó
- thành công
- sức mạnh tổng hợp
- hệ thống
- hệ thống
- T
- bàn
- TAG
- nhiệm vụ
- kỹ thuật
- công nghệ
- về
- văn bản
- tạo văn bản
- hơn
- việc này
- Sản phẩm
- Tương lai
- cung cấp their dịch
- Them
- Kia là
- họ
- điều này
- số ba
- Thông qua
- thời gian
- thời gian
- đến
- truyền thống
- Train
- Chuyển đổi
- Chuyển đổi
- biến đổi
- chuyển đổi
- thử
- hai
- loại
- Cuối cùng
- hiểu
- sự hiểu biết
- Chắc chắn
- mở khóa
- mở khóa
- Cập nhật
- nâng cấp
- us
- Sử dụng
- sử dụng
- đã sử dụng
- người sử dang
- sử dụng
- sử dụng
- bình thường
- Các giá trị
- nhiều
- khác nhau
- rất
- quan trọng
- vs
- là
- we
- webp
- được xác định rõ ràng
- là
- Điều gì
- Là gì
- liệu
- cái nào
- trong khi
- sẽ
- với
- ở trong
- từ
- Công việc
- đang làm việc
- sẽ
- bạn
- trên màn hình
- zephyrnet