成年av网站18禁,成年美女黄的视频网站

LlamaIndex是一個(gè)基於大型語(yǔ)言模型（LLM）的應(yīng)用數(shù)據(jù)框架。像GPT-4這樣的LLM預(yù)先訓(xùn)練了海量公共數(shù)據(jù)集，開(kāi)箱即用地提供強(qiáng)大的自然語(yǔ)言處理能力。然而，如果沒(méi)有訪問(wèn)您自己的私有數(shù)據(jù)，它們的效用將受到限制。

LlamaIndex允許您通過(guò)靈活的數(shù)據(jù)連接器，從API、數(shù)據(jù)庫(kù)、PDF等多種來(lái)源攝取數(shù)據(jù)。這些數(shù)據(jù)被索引成針對(duì)LLM優(yōu)化的中間表示。然後，LlamaIndex允許通過(guò)查詢引擎、聊天界面和LLM驅(qū)動(dòng)的智能體與您的數(shù)據(jù)進(jìn)行自然語(yǔ)言查詢和對(duì)話。它使您的LLM能夠大規(guī)模訪問(wèn)和解釋私有數(shù)據(jù)，而無(wú)需對(duì)模型進(jìn)行重新訓(xùn)練。

無(wú)論您是尋求簡(jiǎn)單自然語(yǔ)言查詢數(shù)據(jù)方法的初學(xué)者，還是需要深度定制的高級(jí)用戶，LlamaIndex都能提供相應(yīng)的工具。高級(jí)API讓您只需五行代碼即可上手，而低級(jí)API則允許您完全控制數(shù)據(jù)攝取、索引、檢索等更多功能。

LlamaIndex的工作原理

LlamaIndex使用檢索增強(qiáng)生成（RAG）系統(tǒng)，該系統(tǒng)將大型語(yǔ)言模型與私有知識(shí)庫(kù)相結(jié)合。它通常包括兩個(gè)階段：索引階段和查詢階段。

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

圖片來(lái)自高級(jí)概念

索引階段

在索引階段，LlamaIndex會(huì)將私有數(shù)據(jù)高效地索引到向量索引中。此步驟有助於創(chuàng)建特定於您領(lǐng)域的、可搜索的知識(shí)庫(kù)。您可以輸入文本文檔、數(shù)據(jù)庫(kù)記錄、知識(shí)圖譜和其他數(shù)據(jù)類(lèi)型。

本質(zhì)上，索引將數(shù)據(jù)轉(zhuǎn)換為數(shù)值向量或嵌入，以捕捉其語(yǔ)義含義。它能夠快速進(jìn)行跨內(nèi)容的相似性搜索。

查詢階段

在查詢階段，RAG管道根據(jù)用戶的查詢搜索最相關(guān)的信息。然後，將這些信息與查詢一起提供給LLM，以創(chuàng)建準(zhǔn)確的響應(yīng)。

此過(guò)程允許LLM訪問(wèn)其初始訓(xùn)練中可能未包含的當(dāng)前和更新的信息。

此階段的主要挑戰(zhàn)是從可能存在的多個(gè)知識(shí)庫(kù)中檢索、組織和推理信息。

在我們的PineCone檢索增強(qiáng)生成代碼示例中了解更多關(guān)於RAG的信息。

LlamaIndex的設(shè)置

在我們深入LlamaIndex教程和項(xiàng)目之前，我們必須安裝Python包並設(shè)置API。

我們可以使用pip簡(jiǎn)單地安裝LlamaIndex。

<code>pip install llama-index</code>

默認(rèn)情況下，LlamaIndex使用OpenAI GPT-3 text-davinci-003模型。要使用此模型，您必須設(shè)置OPENAI_API_KEY。您可以創(chuàng)建一個(gè)免費(fèi)帳戶，並通過(guò)登錄OpenAI的新API令牌來(lái)獲取API密鑰。

<code>pip install llama-index</code>

此外，請(qǐng)確保您已安裝openai包。

<code>import os

os.environ["OPENAI_API_KEY"] = "INSERT OPENAI KEY"</code>

使用LlamaIndex向LLM添加個(gè)人數(shù)據(jù)

在本節(jié)中，我們將學(xué)習(xí)如何使用LlamaIndex創(chuàng)建一個(gè)簡(jiǎn)歷閱讀器。您可以通過(guò)訪問(wèn)LinkedIn個(gè)人資料頁(yè)面，單擊“更多”，然後“保存為PDF”來(lái)下載您的簡(jiǎn)歷。

請(qǐng)注意，我們使用DataLab運(yùn)行Python代碼。您可以在LlamaIndex：向LLM添加個(gè)人數(shù)據(jù)工作簿中訪問(wèn)所有相關(guān)的代碼和輸出；您可以輕鬆創(chuàng)建自己的副本以運(yùn)行所有代碼，而無(wú)需在您的計(jì)算機(jī)上安裝任何內(nèi)容！

在運(yùn)行任何內(nèi)容之前，我們必須安裝llama-index、openai和pypdf。我們安裝pypdf以便我們可以讀取和轉(zhuǎn)換PDF文件。

<code>pip install openai</code>

加載數(shù)據(jù)並創(chuàng)建索引

我們有一個(gè)名為“Private-Data”的目錄，其中只包含一個(gè)PDF文件。我們將使用SimpleDirectoryReader讀取它，然後使用TreeIndex將其轉(zhuǎn)換為索引。

<code>%pip install llama-index openai pypdf</code>

運(yùn)行查詢

一旦數(shù)據(jù)被索引，您就可以開(kāi)始通過(guò)使用as_query_engine()提問(wèn)。此函數(shù)使您可以詢問(wèn)文檔中特定信息的問(wèn)題，並在OpenAI GPT-3 text-davinci-003模型的幫助下獲得相應(yīng)的響應(yīng)。

注意：您可以按照在Python教程中使用GPT-3.5和GPT-4通過(guò)OpenAI API的說(shuō)明，在DataLab中設(shè)置OpenAI API。

正如我們所看到的，LLM模型準(zhǔn)確地回答了查詢。它搜索了索引並找到了相關(guān)信息。

<code>from llama_index import TreeIndex, SimpleDirectoryReader

resume = SimpleDirectoryReader("Private-Data").load_data()
new_index = TreeIndex.from_documents(resume)</code>

<code>query_engine = new_index.as_query_engine()
response = query_engine.query("When did Abid graduated?")
print(response)</code>

我們可以進(jìn)一步詢問(wèn)認(rèn)證信息。似乎LlamaIndex已經(jīng)完全了解了候選人，這對(duì)於尋找特定人才的公司來(lái)說(shuō)可能是有利的。

<code>Abid graduated in February 2014.</code>

<code>response = query_engine.query("What is the name of certification that Abid received?")
print(response)</code>

保存和加載上下文

創(chuàng)建索引是一個(gè)耗時(shí)的過(guò)程。我們可以通過(guò)保存上下文來(lái)避免重新創(chuàng)建索引。默認(rèn)情況下，以下命令將保存存儲(chǔ)在./storage目錄中的索引存儲(chǔ)。

<code>Data Scientist Professional</code>

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

完成後，我們可以快速加載存儲(chǔ)上下文並創(chuàng)建索引。

<code>new_index.storage_context.persist()</code>

為了驗(yàn)證它是否正常工作，我們將向查詢引擎提出簡(jiǎn)歷中的問(wèn)題?？磥?lái)我們已經(jīng)成功加載了上下文。

<code>from llama_index import StorageContext, load_index_from_storage

storage_context = StorageContext.from_defaults(persist_)
index = load_index_from_storage(storage_context)</code>

<code>query_engine = index.as_query_engine()
response = query_engine.query("What is Abid's job title?")
print(response)</code>

聊天機(jī)器人

除了問(wèn)答之外，我們還可以使用LlamaIndex創(chuàng)建個(gè)人聊天機(jī)器人。我們只需要使用as_chat_engine()函數(shù)初始化索引即可。

我們將問(wèn)一個(gè)簡(jiǎn)單的問(wèn)題。

<code>Abid's job title is Technical Writer.</code>

<code>query_engine = index.as_chat_engine()
response = query_engine.chat("What is the job title of Abid in 2021?")
print(response)</code>

並且無(wú)需提供額外的上下文，我們將提出後續(xù)問(wèn)題。

<code>Abid's job title in 2021 is Data Science Consultant.</code>

<code>response = query_engine.chat("What else did he do during that time?")
print(response)</code>

很明顯，聊天引擎運(yùn)行完美無(wú)缺。

構(gòu)建語(yǔ)言應(yīng)用程序後，您時(shí)間軸上的下一步是閱讀關(guān)於在雲(yún)中使用大型語(yǔ)言模型（LLM）與在本地運(yùn)行它們的優(yōu)缺點(diǎn)。這將幫助您確定哪種方法最適合您的需求。

使用LlamaIndex構(gòu)建維基文本轉(zhuǎn)語(yǔ)音

我們的下一個(gè)項(xiàng)目涉及開(kāi)發(fā)一個(gè)可以響應(yīng)來(lái)自維基百科的問(wèn)題並將它們轉(zhuǎn)換為語(yǔ)音的應(yīng)用程序。

代碼源和附加信息可在DataLab工作簿中找到。

網(wǎng)絡(luò)抓取維基百科頁(yè)面

首先，我們將從意大利 - 維基百科網(wǎng)頁(yè)抓取數(shù)據(jù)，並將其保存為data文件夾中的italy_text.txt文件。

<code>pip install llama-index</code>

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

加載數(shù)據(jù)並構(gòu)建索引

接下來(lái)，我們需要安裝必要的包。 elevenlabs包允許我們使用API輕鬆地將文本轉(zhuǎn)換為語(yǔ)音。

<code>import os

os.environ["OPENAI_API_KEY"] = "INSERT OPENAI KEY"</code>

通過(guò)使用SimpleDirectoryReader，我們將加載數(shù)據(jù)並將TXT文件轉(zhuǎn)換為使用VectorStoreIndex的向量存儲(chǔ)。

<code>pip install openai</code>

查詢

我們的計(jì)劃是詢問(wèn)有關(guān)該國(guó)的一般性問(wèn)題，並從LLM query_engine獲得答復(fù)。

<code>%pip install llama-index openai pypdf</code>

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

文本轉(zhuǎn)語(yǔ)音

之後，我們將使用llama_index.tts模塊訪問(wèn)ElevenLabsTTS api。您需要提供ElevenLabs API密鑰才能啟動(dòng)音頻生成功能。您可以在ElevenLabs網(wǎng)站上免費(fèi)獲得API密鑰。

<code>from llama_index import TreeIndex, SimpleDirectoryReader

resume = SimpleDirectoryReader("Private-Data").load_data()
new_index = TreeIndex.from_documents(resume)</code>

我們將response添加到generate_audio函數(shù)中以生成自然語(yǔ)音。為了收聽(tīng)音頻，我們將使用IPython.display的Audio函數(shù)。

<code>query_engine = new_index.as_query_engine()
response = query_engine.query("When did Abid graduated?")
print(response)</code>

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

這是一個(gè)簡(jiǎn)單的示例。您可以使用多個(gè)模塊來(lái)創(chuàng)建您的助手，例如Siri，它通過(guò)解釋您的私有數(shù)據(jù)來(lái)回答您的問(wèn)題。有關(guān)更多信息，請(qǐng)參閱LlamaIndex文檔。

除了LlamaIndex之外，LangChain還允許您構(gòu)建基於LLM的應(yīng)用程序。此外，您可以閱讀數(shù)據(jù)工程和數(shù)據(jù)應(yīng)用程序的LangChain入門(mén)，以了解您可以使用LangChain執(zhí)行的操作概述，包括LangChain解決的問(wèn)題和數(shù)據(jù)用例示例。

LlamaIndex的用例

LlamaIndex提供了一個(gè)完整的工具包來(lái)構(gòu)建基於語(yǔ)言的應(yīng)用程序。最重要的是，您可以使用Llama Hub中的各種數(shù)據(jù)加載器和智能體工具來(lái)開(kāi)發(fā)具有多種功能的複雜應(yīng)用程序。

您可以使用一個(gè)或多個(gè)插件數(shù)據(jù)加載器將自定義數(shù)據(jù)源連接到您的LLM。

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

來(lái)自Llama Hub的數(shù)據(jù)加載器

您還可以使用智能體工具來(lái)集成第三方工具和API。

LlamaIndex: A Data Framework for the Large Language Models (LLMs) based applications

來(lái)自Llama Hub的智能體工具

簡(jiǎn)而言之，您可以使用LlamaIndex構(gòu)建：

基於文檔的問(wèn)答
聊天機(jī)器人
智能體
結(jié)構(gòu)化數(shù)據(jù)
全棧Web應(yīng)用程序
私有設(shè)置

要詳細(xì)了解這些用例，請(qǐng)?jiān)L問(wèn)LlamaIndex文檔。

結(jié)論

LlamaIndex提供了一個(gè)強(qiáng)大的工具包，用於構(gòu)建檢索增強(qiáng)生成系統(tǒng)，該系統(tǒng)結(jié)合了大型語(yǔ)言模型和自定義知識(shí)庫(kù)的優(yōu)勢(shì)。它能夠創(chuàng)建一個(gè)特定領(lǐng)域數(shù)據(jù)的索引存儲(chǔ)，並在推理過(guò)程中利用它，為L(zhǎng)LM提供相關(guān)的上下文以生成高質(zhì)量的響應(yīng)。

在本教程中，我們學(xué)習(xí)了LlamaIndex及其工作原理。此外，我們僅使用幾行Python代碼就構(gòu)建了一個(gè)簡(jiǎn)歷閱讀器和文本轉(zhuǎn)語(yǔ)音項(xiàng)目。使用LlamaIndex創(chuàng)建LLM應(yīng)用程序非常簡(jiǎn)單，它提供了一個(gè)龐大的插件、數(shù)據(jù)加載器和智能體庫(kù)。

要成為一名專(zhuān)家級(jí)LLM開(kāi)發(fā)人員，下一步是參加大型語(yǔ)言模型概念大師課程。本課程將使您全面了解LLM，包括它們的應(yīng)用、訓(xùn)練方法、倫理考慮和最新研究。

以上是LlamainDEX：基於大語(yǔ)模型（LLM）應(yīng)用程序的數(shù)據(jù)框架的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章！

本網(wǎng)站聲明

本文內(nèi)容由網(wǎng)友自願(yuàn)投稿，版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容，請(qǐng)聯(lián)絡(luò)admin@php.cn