国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁 科技週邊 人工智慧 使用OpenAI API利用文本嵌入:實用指南

使用OpenAI API利用文本嵌入:實用指南

Mar 11, 2025 am 09:19 AM

文本嵌入是自然語言處理(NLP)的基石,提供了文本的數(shù)值表示,其中單詞或短語成為真實數(shù)字的密集向量。這使機器可以理解語義含義和單詞之間的關(guān)係,從而顯著提高其處理人類語言的能力。

這些嵌入對於文本分類,信息檢索和語義相似性檢測等任務(wù)至關(guān)重要。 Openai推薦了ADA V2模型來創(chuàng)建它們,從而利用GPT系列的強度來捕獲文本中的上下文含義和關(guān)聯(lián)。

在繼續(xù)之前,假定對OpenAI的API和openai Python軟件包的熟悉程度(請參閱“使用Python中的OpenAI API使用GPT-3.5和GPT-4”以獲取指導(dǎo)。了解聚類,尤其是K-均值,也很有幫助(請參閱“與Scikit-Learn在Python中介紹K-Means聚類的簡介”)。

文本嵌入的應(yīng)用:

文本嵌入在許多領(lǐng)域中找到應(yīng)用程序,包括:

  • 文本分類:建立精確的模型,以進(jìn)行情感分析或主題標(biāo)識。
  • 信息檢索:檢索與特定查詢相關(guān)的信息,模仿搜索引擎功能。
  • 語義相似性檢測:識別和量化文本片段之間的語義相似性。
  • 建議系統(tǒng):通過了解文本交互中的用戶偏好來增強建議質(zhì)量。
  • 文本生成:生成更連貫和上下文相關(guān)的文本。
  • 機器翻譯:通過捕獲跨語義語義含義來改善機器翻譯質(zhì)量。

設(shè)置和安裝:

需要以下python軟件包: os , openai , scipy.spatial.distance , sklearn.cluster.KMeansumap.UMAP 。使用:

 PIP安裝-U Openai Scipy Plotly-Express Scikit-Learn Umap-learn

導(dǎo)入所需的庫:

導(dǎo)入操作系統(tǒng)
進(jìn)口Openai
從scipy.Spatial進(jìn)口距離
導(dǎo)入plotly.extress為px
來自Sklearn.Cluster Import Kmeans
來自UMAP進(jìn)口UMAP

配置您的OpenAI API密鑰:

 openai.api_key =”<your_api_key_here> “</your_api_key_here>

(請記住要替換<your_api_key_here></your_api_key_here>使用您的實際鑰匙。)

生成嵌入:

該輔助功能使用text-embedding-ada-002模型生成嵌入:

 def get_embedding(text_to_embed):
    響應(yīng)= openai.embedding.create(
        型號=“ text-embedding-ada-002”,
        輸入= [text_to_embed]
    )
    嵌入=響應(yīng)[“數(shù)據(jù)”] [0] [“嵌入”]
    返回嵌入

數(shù)據(jù)集和分析:

此示例使用Amazon樂器評論數(shù)據(jù)集(可在Kaggle或作者的GitHub上找到)。為了提高效率,使用了100個評論的樣本。

導(dǎo)入大熊貓作為pd

data_url =“ https://raw.githubusercontent.com/keitazoumana/experimentation-data/main/main/musical_instruments_reviews.csv”
評論_df = pd.read_csv(data_url)[['eviewText']]
評論_df =評論_df.sample(100)
評論_df [“嵌入”] = eview_df [“評論Text”]。astype(str).apply(get_embedding)
評論_df.Reset_index(drop = true,inplace = true)

語義相似性:

使用scipy.spatial.distance.pdist()計算的歐幾里得距離測量了回顧嵌入之間的相似性。較小的距離表示更大的相似性。

聚類分析(K-均值):

K-均值聚類小組類似評論。在這裡,使用了三個集群:

 kmeans = kmeans(n_clusters = 3)
kmeanss.fit(review_df [“嵌入”]。tolist())

減少維度(UMAP):

UMAP將嵌入維度降低至兩個以進(jìn)行可視化:

還原= umap()
embeddings_2d = reducer.fit_transform(eview_df [“ embedding”]。tolist())

可視化:

一個散點圖可視化簇:

無花果= px.scatter(x = embeddings_2d [:,0],y = embeddings_2d [:,1],color = kmeans.labels_)
圖show() 

使用OpenAI API利用文本嵌入:實用指南

進(jìn)一步探索:

要進(jìn)行高級學(xué)習(xí),請?zhí)剿魑⒄{(diào)GPT-3和OpenAI API備忘單上的數(shù)據(jù)掃描資源。

代碼示例以更簡潔和有組織的方式提出,以提高可讀性和理解。根據(jù)要求包含圖像。

以上是使用OpenAI API利用文本嵌入:實用指南的詳細(xì)內(nèi)容。更多資訊請關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

前7個筆記本替代品 前7個筆記本替代品 Jun 17, 2025 pm 04:32 PM

Google的NotebookLM是由Gemini 2.5提供動力的智能AI筆記工具,它在匯總文檔方面表現(xiàn)出色。但是,它在工具使用方面仍然有局限性,例如源蓋,雲(yún)依賴性和最近的“發(fā)現(xiàn)”功能

從採用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 從採用到優(yōu)勢:2025年塑造企業(yè)LLM的10個趨勢 Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢。對LLMSorganizations的財務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計他們的支出今年會增加。目前,近40%a

AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨特性的衰落,以AI為中心的風(fēng)險投資的投資者必須做出關(guān)鍵決定:購買,建立或合作夥伴才能獲得優(yōu)勢?這是評估每個選項和PR的方法

生成AI的不可阻擋的增長(AI Outlook第1部分) 生成AI的不可阻擋的增長(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司諮詢。 Growth驅(qū)動力的生成AI採用的激增比最樂觀的預(yù)測更具戲劇性。然後,

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由於AI,那些日子是編號的。根據(jù)一個螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會導(dǎo)致用戶單擊任何鏈接。

新蓋洛普報告:AI文化準(zhǔn)備就緒需要新的心態(tài) 新蓋洛普報告:AI文化準(zhǔn)備就緒需要新的心態(tài) Jun 19, 2025 am 11:16 AM

廣泛採用和情感準(zhǔn)備之間的差距揭示了人類如何與越來越多的數(shù)字伴侶互動。我們正在進(jìn)入共存階段,算法編織到我們的日常現(xiàn)場

AGI和AI超級智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 AGI和AI超級智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來談?wù)劇? 對創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。 前往Agi和

思科在美國2025 思科在美國2025 Jun 19, 2025 am 11:10 AM

讓我們仔細(xì)研究一下我發(fā)現(xiàn)的最重要的東西,以及思科如何以其目前的努力來進(jìn)一步實現(xiàn)其野心。

See all articles