国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁(yè) 科技周邊 人工智能 使用OpenAI API利用文本嵌入:實(shí)用指南

使用OpenAI API利用文本嵌入:實(shí)用指南

Mar 11, 2025 am 09:19 AM

文本嵌入是自然語(yǔ)言處理(NLP)的基石,提供了文本的數(shù)值表示,其中單詞或短語(yǔ)成為真實(shí)數(shù)字的密集向量。這使機(jī)器可以理解語(yǔ)義含義和單詞之間的關(guān)系,從而顯著提高其處理人類語(yǔ)言的能力。

這些嵌入對(duì)于文本分類,信息檢索和語(yǔ)義相似性檢測(cè)等任務(wù)至關(guān)重要。 Openai推薦了ADA V2模型來(lái)創(chuàng)建它們,從而利用GPT系列的強(qiáng)度來(lái)捕獲文本中的上下文含義和關(guān)聯(lián)。

在繼續(xù)之前,假定對(duì)OpenAI的API和openai Python軟件包的熟悉程度(請(qǐng)參閱“使用Python中的OpenAI API使用GPT-3.5和GPT-4”以獲取指導(dǎo)。了解聚類,尤其是K-均值,也很有幫助(請(qǐng)參閱“與Scikit-Learn在Python中介紹K-Means聚類的簡(jiǎn)介”)。

文本嵌入的應(yīng)用:

文本嵌入在許多領(lǐng)域中找到應(yīng)用程序,包括:

  • 文本分類:建立精確的模型,以進(jìn)行情感分析或主題標(biāo)識(shí)。
  • 信息檢索:檢索與特定查詢相關(guān)的信息,模仿搜索引擎功能。
  • 語(yǔ)義相似性檢測(cè):識(shí)別和量化文本片段之間的語(yǔ)義相似性。
  • 建議系統(tǒng):通過(guò)了解文本交互中的用戶偏好來(lái)增強(qiáng)建議質(zhì)量。
  • 文本生成:生成更連貫和上下文相關(guān)的文本。
  • 機(jī)器翻譯:通過(guò)捕獲跨語(yǔ)義語(yǔ)義含義來(lái)改善機(jī)器翻譯質(zhì)量。

設(shè)置和安裝:

需要以下python軟件包: os , openai , scipy.spatial.distancesklearn.cluster.KMeansumap.UMAP 。使用:

 PIP安裝-U Openai Scipy Plotly-Express Scikit-Learn Umap-learn

導(dǎo)入所需的庫(kù):

導(dǎo)入操作系統(tǒng)
進(jìn)口Openai
從scipy.Spatial進(jìn)口距離
導(dǎo)入plotly.extress為px
來(lái)自Sklearn.Cluster Import Kmeans
來(lái)自UMAP進(jìn)口UMAP

配置您的OpenAI API密鑰:

 openai.api_key =”<your_api_key_here> “</your_api_key_here>

(請(qǐng)記住要替換<your_api_key_here></your_api_key_here>使用您的實(shí)際鑰匙。)

生成嵌入:

該輔助功能使用text-embedding-ada-002模型生成嵌入:

 def get_embedding(text_to_embed):
    響應(yīng)= openai.embedding.create(
        型號(hào)=“ text-embedding-ada-002”,
        輸入= [text_to_embed]
    )
    嵌入=響應(yīng)[“數(shù)據(jù)”] [0] [“嵌入”]
    返回嵌入

數(shù)據(jù)集和分析:

此示例使用Amazon樂(lè)器評(píng)論數(shù)據(jù)集(可在Kaggle或作者的GitHub上找到)。為了提高效率,使用了100個(gè)評(píng)論的樣本。

導(dǎo)入大熊貓作為pd

data_url =“ https://raw.githubusercontent.com/keitazoumana/experimentation-data/main/main/musical_instruments_reviews.csv”
評(píng)論_df = pd.read_csv(data_url)[['eviewText']]
評(píng)論_df =評(píng)論_df.sample(100)
評(píng)論_df [“嵌入”] = eview_df [“評(píng)論Text”]。astype(str).apply(get_embedding)
評(píng)論_df.Reset_index(drop = true,inplace = true)

語(yǔ)義相似性:

使用scipy.spatial.distance.pdist()計(jì)算的歐幾里得距離測(cè)量了回顧嵌入之間的相似性。較小的距離表示更大的相似性。

聚類分析(K-均值):

K-均值聚類小組類似評(píng)論。在這里,使用了三個(gè)集群:

 kmeans = kmeans(n_clusters = 3)
kmeanss.fit(review_df [“嵌入”]。tolist())

減少維度(UMAP):

UMAP將嵌入維度降低至兩個(gè)以進(jìn)行可視化:

還原= umap()
embeddings_2d = reducer.fit_transform(eview_df [“ embedding”]。tolist())

可視化:

一個(gè)散點(diǎn)圖可視化簇:

無(wú)花果= px.scatter(x = embeddings_2d [:,0],y = embeddings_2d [:,1],color = kmeans.labels_)
圖show() 

使用OpenAI API利用文本嵌入:實(shí)用指南

進(jìn)一步探索:

要進(jìn)行高級(jí)學(xué)習(xí),請(qǐng)?zhí)剿魑⒄{(diào)GPT-3和OpenAI API備忘單上的數(shù)據(jù)掃描資源。

代碼示例以更簡(jiǎn)潔和有組織的方式提出,以提高可讀性和理解。根據(jù)要求包含圖像。

以上是使用OpenAI API利用文本嵌入:實(shí)用指南的詳細(xì)內(nèi)容。更多信息請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本站聲明
本文內(nèi)容由網(wǎng)友自發(fā)貢獻(xiàn),版權(quán)歸原作者所有,本站不承擔(dān)相應(yīng)法律責(zé)任。如您發(fā)現(xiàn)有涉嫌抄襲侵權(quán)的內(nèi)容,請(qǐng)聯(lián)系admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣服圖片

Undresser.AI Undress

Undresser.AI Undress

人工智能驅(qū)動(dòng)的應(yīng)用程序,用于創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用于從照片中去除衣服的在線人工智能工具。

Clothoff.io

Clothoff.io

AI脫衣機(jī)

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智能換臉工具輕松在任何視頻中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的代碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

功能強(qiáng)大的PHP集成開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)代碼編輯軟件(SublimeText3)

前7個(gè)筆記本替代品 前7個(gè)筆記本替代品 Jun 17, 2025 pm 04:32 PM

Google的NotebookLM是由Gemini 2.5提供動(dòng)力的智能AI筆記工具,它在匯總文檔方面表現(xiàn)出色。但是,它在工具使用方面仍然有局限性,例如源蓋,云依賴性和最近的“發(fā)現(xiàn)”功能

從采用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) 從采用到優(yōu)勢(shì):2025年塑造企業(yè)LLM的10個(gè)趨勢(shì) Jun 20, 2025 am 11:13 AM

以下是重塑企業(yè)AI景觀的十種引人注目的趨勢(shì)。對(duì)LLMSorganizations的財(cái)務(wù)承諾正在大大增加其在LLMS的投資,其中72%的人預(yù)計(jì)他們的支出今年會(huì)增加。目前,近40%a

AI投資者停滯不前? 3條購(gòu)買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 AI投資者停滯不前? 3條購(gòu)買,建造或與人工智能供應(yīng)商合作的戰(zhàn)略途徑 Jul 02, 2025 am 11:13 AM

投資蓬勃發(fā)展,但僅資本還不夠。隨著估值的上升和獨(dú)特性的衰落,以AI為中心的風(fēng)險(xiǎn)投資的投資者必須做出關(guān)鍵決定:購(gòu)買,建立或合作伙伴才能獲得優(yōu)勢(shì)?這是評(píng)估每個(gè)選項(xiàng)和PR的方法

生成AI的不可阻擋的增長(zhǎng)(AI Outlook第1部分) 生成AI的不可阻擋的增長(zhǎng)(AI Outlook第1部分) Jun 21, 2025 am 11:11 AM

披露:我的公司Tirias Research已向IBM,NVIDIA和本文提到的其他公司咨詢。Growth驅(qū)動(dòng)力的生成AI采用的激增比最樂(lè)觀的預(yù)測(cè)更具戲劇性。然后,

新蓋洛普?qǐng)?bào)告:AI文化準(zhǔn)備就緒需要新的心態(tài) 新蓋洛普?qǐng)?bào)告:AI文化準(zhǔn)備就緒需要新的心態(tài) Jun 19, 2025 am 11:16 AM

廣泛采用和情感準(zhǔn)備之間的差距揭示了人類如何與越來(lái)越多的數(shù)字伴侶互動(dòng)。我們正在進(jìn)入共存階段,算法編織到我們的日?,F(xiàn)場(chǎng)

這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 這些初創(chuàng)公司正在幫助企業(yè)出現(xiàn)在AI搜索摘要中 Jun 20, 2025 am 11:16 AM

由于AI,那些日子是編號(hào)的。根據(jù)一個(gè)螺柱,搜索企業(yè)諸如Travel網(wǎng)站皮劃艇和Edtech Company Chegg之類的企業(yè)正在下降,部分原因是60%的網(wǎng)站搜索不會(huì)導(dǎo)致用戶單擊任何鏈接。

AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 AGI和AI超級(jí)智能將嚴(yán)重?fù)糁腥祟愄旎ò宓募僭O(shè)障礙 Jul 04, 2025 am 11:10 AM

讓我們來(lái)談?wù)劇? 對(duì)創(chuàng)新AI突破的分析是我正在進(jìn)行的AI中正在進(jìn)行的福布斯列覆蓋的一部分,包括識(shí)別和解釋各種有影響力的AI復(fù)雜性(請(qǐng)參閱此處的鏈接)。 前往Agi和

思科在美國(guó)2025 思科在美國(guó)2025 Jun 19, 2025 am 11:10 AM

讓我們仔細(xì)研究一下我發(fā)現(xiàn)的最重要的東西,以及思科如何以其目前的努力來(lái)進(jìn)一步實(shí)現(xiàn)其野心。

See all articles