国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

目次
ノミックビジョン埋め込みを備えたマルチモーダルラグの実踐的なPython実裝
クリップモデルの制限へのアドレス指定:
ステップ2:OpenAI APIキーの設(shè)定とインポートライブラリ
ステップ4:PDF
ホームページ テクノロジー周辺機(jī)器 AI NOMIC EmbeddingsでRAGシステムを強(qiáng)化します

NOMIC EmbeddingsでRAGシステムを強(qiáng)化します

Mar 03, 2025 pm 06:08 PM

マルチモーダル検索された生成(RAG)システムは、テキスト、畫像、オーディオ、ビデオなどの多様なデータ型を統(tǒng)合してAIに革命をもたらしています。 これは、テキストのみに焦點(diǎn)を當(dāng)てている伝統(tǒng)的なぼろを上回ります。 重要な進(jìn)歩は、ノミックビジョンの埋め込みであり、視覚データとテキストデータのための統(tǒng)一されたスペースを作成し、シームレスなクロスモーダル相互作用を可能にします。 高度なモデルは、高品質(zhì)の埋め込みを生成し、情報(bào)の検索を改善し、異なるコンテンツフォーム間のギャップを埋める、最終的にユーザーエクスペリエンスを濃縮します。

學(xué)習(xí)目標(biāo)

    マルチモーダルラグの基本と、従來のぼろきらに対するその利點(diǎn)を把握してください。
  • テキストと畫像の埋め込みスペースを統(tǒng)一する際の名目視力の埋め込みの役割を理解してください。
  • ノミックビジョンの埋め込みとクリップモデルを比較し、パフォーマンスベンチマークを分析します。
  • ノミックビジョンとテキストの埋め込みを使用して、PythonにマルチモーダルRAGシステムを?qū)g裝してください。
  • マルチモーダル検索のためにPDFSからテキストおよび視覚データを抽出および処理することを?qū)Wびます。
  • *この記事は、***
  • データサイエンスブログソンの一部です
  • 目次

マルチモーダルラグとは? nomic vision Embeddings ノミックビジョンの埋め込みのパフォーマンスベンチマーク

ノミックビジョン埋め込みを備えたマルチモーダルラグの実踐的なPython実裝

    ステップ1:必要なライブラリのインストール
  • ステップ2:OpenAI APIキーの設(shè)定とインポートライブラリ
  • ステップ3:PDF
  • から畫像を抽出します
  • ステップ4:PDF
  • からテキストを抽出します
      ステップ5:抽出されたテキストと畫像を保存
    • ステップ6:テキストデータのチャンキング
    • ステップ7:NOMIC Embedding Modelsの読み込み
    • ステップ8:埋め込みの生成
    • ステップ9:qdrantにテキスト埋め込みを保存
    • ステップ10:qdrantに畫像埋め込みを保存
    • ステップ11:マルチモーダルレトリバーの作成
    • ステップ12:ラングチェーンでマルチモーダルラグを構(gòu)築します
    • モデルのクエリ
    • 結(jié)論
    • よくある質(zhì)問
    マルチモーダルラグとは?
  • マルチモーダルRAGは、多様なデータ型を組み込むことにより、従來のぼろきれに基づいて構(gòu)築される重要なAIの進(jìn)歩を表しています。主にテキストを処理する従來のシステムとは異なり、マルチモーダルラグプロセスと複數(shù)のデータフォームを同時(shí)に統(tǒng)合します。これは、さまざまなモダリティにわたるより包括的な理解とコンテキスト対応の応答につながります。
  • キーマルチモーダルラグコンポーネント:
    • データの摂?。?/strong>さまざまなソースからのデータは、特殊なプロセッサを使用して摂取され、検証、クリーニング、および正規(guī)化を確保します。
    • ベクトル表現(xiàn):モダリティは、ニューラルネットワーク(例:畫像のクリップ、テキスト用のバート)を使用して処理され、統(tǒng)一されたベクター埋め込みを作成し、セマンティック関係を維持します。
    • ベクトルデータベースストレージ:
    • 埋め込みは、効率的な検索のためにインデックス作成技術(shù)(HNSW、FAISS)を使用して最適化されたベクターデータベース(QDRANT)に保存されます。 クエリ処理:
    • 著信クエリが分析され、保存されたデータと同じベクトル空間に変換され、関連するモダリティを識(shí)別し、検索のための埋め込みを生成するために使用されます。
    • nomic vision Embeddings
    • ノミックビジョン埋め込みは重要な革新であり、視覚データとテキストデータのための統(tǒng)一された埋め込みスペースを作成します。 NOMIC AIによって開発されたNOMIC Embed Vision V1およびV1.5は、テキストの対応物と同じ潛在スペースを共有しています(NOMIC Embed Text V1およびV1.5)。これにより、テキストから畫像への取得などのマルチモーダルタスクに最適になります。 比較的小さなパラメーターカウント(92m)で、NOMIC Embed Visionは大規(guī)模なアプリケーションで効率的です。

    クリップモデルの制限へのアドレス指定:

    クリップはゼロショット機(jī)能に優(yōu)れている間、そのテキストエンコーダーは畫像検索を超えたタスクでパフォーマンスを下回ります(MTEBベンチマークで示されています)。 NOMIC Embed Visionは、ビジョンエンコーダーをNOMIC Embedテキスト潛在スペースと整列させることにより、これに対処します。

    NOMIC Embed Visionは、NOMIC Embedテキストとともにトレーニングされ、テキストエンコーダをフリーズし、畫像テキストペアでVisionエンコーダーをトレーニングしました。これにより、最適な結(jié)果とNOMIC Embed Text Embeddingsとの後方互換性が保証されます。

    ノミックビジョンの埋め込みのパフォーマンスベンチマーク

    クリップモデルは、ゼロショット機(jī)能では印象的ですが、セマンティックの類似性(MTEBベンチマーク)などの単峰性タスクの弱點(diǎn)を示しています。 NOMIC Embed Visionは、そのビジョンエンコーダーをNOMIC Embed Text Latent Spaceに合わせることでこれを克服し、畫像、テキスト、マルチモーダルタスク(Imagenet Zero-Shot、MTEB、DataComp Benchmarks)にわたって強(qiáng)力なパフォーマンスをもたらします。 Enhancing RAG Systems with Nomic Embeddings

    ノミックビジョン埋め込みを備えたマルチモーダルラグの実踐的なPython実裝

    このチュートリアルは、テキストと畫像を含むPDFから情報(bào)を取得するマルチモーダルRAGシステムを構(gòu)築します(T4 GPUを使用してGoogle Colabを使用)。

    ステップ1:ライブラリのインストール

    必要なPythonライブラリをインストール:Openai、Qdrant、Transformers、Torch、Pymupdfなど(Brevityのためにコードは省略されていますが、オリジナルに存在します。)Enhancing RAG Systems with Nomic Embeddings

    ステップ2:OpenAI APIキーの設(shè)定とインポートライブラリ

    OpenAI APIキーを設(shè)定し、必要なライブラリをインポートします(Pymupdf、Pil、Langchain、Openaiなど)。 (Brevityのためにコードが省略されました。)

    ステップ3:PDF

    から畫像を抽出します

    pymupdfを使用してpdfから畫像を抽出し、それらをディレクトリに保存します。 (Brevityのためにコードが省略されました。)

    ステップ4:PDF

    からテキストを抽出します pymupdfを使用して、各PDFページからテキストを抽出します。 (Brevityのためにコードが省略されました。)

    ステップ5:抽出されたデータの保存

    抽出された畫像とテキストを保存します。 (Brevityのためにコードが省略されました。)

    ステップ6:テキストデータのチャンキング

    抽出されたテキストをLangchainの

    を使用して小さなチャンクに分割します。 (Brevityのためにコードが省略されました。)RecursiveCharacterTextSplitter

    ステップ7:NOMIC Embedding Modelsの読み込み

    Faceのトランスを抱きしめて、Nomicのテキストとビジョン埋め込みモデルをロードします。 (Brevityのためにコードが省略されました。)

    ステップ8:埋め込みの生成

    テキストと畫像の埋め込みを生成します。 (Brevityのためにコードが省略されました。)

    ステップ9:qdrantにテキスト埋め込みを保存

    qdrantコレクションにテキストの埋め込みを保存します。 (Brevityのためにコードが省略されました。)

    ステップ10:qdrantに畫像埋め込みを保存

    別のqdrantコレクションに畫像の埋め込みを格納します。 (Brevityのためにコードが省略されました。)

    ステップ11:マルチモーダルレトリバーの作成

    クエリに基づいて関連するテキストと畫像の埋め込みを取得する関數(shù)を作成します。 (Brevityのためにコードが省略されました。)

    ステップ12:ラングチェーンでマルチモーダルラグを構(gòu)築します

    LangChainを使用して、取得したデータを処理し、言語モデル(GPT-4など)を使用して応答を生成します。 (Brevityのためにコードが省略されました。)

    モデルのクエリ

    サンプルクエリは、PDF內(nèi)のテキストと畫像の両方から情報(bào)を取得するシステムの能力を示しています。 (簡(jiǎn)潔にするために省略されたクエリと出力の例ですが、オリジナルに存在します。)

    結(jié)論

    NOMIC Vision Embeddingsはマルチモーダルラグを大幅に強(qiáng)化し、視覚データとテキストデータの間のシームレスな相互作用を可能にします。 これは、クリップなどのモデルの制限に対処し、統(tǒng)一された埋め込みスペースを提供し、さまざまなタスクでパフォーマンスを向上させます。 これは、生産環(huán)境でより豊かでコンテキストを意識(shí)したユーザーエクスペリエンスにつながります。

    キーテイクアウト

    マルチモーダルラグは、より包括的な理解のために多様なデータ型を統(tǒng)合します。
      NOMIC Vision Embeddings改善された情報(bào)検索のための視覚データとテキストデータを統(tǒng)合します。
    • システムは、効率的な検索のために特殊な処理、ベクトル表現(xiàn)、およびストレージを使用します。
    • NOMIC Embed Visionは、単峰性のタスクにおけるClipの制限を克服します
    • よくある質(zhì)問
    • (BrevityのためにFAQは省略されていますが、オリジナルに存在します。)
    • 注:コードスニペットは簡(jiǎn)潔に省略されていますが、コア機(jī)能とステップは正確に説明されたままです。 元の入力には広範(fàn)なコードが含まれていました。それをすべて含めると、この応答は過度に長(zhǎng)くなります。 完全なコード実裝については、元の入力を參照してください。

以上がNOMIC EmbeddingsでRAGシステムを強(qiáng)化しますの詳細(xì)內(nèi)容です。詳細(xì)については、PHP 中國(guó)語 Web サイトの他の関連記事を參照してください。

このウェブサイトの聲明
この記事の內(nèi)容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰屬します。このサイトは、それに相當(dāng)する法的責(zé)任を負(fù)いません。盜作または侵害の疑いのあるコンテンツを見つけた場(chǎng)合は、admin@php.cn までご連絡(luò)ください。

ホットAIツール

Undress AI Tool

Undress AI Tool

脫衣畫像を無料で

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード寫真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

寫真から衣服を削除するオンライン AI ツール。

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡(jiǎn)単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中國(guó)語版

SublimeText3 中國(guó)語版

中國(guó)語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強(qiáng)力な PHP 統(tǒng)合開発環(huán)境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

トップ7ノートブックルムの代替 トップ7ノートブックルムの代替 Jun 17, 2025 pm 04:32 PM

GoogleのNoteBookLMは、Gemini 2.5を搭載したスマートAIノートテイキングツールであり、ドキュメントの要約に優(yōu)れています。ただし、ソースキャップ、クラウド依存、最近の「発見」機(jī)能など、ツールの使用にはまだ制限があります。

採(cǎi)用から利點(diǎn)まで:2025年にエンタープライズLLMを形作る10のトレンド 採(cǎi)用から利點(diǎn)まで:2025年にエンタープライズLLMを形作る10のトレンド Jun 20, 2025 am 11:13 AM

エンタープライズAIランドスケープを再構(gòu)築する10の説得力のある傾向があります。LLMSORGANIZATIONSへの財(cái)政的コミットメントは、LLMSへの投資を大幅に増加させており、72%が今年の支出が増加することを期待しています?,F(xiàn)在、ほぼ40%a

AI投資家は停滯していますか? AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス AI投資家は停滯していますか? AIベンダーと購(gòu)入、構(gòu)築、またはパートナーになる3つの戦略的なパス Jul 02, 2025 am 11:13 AM

投資は活況を呈していますが、資本だけでは十分ではありません。評(píng)価が上昇し、獨(dú)特の衰退があるため、AIに焦點(diǎn)を當(dāng)てたベンチャーファンドの投資家は、優(yōu)位性を獲得するために購(gòu)入、構(gòu)築、またはパートナーの重要な決定を下す必要がありますか?各オプションを評(píng)価する方法とpr

生成AIの止められない成長(zhǎng)(AI Outlookパート1) 生成AIの止められない成長(zhǎng)(AI Outlookパート1) Jun 21, 2025 am 11:11 AM

開示:私の會(huì)社であるTirias Researchは、IBM、Nvidia、およびこの記事で述べた他の企業(yè)に相談しました。成長(zhǎng)ドライバー生成AI採(cǎi)用の急増は、最も楽観的な予測(cè)でさえ予測(cè)できるよりも劇的でした。次に、a

新しいギャラップレポート:AI文化の準(zhǔn)備が新しいマインドセットを要求します 新しいギャラップレポート:AI文化の準(zhǔn)備が新しいマインドセットを要求します Jun 19, 2025 am 11:16 AM

広範(fàn)囲にわたる採(cǎi)用と感情的な準(zhǔn)備のギャップは、人間が成長(zhǎng)しているデジタルコンパニオンの配列にどのように関與しているかについて不可欠な何かを明らかにしています。アルゴリズムが毎日のライブに織り込む共存の段階に入っています

これらのスタートアップは、企業(yè)がAI検索の概要に登場(chǎng)するのを支援しています これらのスタートアップは、企業(yè)がAI検索の概要に登場(chǎng)するのを支援しています Jun 20, 2025 am 11:16 AM

AIのおかげで、それらの日は番號(hào)が付けられています。 1つのスタッドによると、Googleのようなサイトでの検索の60%がユーザーがリンクをクリックしていないため、旅行サイトKayakやEdtech Company Cheggなどの企業(yè)の検索トラフィックが減少しています。

AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう AGIとAIのスーパーインテリジェンスは、人間の天井の仮定の障壁に急激に衝突するでしょう Jul 04, 2025 am 11:10 AM

それについて話しましょう。 革新的なAIブレークスルーのこの分析は、さまざまなインパクトのあるAIの複雑さの特定と説明など、最新のAIで進(jìn)行中のForbes列のカバレッジの一部です(こちらのリンクを參照)。 アギに向かっています

Ciscoは、Cisco Live U.S. 2025でそのエージェントAIジャーニーをチャートします Ciscoは、Cisco Live U.S. 2025でそのエージェントAIジャーニーをチャートします Jun 19, 2025 am 11:10 AM

私が最も重要だと思ったものと、Ciscoがその野心をさらに実現(xiàn)するための現(xiàn)在の取り組みにどのように構(gòu)築されるかを詳しく見てみましょう。

See all articles