97久久综合亚洲色hezyo,公交车上～嗯啊被高潮

Rumah

pembangunan bahagian belakang

Tutorial Python

Cipta AI RAG Chatbot Anda Sendiri: Panduan Python dengan LangChain

Patricia Arquette

Oct 20, 2024 pm 02:15 PM

Siapa yang tidak mahu jawapan segera daripada dokumen mereka? Itulah yang dilakukan oleh bot sembang RAG—menggabungkan pengambilan semula dengan penjanaan AI untuk respons yang cepat dan tepat!

Dalam panduan ini, saya akan menunjukkan kepada anda cara membuat chatbot menggunakan Retrieval-Augmented Generation (RAG) dengan LangChain dan Streamlit. Chatbot ini akan menarik maklumat yang berkaitan daripada pangkalan pengetahuan dan menggunakan model bahasa untuk menjana respons.

Saya akan membimbing anda melalui setiap langkah, menyediakan berbilang pilihan untuk penjanaan respons, sama ada anda menggunakan OpenAI, Gemini atau Bunga Bunga—memastikan fleksibel dan penyelesaian kos efektif.

Apakah itu Penjanaan Dipertingkatkan (RAG)?

RAG ialah kaedah yang menggabungkan pendapatan semula dan penjanaan untuk menyampaikan respons chatbot yang lebih tepat dan peka konteks. Proses mendapatkan semula menarik dokumen yang berkaitan daripada pangkalan pengetahuan, manakala proses penjanaan menggunakan model bahasa untuk mencipta respons yang koheren berdasarkan kandungan yang diambil. Ini memastikan chatbot anda boleh menjawab soalan menggunakan data terbaharu, walaupun model bahasa itu sendiri belum dilatih secara khusus mengenai maklumat tersebut.

Bayangkan anda mempunyai pembantu peribadi yang tidak selalu tahu jawapan kepada soalan anda. Jadi, apabila anda bertanya soalan, mereka melihat melalui buku dan mencari maklumat yang relevan (pendapatan semula), kemudian mereka meringkaskan maklumat itu dan memberitahunya kembali kepada anda dalam perkataan mereka sendiri (generasi). Ini pada asasnya cara RAG berfungsi, menggabungkan yang terbaik dari kedua-dua dunia.

Dalam proses RAG Carta Alir akan kelihatan seperti ini:

Create Your Own AI RAG Chatbot: A Python Guide with LangChain

Sekarang, mari kita mulakan, dan dapatkan chatbot kita sendiri!

Menyediakan Persekitaran Projek

Kami akan menggunakan Python kebanyakannya dalam TUTO ini, jika anda ketua JS, anda boleh mengikuti penjelasan dan meneliti dokumentasi langchain js.

Pertama, kita perlu menyediakan persekitaran projek kita. Ini termasuk mencipta direktori projek, memasang kebergantungan dan menyediakan kunci API untuk model bahasa yang berbeza.

1. Cipta Folder Projek dan Persekitaran Maya

Mulakan dengan mencipta folder projek dan persekitaran maya:

mkdir rag-chatbot
cd rag-chatbot
python -m venv venv
source venv/bin/activate

2. Pasang Ketergantungan

Seterusnya, buat fail requirements.txt untuk menyenaraikan semua kebergantungan yang diperlukan:

langchain==0.0.329
streamlit==1.27.2
faiss-cpu==1.7.4
python-dotenv==1.0.0
tiktoken==0.5.1
openai==0.27.10
gemini==0.3.1
fireworks==0.4.0
sentence_transformers==2.2.2

Sekarang, pasang kebergantungan ini:

pip install -r requirements.txt

3. Menyediakan Kekunci API

Kami akan menggunakan OpenAI, Gemini atau Bunga Api untuk penjanaan respons chatbot. Anda boleh memilih mana-mana daripada ini berdasarkan keutamaan anda.

Jangan risau jika anda sedang bereksperimen, Fireworks menyediakan kunci API bernilai $1 secara percuma, dan model gemini-1.5-flash juga percuma sedikit sebanyak!

Sediakan fail .env untuk menyimpan kunci API untuk model pilihan anda:

mkdir rag-chatbot
cd rag-chatbot
python -m venv venv
source venv/bin/activate

Pastikan anda mendaftar untuk perkhidmatan ini dan dapatkan kunci API anda. Kedua-dua Gemini dan Bunga Api menawarkan peringkat percuma, manakala OpenAI mengenakan caj berdasarkan penggunaan.

Pemprosesan dan Pecahan Dokumen

Untuk memberikan konteks chatbot, kami perlu memproses dokumen dan membahagikannya kepada bahagian yang boleh diurus. Ini penting kerana teks yang besar perlu dipecahkan untuk dibenamkan dan pengindeksan.

1. Cipta document_processor.py

Buat skrip Python baharu yang dipanggil document_processor.py untuk mengendalikan pemprosesan dokumen:

langchain==0.0.329
streamlit==1.27.2
faiss-cpu==1.7.4
python-dotenv==1.0.0
tiktoken==0.5.1
openai==0.27.10
gemini==0.3.1
fireworks==0.4.0
sentence_transformers==2.2.2

Skrip ini memuatkan fail teks dan membahagikannya kepada ketulan yang lebih kecil iaitu kira-kira 1000 aksara dengan pertindihan kecil untuk memastikan tiada konteks hilang antara ketulan. Setelah diproses, dokumen sedia untuk dibenamkan dan diindeks.

Mencipta Pembenaman dan Pengindeksan

Sekarang dokumen kami telah dipotong, langkah seterusnya ialah menukarnya kepada benam (pewakilan berangka teks) dan mengindeksnya untuk mendapatkan semula dengan pantas. (kerana mesin memahami nombor lebih mudah daripada perkataan)

1. Cipta embedding_indexer.py

Buat skrip lain yang dipanggil embedding_indexer.py:

pip install -r requirements.txt

Dalam skrip ini, benam dibuat menggunakan model Muka Memeluk (semua-MiniLM-L6-v2). Kami kemudian menyimpan pembenaman ini dalam kedai vektor FAISS, yang membolehkan kami mendapatkan semula potongan teks yang serupa dengan cepat berdasarkan pertanyaan.

Melaksanakan Retrieval dan Penjanaan Respons

Inilah bahagian yang menarik: menggabungkan pencarian semula dengan penjanaan bahasa! Anda kini akan membuat rantaian RAG yang mengambil bahagian yang berkaitan daripada kedai vektor dan menjana respons menggunakan model bahasa. (vectorstore ialah pangkalan data tempat kami menyimpan data kami ditukar kepada nombor sebagai vektor)

1. Cipta rag_chain.py

Mari buat fail rag_chain.py:

# Uncomment your API key
# OPENAI_API_KEY=your_openai_api_key_here
# GEMINI_API_KEY=your_gemini_api_key_here
# FIREWORKS_API_KEY=your_fireworks_api_key_here

Di sini, kami memberi anda pilihan antara OpenAI, Gemini atau Bunga Api berdasarkan kunci API yang anda berikan. Rantaian RAG akan mendapatkan semula 3 dokumen paling relevan teratas dan menggunakan model bahasa untuk menjana respons.

Anda boleh bertukar antara model bergantung pada belanjawan atau pilihan penggunaan anda—Gemini dan Bunga Bunga adalah percuma, manakala OpenAI mengenakan caj berdasarkan penggunaan.

Membina Antara Muka Chatbot

Kini, kami akan membina antara muka bot sembang yang mudah untuk mengambil input pengguna dan menjana respons menggunakan rantaian RAG kami.

1. Cipta chatbot.py

Buat fail baharu yang dipanggil chatbot.py:

mkdir rag-chatbot
cd rag-chatbot
python -m venv venv
source venv/bin/activate

Skrip ini mencipta antara muka chatbot baris perintah yang mendengar input pengguna secara berterusan, memprosesnya melalui rantai RAG dan mengembalikan respons yang dijana.

Mencipta UI Streamlit

Sudah tiba masanya untuk menjadikan bot sembang anda lebih mesra pengguna dengan membina antara muka web menggunakan Streamlit. Ini akan membolehkan pengguna berinteraksi dengan chatbot anda melalui penyemak imbas.

1. Cipta app.py

Buat app.py:

langchain==0.0.329
streamlit==1.27.2
faiss-cpu==1.7.4
python-dotenv==1.0.0
tiktoken==0.5.1
openai==0.27.10
gemini==0.3.1
fireworks==0.4.0
sentence_transformers==2.2.2

2. Jalankan Apl Streamlit

Untuk menjalankan apl Streamlit anda, hanya gunakan:

pip install -r requirements.txt

Ini akan melancarkan antara muka web di mana anda boleh memuat naik fail teks, bertanya soalan dan menerima jawapan daripada chatbot.

Mengoptimumkan Prestasi

Untuk prestasi yang lebih baik, anda boleh bereksperimen dengan saiz ketulan dan bertindih apabila membelah teks. Ketulan yang lebih besar memberikan lebih banyak konteks, tetapi ketulan yang lebih kecil boleh membuat pengambilan lebih cepat. Anda juga boleh menggunakan Streamlit caching untuk mengelak daripada mengulangi operasi yang mahal seperti menjana benam.

Jika anda ingin mengoptimumkan kos, anda boleh bertukar antara OpenAI, Gemini atau Bunga Api bergantung pada kerumitan pertanyaan—gunakan OpenAI untuk soalan yang rumit dan Gemini atau Bunga Bunga untuk soalan yang lebih mudah untuk mengurangkan kos.

Membungkus

Tahniah! Anda telah berjaya mencipta chatbot berasaskan RAG anda sendiri. Kini, kemungkinannya tidak berkesudahan:

Buat rakan belajar peribadi anda sendiri.
Tiada lagi melalui dokumentasi yang panjang—hanya "RAG it out" untuk jawapan yang cepat dan tepat!

Perjalanan bermula di sini, dan potensinya tidak terhad!

Anda boleh mengikuti kerja saya di GitHub. Jangan ragu untuk menghubungi—DM saya sentiasa terbuka di X dan LinkedIn.

Atas ialah kandungan terperinci Cipta AI RAG Chatbot Anda Sendiri: Panduan Python dengan LangChain. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undress AI Tool

Gambar buka pakaian secara percuma

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Panduan: bilah bintang simpan fail lokasi/simpan fail hilang/tidak menyimpan

4 minggu yang lalu By DDD

Oguri Cap Build Guide | Musume Derby Pretty

2 minggu yang lalu By Jack chen

Agnes Tachyon Build Guide | Musume Derby Pretty

1 minggu yang lalu By Jack chen

Dune: Awakening - Lanjutan Planetologist Quest Walkthrough

3 minggu yang lalu By Jack chen

Tarikh Segala -galanya: Panduan Hubungan Dirk dan Harper

4 minggu yang lalu By Jack chen

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

8637

Tutorial Java

1783

Tutorial CakePHP

1727

Tutorial Laravel

1577

Tutorial PHP

1442

Tunjukkan Lagi

Related knowledge

Bagaimanakah rangka kerja Python atau PyTest memudahkan ujian automatik? Jun 19, 2025 am 01:10 AM

Python's Unittest and Pytest adalah dua kerangka ujian yang digunakan secara meluas yang memudahkan penulisan, penganjuran dan menjalankan ujian automatik. 1. Kedua -duanya menyokong penemuan automatik kes ujian dan menyediakan struktur ujian yang jelas: Unittest mentakrifkan ujian dengan mewarisi kelas ujian dan bermula dengan ujian \ _; Pytest lebih ringkas, hanya memerlukan fungsi bermula dengan ujian \ _. 2. Mereka semua mempunyai sokongan dakwaan terbina dalam: Unittest menyediakan kaedah AssertEqual, AssertTrue dan lain-lain, manakala PYTest menggunakan pernyataan menegaskan yang dipertingkatkan untuk memaparkan butiran kegagalan secara automatik. 3. Semua mempunyai mekanisme untuk mengendalikan penyediaan ujian dan pembersihan: un

Bagaimanakah Python boleh digunakan untuk analisis data dan manipulasi dengan perpustakaan seperti numpy dan panda? Jun 19, 2025 am 01:04 AM

Pythonisidealfordataanalysisysisduetonumpyandpandas.1) numpyexcelsatnumericalcomputationswithfast, multi-dimensiArarraySandvectorizedoperationsLikenp.sqrt ()

Apakah teknik pengaturcaraan dinamik, dan bagaimana saya menggunakannya dalam Python? Jun 20, 2025 am 12:57 AM

Pengaturcaraan Dinamik (DP) mengoptimumkan proses penyelesaian dengan memecahkan masalah kompleks ke dalam subproblem yang lebih mudah dan menyimpan hasilnya untuk mengelakkan pengiraan berulang. Terdapat dua kaedah utama: 1. Top-down (Hafalan): Recursif menguraikan masalah dan menggunakan cache untuk menyimpan hasil pertengahan; 2. Bottom-Up (Jadual): Bangun secara beransur-ansur dari keadaan asas. Sesuai untuk senario di mana nilai maksimum/minimum, penyelesaian optimum atau subproblem yang bertindih diperlukan, seperti urutan Fibonacci, masalah backpacking, dan lain -lain.

Bagaimana anda boleh melaksanakan iterators tersuai di Python menggunakan __iter__ dan __Next__? Jun 19, 2025 am 01:12 AM

Untuk melaksanakan iterator tersuai, anda perlu menentukan kaedah __iter__ dan __Next__ di dalam kelas. ① Kaedah __iter__ mengembalikan objek iterator itu sendiri, biasanya diri sendiri, bersesuaian dengan persekitaran berulang seperti untuk gelung; ② Kaedah __Next__ mengawal nilai setiap lelaran, mengembalikan elemen seterusnya dalam urutan, dan apabila tidak ada lagi item, pengecualian hentian harus dibuang; ③ Status mesti dikesan dengan betul dan keadaan penamatan mesti ditetapkan untuk mengelakkan gelung tak terhingga; ④ Logik kompleks seperti penapisan talian fail, dan perhatikan pembersihan sumber dan pengurusan memori; ⑤ Untuk logik mudah, anda boleh mempertimbangkan menggunakan hasil fungsi penjana sebaliknya, tetapi anda perlu memilih kaedah yang sesuai berdasarkan senario tertentu.

Apakah trend yang muncul atau arahan masa depan dalam bahasa pengaturcaraan Python dan ekosistemnya? Jun 19, 2025 am 01:09 AM

Trend masa depan dalam Python termasuk pengoptimuman prestasi, jenis yang lebih kuat, peningkatan runtime alternatif, dan pertumbuhan berterusan bidang AI/ML. Pertama, Cpython terus mengoptimumkan, meningkatkan prestasi melalui masa permulaan yang lebih cepat, pengoptimuman panggilan fungsi dan operasi integer yang dicadangkan; Kedua, jenis petikan sangat terintegrasi ke dalam bahasa dan alat untuk meningkatkan pengalaman keselamatan dan pembangunan kod; Ketiga, runtime alternatif seperti Pyscript dan Nuitka menyediakan fungsi baru dan kelebihan prestasi; Akhirnya, bidang AI dan Sains Data terus berkembang, dan perpustakaan yang muncul mempromosikan pembangunan dan integrasi yang lebih cekap. Trend ini menunjukkan bahawa Python sentiasa menyesuaikan diri dengan perubahan teknologi dan mengekalkan kedudukan utama.

Bagaimana saya melakukan pengaturcaraan rangkaian di python menggunakan soket? Jun 20, 2025 am 12:56 AM

Modul soket Python adalah asas pengaturcaraan rangkaian, menyediakan fungsi komunikasi rangkaian peringkat rendah, sesuai untuk membina aplikasi klien dan pelayan. Untuk menyediakan pelayan TCP asas, anda perlu menggunakan socket.socket () untuk membuat objek, mengikat alamat dan port, panggilan. Listen () untuk mendengar sambungan, dan menerima sambungan klien melalui .accept (). Untuk membina klien TCP, anda perlu membuat objek soket dan panggilan .Connect () untuk menyambung ke pelayan, kemudian gunakan .sendall () untuk menghantar data dan .recv () untuk menerima respons. Untuk mengendalikan pelbagai pelanggan, anda boleh menggunakan 1. Threads: Mulakan benang baru setiap kali anda menyambung; 2. Asynchronous I/O: Sebagai contoh, Perpustakaan Asyncio dapat mencapai komunikasi yang tidak menyekat. Perkara yang perlu diperhatikan

Bagaimana saya mengiris senarai dalam python? Jun 20, 2025 am 12:51 AM

Jawapan teras kepada pengirim senarai Python adalah menguasai sintaks [Start: End: Step] dan memahami kelakuannya. 1. Format asas pengirim senarai adalah senarai [Mula: akhir: langkah], di mana permulaan adalah indeks permulaan (termasuk), akhir adalah indeks akhir (tidak termasuk), dan langkah adalah saiz langkah; 2. Omit Mula secara lalai bermula dari 0, endek akhir secara lalai hingga akhir, omite langkah secara lalai kepada 1; 3. Gunakan my_list [: n] untuk mendapatkan item n pertama, dan gunakan my_list [-n:] untuk mendapatkan item n yang terakhir; 4. Gunakan langkah untuk melangkau unsur -unsur, seperti my_list [:: 2] untuk mendapatkan angka, dan nilai langkah negatif dapat membalikkan senarai; 5. Kesalahpahaman biasa termasuk indeks akhir tidak

Polimorfisme dalam kelas python Jul 05, 2025 am 02:58 AM

Polimorfisme adalah konsep teras dalam pengaturcaraan berorientasikan objek Python, merujuk kepada "satu antara muka, pelbagai pelaksanaan", yang membolehkan pemprosesan bersatu pelbagai jenis objek. 1. Polimorfisme dilaksanakan melalui penulisan semula kaedah. Subkelas boleh mentakrifkan semula kaedah kelas induk. Sebagai contoh, kaedah bercakap () kelas haiwan mempunyai pelaksanaan yang berbeza dalam subkelas anjing dan kucing. 2. Penggunaan praktikal polimorfisme termasuk memudahkan struktur kod dan meningkatkan skalabilitas, seperti memanggil kaedah cabutan () secara seragam dalam program lukisan grafik, atau mengendalikan tingkah laku umum watak -watak yang berbeza dalam pembangunan permainan. 3. Polimorfisme pelaksanaan Python perlu memenuhi: Kelas induk mentakrifkan kaedah, dan kelas kanak -kanak mengatasi kaedah, tetapi tidak memerlukan warisan kelas induk yang sama. Selagi objek melaksanakan kaedah yang sama, ini dipanggil "jenis itik". 4. Perkara yang perlu diperhatikan termasuk penyelenggaraan

See all articles

国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

Cipta AI RAG Chatbot Anda Sendiri: Panduan Python dengan LangChain

Apakah itu Penjanaan Dipertingkatkan (RAG)?

Menyediakan Persekitaran Projek

1. Cipta Folder Projek dan Persekitaran Maya

2. Pasang Ketergantungan

3. Menyediakan Kekunci API

Pemprosesan dan Pecahan Dokumen

1. Cipta document_processor.py

Mencipta Pembenaman dan Pengindeksan

1. Cipta embedding_indexer.py

Melaksanakan Retrieval dan Penjanaan Respons

1. Cipta rag_chain.py

Membina Antara Muka Chatbot

1. Cipta chatbot.py

Mencipta UI Streamlit

1. Cipta app.py

2. Jalankan Apl Streamlit

Mengoptimumkan Prestasi

Membungkus

Alat AI Hot

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

Artikel Panas

Alat panas

Notepad++7.3.1

SublimeText3 versi Cina

Hantar Studio 13.0.1

Dreamweaver CS6

SublimeText3 versi Mac

Topik panas