


Melampaui SFT, rahsia di belakang O1/DeepSeek-R1 juga boleh digunakan dalam model besar multimodal
Mar 12, 2025 pm 01:03 PMPenyelidik dari Universiti Shanghai Jiaoto, Shanghai AI Lab dan Universiti Cina Hong Kong telah melancarkan projek sumber terbuka Visual-RFT (Visual Fine Fine Tuning), yang hanya memerlukan sedikit data untuk meningkatkan prestasi mockups bahasa visual (LVLM). Visual-RFT bijak menggabungkan pendekatan pembelajaran tetulang berasaskan peraturan DeepSeek-R1 dengan paradigma penalaan Fine-Penalaan Terbuka (RFT) OpenAI, berjaya memperluaskan pendekatan ini dari medan teks ke medan visual.
Dengan merancang ganjaran peraturan yang sepadan untuk tugas-tugas seperti subkategori visual dan pengesanan objek, Visual-RFT mengatasi batasan kaedah DeepSeek-R1 yang terhad kepada teks, penalaran matematik dan bidang lain, menyediakan cara baru untuk latihan LVLM.
Kelebihan Visual-RFT:
Berbanding dengan kaedah pengajaran visual tradisional (SFT), Visual-RFT mempunyai kelebihan penting berikut:
- Kurang keupayaan pembelajaran sampel: Hanya 10 hingga 1000 keping data boleh digunakan untuk mencapai penalaan yang berkesan.
- Generalisasi yang lebih kuat: Dalam senario dengan data terhad, prestasi lebih baik daripada SFT.
Para penyelidik mengesahkan Visual-RFT pada pelbagai tugas persepsi visual (pengesanan, klasifikasi, lokasi, dan lain-lain), dan hasilnya menunjukkan bahawa visual-RFT mencapai peningkatan prestasi yang signifikan dan pemindahan keupayaan yang mudah dicapai walaupun di bawah tetapan perbendaharaan kata terbuka dan pembelajaran sampel kecil.
Para penyelidik yang direka dengan ganjaran yang dapat disahkan untuk tugas-tugas yang berbeza: ganjaran berasaskan IOU digunakan untuk mengesan dan menempatkan tugas, dan ganjaran berasaskan klasifikasi yang dibenarkan digunakan untuk tugas klasifikasi.
Dalam tugas kedudukan kesimpulan, Visual-RFT menunjukkan keupayaan penalaran visual yang kuat, seperti dengan tepat mengenal pasti gelas kalis air yang perlu dipakai oleh atlet dalam gambar.
Hasil eksperimen:
Eksperimen berdasarkan model QWEN2-VL 2B/7B menunjukkan bahawa Visual-RFT lebih tinggi daripada SFT dalam pengesanan objek terbuka, pengesanan sampel kecil, klasifikasi halus dan tugas kedudukan kesimpulan. Walaupun anda mengesan watak anime tertentu (seperti lendir), Visual-RFT boleh dicapai dengan hanya sedikit data.
Maklumat Sumber Terbuka:
Projek Visual-RFT adalah sumber terbuka dan mengandungi latihan, kod penilaian dan data.
Alamat Projek: http://miracleart.cn/link/ec56522bc9c2e15be17d11962eeec453
Atas ialah kandungan terperinci Melampaui SFT, rahsia di belakang O1/DeepSeek-R1 juga boleh digunakan dalam model besar multimodal. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Sebagai pendekatan Julai 2025, pasaran crypto telah membincangkan token yang boleh membawa pulangan yang tinggi. Adakah nama seperti Pi, Pepe dan Floppypepe benar -benar bernilai pelaburan berisiko? Potensi kriptografi yang berpotensi memberi perhatian pada bulan Julai 2025: Kebakaran maya atau emas sebenar? Sebagai pertengahan tahun 2025, panas perbincangan mengenai aset crypto hasil tinggi terus memanaskan. Trend Bitcoin dan jangkaan "Altcoin Season" telah menarik perhatian pelabur. Adakah token seperti pinetwork, pepe dan floppypepe mempunyai potensi untuk membawa pulangan pelaburan yang besar? Mari kita menganalisis prospeknya satu demi satu. Pasar Altcoin: Bolehkah Julai mendapatkan apa yang mereka mahukan? Terhadap latar belakang rekod bitcoin yang dijangka tinggi, "musim altcoin" nampaknya menjadi pembuatan bir. Kembali

Kandungan 1. Apa itu ICN? 2. Kemas Kini Terkini ICNT 3. Perbandingan dan Model Ekonomi antara ICN dan Projek Depin dan Model Ekonomi lain 4. Kesimpulan dari peringkat seterusnya trek Depin pada akhir bulan Mei, ICN (ImpossibleCloudNetwork) @ICN_Protocol mengumumkan bahawa ia telah menerima pelaburan strategik dalam NGPCapital dengan penilaian AS $ 470 juta. Ramai reaksi pertama orang adalah: "Adakah Xiaomi melabur di Web3?" Walaupun ini bukan langkah langsung Lei Jun, orang yang bertaruh pada Xiaomi, Helium, dan Workfusion

Dalam era perkembangan teknologi yang pesat hari ini, integrasi kecerdasan buatan dan blockchain secara beransur -ansur menjadi trend baru. Projek Sahara Ai (Sahara) muncul, dan ia komited untuk mewujudkan platform blok-blok asli AI yang pertama, menjadikan masa depan kecerdasan buatan lebih mudah, adil dan adil, dan terbuka kepada semua orang.

Ripple mentakrifkan semula landskap masa depan industri kewangan dengan memohon lesen bank negara dan mempromosikan peranan baru XRP dalam ekonomi crypto. Menguasai trend terkini dan pemerhatian mendalam dan merebut peluang trend. Ekosistem cryptocurrency dalam evolusi pesat, dan riak dan aset digital XRP tidak diragukan lagi di tengah -tengah ribut. Satu siri tindakan yang dijalankan dalam sistem perbankan AS menarik perhatian yang meluas. Semua perkembangan ini seolah -olah menjadi drama kewangan sebenar, secara beransur -ansur bermula! Aspirasi industri perbankan Ripple adalah kira -kira kunci kepada Ketua Pegawai Eksekutif Ripple Brad Garlinghouse tidak lagi berpuas hati dengan sempadan fintech tradisional. Sebagai langkah utama dalam peningkatan strategik, Ripple

Bagaimanakah pengguna pemula memilih platform stablecoin yang selamat dan boleh dipercayai? Artikel ini mengesyorkan 10 platform stablecoin teratas pada tahun 2025, termasuk Binance, OKX, Bybit, Gate.io, HTX, Kucoin, Mexc, Bitget, Coinex dan Probit, dan membandingkan dan menganalisisnya dari dimensi seperti keselamatan, jenis stablecoin, pengalaman pengguna, struktur yuran dan fungsi tambahan. Data berasal dari Coingecko, Defillama dan penilaian komuniti. Adalah disyorkan bahawa orang baru memilih platform yang sangat mematuhi, mudah untuk beroperasi dan menyokong Cina, seperti Kucoin dan Coinex, dan secara beransur -ansur membina keyakinan melalui sebilangan kecil ujian.

Terhadap latar belakang turun naik kekerasan dalam pasaran cryptocurrency, permintaan pelabur untuk pemeliharaan aset menjadi semakin menonjol. Artikel ini bertujuan untuk menjawab bagaimana untuk melindung nilai risiko secara berkesan dalam lingkaran mata wang bergelora. Ia akan memperkenalkan secara terperinci konsep StableCoin, alat lindung nilai teras, dan menyediakan senarai Top3 StableCoins dengan menganalisis pilihan yang sangat diiktiraf semasa di pasaran. Artikel ini akan menjelaskan cara memilih dan menggunakan stablecoins ini mengikut keperluan mereka sendiri, untuk menguruskan risiko dengan lebih baik dalam persekitaran pasaran yang tidak menentu.

Artikel ini akan membincangkan stablecoins arus perdana di dunia dan menganalisis stablecoins yang mempunyai atribut keengganan risiko "pengganti emas" dalam kitaran ke bawah pasaran (Bear Market). Kami akan menerangkan bagaimana untuk menilai dan memilih alat penyimpanan nilai yang agak stabil dalam pasaran beruang dengan membandingkan nilai pasaran, mekanisme pengesahan, ketelusan, dan menggabungkan pandangan umum secara komprehensif di Internet, dan menerangkan proses analisis ini.

Terokai Remittix (RTX), Monero (XMR) dan trend crypto-fiat: Bagaimana projek-projek ini membentuk masa depan kriptografi melalui praktikal dan orientasi komuniti. Remittix, Monero dan Cryptocurrency Evolution: Apakah spekulasi terpanas? Pasaran crypto sentiasa dalam perubahan dinamik, dan projek -projek baru dan lama bersaing untuk perhatian pelabur. Pada masa ini, Remittix (RTX), Monero (XMR) dan arahan mata wang crypto-fiat menjadi tumpuan perbincangan. Mari kita ketahui apa daya penggerak di belakang gelombang populariti ini? Remittix: Tanda -tanda yang muncul dengan potensi yang muncul secara beransur -ansur mendapat perhatian pasaran, dan trajektori perkembangannya telah dibandingkan dengan peringkat awal Bitcoin dan Ethereum oleh beberapa orang. "Cryptor
