Penjana kod AI memerlukan model besar yang boleh menguruskan tetingkap konteks yang lebih luas, dapat mengendalikan sekitar 100,000 baris kod. Campuran model pakar (MOE) yang direka untuk agensi dan penalaran AI juga cukup besar. Walau bagaimanapun, model -model besar -besaran ini cenderung agak mahal, dengan harga antara $ 10 hingga $ 15 per juta token output pada GPU semasa. Ini membentangkan pembukaan untuk seni bina AI yang inovatif untuk mencabar dominasi GPU.
Sistem Cerebras melancarkan Big AI dengan QWEN3-235B
Sistem Cerebras (pelanggan Cambrian-AI Research) telah memperkenalkan sokongan untuk model Qwen3-235B yang besar, yang menyokong panjang konteks 131K (kira-kira 200-300 halaman teks), empat kali sebelum ini. Di Sidang Kemuncak Raise di Paris, Cerebras menyerlahkan QWEN3-235B Alibaba, yang memanfaatkan senibina campuran yang sangat cekap untuk mencapai kecekapan pengiraan yang luar biasa. Walau bagaimanapun, kejayaan sebenar adalah bahawa Cerebras dapat mengendalikan model ini hanya pada $ 0.60 per juta token input dan per juta token output-kurang daripada sepersepuluh harga model tertutup yang sama. Walaupun ramai melihat enjin skala wafer cerebras sebagai mahal, data ini mencabar kepercayaan itu.
Soalan yang sering saya terima ialah: Jika cerebras begitu cepat, mengapa ia tidak mempunyai lebih banyak pelanggan? Salah satu sebabnya ialah ia tidak mempunyai sokongan untuk tingkap konteks yang besar dan model yang lebih besar. Pemaju yang ingin membuat kod tidak mahu memecahkan masalah menjadi serpihan yang lebih kecil agar sesuai, katakan, konteks 32KB. Sekarang, halangan jualan ini telah hilang.
"Kami melihat permintaan yang ketara daripada pemaju untuk model canggih dengan konteks lanjutan, terutamanya untuk penjanaan kod," kata Andrew Feldman, Ketua Pegawai Eksekutif dan pengasas Cerebras Systems. "Qwen3-235b pada Cerebras adalah model pertama kami yang bersaing secara langsung dengan model-model terkemuka seperti Claude 4 dan Deepseek R1 dan dengan konteks penuh 131k, pemaju kini boleh menggunakan cerebras untuk aplikasi pengekodan peringkat pengeluaran dan mendapatkan respons di bawah kedua dan menanti-nantikan GPU."
Cerebras telah meningkatkan panjang konteksnya yang disokong dari token 32K hingga 131K-memadankan maksimum yang disokong oleh QWEN3-235B. Peningkatan ini memberi kesan kepada keupayaan model untuk memproses codebase besar dan dokumentasi kompleks. Walaupun konteks 32K cukup untuk tugas penjanaan kod asas, konteks 131k membolehkan model untuk mengendalikan puluhan fail dan puluhan ribu baris kod, membolehkan pembangunan untuk aplikasi gred pengeluaran.
QWEN3-235B melakukan yang sangat baik dalam tugas-tugas yang menuntut penalaran logik yang mendalam, matematik lanjutan, dan penjanaan kod, terima kasih kepada keupayaannya untuk beralih antara "mod pemikiran" (untuk tugas-tugas kompleksiti tinggi) dan "mod tidak berfikir" (untuk dialog tujuan umum). Panjang konteks 131k memberi kuasa kepada model untuk menelan dan menganalisis kod besar (puluhan ribu baris), tugas sokongan seperti refactoring kod, dokumentasi, dan pengesanan pepijat.
Cerebras juga mendedahkan pertumbuhan lebih lanjut dalam ekosistemnya, mendapat sokongan dari Amazon AWS, Datarobot, Docker, Cline, dan tanggapan. Kemasukan AWS sangat penting;
Di manakah tajuk ini?
Big AI terus dikurangkan dan dioptimumkan, mencapai peningkatan yang signifikan dalam prestasi, pengurangan saiz model, dan kos berkurangan. Trend ini mungkin akan diteruskan tetapi akan diimbangi oleh peningkatan keupayaan, ketepatan, kecerdasan, dan ciri -ciri yang benar -benar baru di seluruh modaliti yang berbeza. Oleh itu, jika anda berpuas hati dengan AI tahun lepas, anda berada dalam keadaan baik kerana ia terus menjadi lebih murah.
Tetapi jika anda mencari ciri dan fungsi terkini, anda memerlukan model terbesar dan panjang konteks input terpanjang.
Ia adalah yin dan yang ai.
Atas ialah kandungan terperinci Siapa yang memerlukan model AI besar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

NotebookLM Google adalah alat pengambilan nota AI pintar yang dikuasakan oleh Gemini 2.5, yang cemerlang dalam meringkaskan dokumen. Walau bagaimanapun, ia masih mempunyai batasan penggunaan alat, seperti topi sumber, pergantungan awan, dan ciri "Discover" baru -baru ini

Mari kita menyelam ini. Sekeping ini menganalisis perkembangan terobosan di AI adalah sebahagian daripada liputan saya yang berterusan untuk Forbes mengenai landskap kecerdasan buatan yang berkembang, termasuk membongkar dan menjelaskan kemajuan dan kerumitan utama AI utama

Tetapi apa yang dipertaruhkan di sini bukan sekadar ganti rugi retroaktif atau pembayaran balik royalti. Menurut Yelena Ambartsumian, tadbir urus AI dan peguam IP dan pengasas Ambart Law PLLC, kebimbangan sebenar adalah berpandangan ke hadapan. "Saya fikir Disney dan Universal's MA

Melihat kemas kini dalam versi terkini, anda akan melihat bahawa Alphafold 3 memperluaskan keupayaan pemodelannya ke pelbagai struktur molekul yang lebih luas, seperti ligan (ion atau molekul dengan sifat mengikat tertentu), ion lain, dan apa yang refe

Menggunakan AI tidak sama dengan menggunakannya dengan baik. Ramai pengasas telah menemui ini melalui pengalaman. Apa yang bermula sebagai percubaan menjimatkan masa sering mewujudkan lebih banyak kerja. Pasukan akhirnya menghabiskan berjam-jam menyemak semula kandungan yang dihasilkan AI atau mengesahkan output

DIA adalah pengganti kepada arka penyemak imbas yang terdahulu. Pelayar telah menggantung pembangunan arka dan memberi tumpuan kepada DIA. Penyemak imbas itu dikeluarkan dalam beta pada hari Rabu dan dibuka kepada semua ahli ARC, sementara pengguna lain dikehendaki berada di senarai menunggu. Walaupun ARC telah menggunakan kecerdasan buatan banyak -seperti mengintegrasikan ciri -ciri seperti coretan web dan pratonton pautan -DIA dikenali sebagai "pelayar AI" yang memfokuskan hampir sepenuhnya pada AI generatif. Ciri-ciri Pelayar Dia yang paling menarik di Dia mempunyai persamaan dengan ciri penarikan balik kontroversial di Windows 11. Pelayar akan mengingati aktiviti terdahulu anda supaya anda boleh meminta AI

Space Company Voyager Technologies menaikkan hampir $ 383 juta semasa IPOnya pada hari Rabu, dengan saham yang ditawarkan pada $ 31. Firma itu menyediakan pelbagai perkhidmatan yang berkaitan dengan ruang kepada pelanggan dan pelanggan komersial, termasuk aktiviti di dalam

Berikut adalah sepuluh trend yang menarik yang membentuk semula landskap AI perusahaan. Komitmen kewangan untuk llmsorganizations secara signifikan meningkatkan pelaburan mereka di LLM, dengan 72% menjangkakan perbelanjaan mereka meningkat tahun ini. Pada masa ini, hampir 40% a
