Sebuah stud baru dari penyelidik di King's College London dan University of Oxford berkongsi hasil apa yang berlaku ketika Openai, Google dan Anthropic dibuang bersama dalam pertandingan cutthroat berdasarkan dilema banduan berulang . Ini bukan perkara biasa untuk chatbots. Ini adalah kerjasama, dendam, dan sara hidup antara agen strategik yang ditentukan untuk mengalahkan satu sama lain.
Ujiannya mudah. Letakkan model AI dalam beberapa permainan dilema banduan menentang strategi lama seperti Tit-for-Tat , pencetus suram dan menang-k-kalah. Memperkenalkan bunyi bising, rawak dan permainan panjang untuk memastikan sebarang kemenangan mudah tidak diingati. Kemudian tonton siapa yang berkembang maju. Dan yang paling penting, bagaimana.
Jenis Strategi AI - Gemini bertukar sejuk, terbuka tetap hangat
Hasilnya tidak menentu. Gemini Google menunjukkan licik kejam. Ia bekerjasama apabila ia membantu. Ia dibantah apabila tidak. Ia belajar dengan cepat. Model Openai terus berusaha untuk berteman, walaupun rakan -rakan itu menikam mereka di belakang digital. Gemini dihukum. Openai memaafkan. Claude, dari antropik, memaafkan mereka berdua.
Model AI ini tidak hanya bermain permainan. Mereka merasionalisasikan langkah mereka. Hampir 32,000 rasionalisasi prosa yang dituangkan dari penyelidikan. Ada yang mendedahkan pemikiran tentang lawan mereka dan bagaimana kemungkinan permainan itu akan bertahan. Ada yang membuat kesilapan. Ada yang disesuaikan. Gemini kebanyakan strategi yang diubah berdasarkan berapa lama ia menjangkakan permainan berjalan. Itu bukan semata -mata meniru. Yang strategi.
Ken Payne, seorang profesor strategi di King's College London dan pengarang kajian itu, mengatakan bahawa para penyelidik cuba membezakan tingkah laku model dari data latihan. "Kami sedang mencari persekitaran di mana kita dapat meneroka sama ada model mempunyai kebolehan seperti manusia," tulisnya dalam pertukaran e-mel. "Salah satu perkara yang paling mengejutkan adalah bagaimana mereka berbeza antara satu sama lain. Tidak semua LLMs berfikir sama."
Strategi AI bukan ingatan, itu penghakiman
Tandatangan strategik Gemini adalah revolusioner. Ia ditolak. Ia memanfaatkan. Ia disesuaikan. Model Openai? Lebih naif. Lebih diramalkan. Walaupun dunia permainan benar -benar memerlukan LLM untuk kecacatan, Openai mendapati dirinya mahu bekerjasama. Payne mencirikannya sebagai peringatan bahawa ini adalah "novel, kecerdasan asing."
The Takeaway: Model bahasa menggunakan strategi. Ada yang konsisten dengan pemikiran manusia. Yang lain tidak. "Kita perlu mengatasi idea bahawa perkara -perkara ini tidak bijak," kata Payne. "Terdapat bukti yang semakin meningkat yang lebih banyak bekerja di sini."
Ini termasuk keupayaan untuk mencerminkan minda lawan. Apabila LLM meramalkan bagaimana lawan akan berkelakuan, mereka menyesuaikan tingkah laku mereka sendiri. Payne menulis bahawa ia mengingatkan teori altruisme timbal balik Robert Trivers. Pertimbangkan tit-for-tat dalam biologi atau permainan pembayaran balik reputasi dalam politik.
Claude, untuk bahagiannya, bersandar banyak ke dalam pengampunan. Ia cepat kembali ke kerjasama selepas pengkhianatan. Dalam permainan yang lebih lama, pendekatan itu terbayar. Streak Machiavellian Gemini bekerja dengan baik dalam tetapan yang pendek dan tidak menentu di mana amanah rosak dengan cepat. Sebaliknya, optimisme yang diharapkan Openai dapat dihapuskan dalam persekitaran yang bermusuhan.
Setiap model membuat keputusan secara berbeza
Mengapa perkara ini mesti berlaku? Kerana tidak semua model adalah alat neutral. Setiap model mempunyai keperibadian. Gaya keputusan. Pandangan dunia. Seperti kata Payne, "Bahasa adalah model dunia sendiri." Model -model ini menyerap heuristik kita, pintasan mental kita dan mencerminkan mereka kembali. Tetapi kadang -kadang tidak dengan cara yang boleh diramal.
Sebahagian daripada ini mungkin dengan reka bentuk. Payne mengesyaki kecenderungan kerjasama Openai mungkin berpunca dari penalaan halus, walaupun tanpa akses dalaman dia tidak pasti. Walau apa pun, tingkah laku pengguna dan pemaju perlu memahami ; Tetapi sebahagian besarnya tidak pada masa ini. Model yang mengoperasi lebih banyak dalam suasana rundingan yang bermusuhan tidak membantu. Model yang mengeksploitasi kepercayaan dalam domain sensitif mungkin berbahaya .
Oleh itu, saya fikir saya AI - Kelahiran Psikologi Mesin
Di sinilah ujian tingkah laku masuk. Payne memanggil jenis kajian ini "psikologi mesin." Dia fikir ia harus menjadi perniagaan-seperti-biasa untuk menguji Edge-ai. Dan bukan hanya dalam tetapan makmal yang bersih dan terkawal. Dia mahu melihat bagaimana model bertindak apabila ditekankan, dalam keadaan najis, pada data separa.
Kerja masa depan sudah dijalankan. Payne mengisyaratkan eksperimen dalam dinamik peningkatan dan taktik mesin hibrid. Salah satu penulis sedang menyiasat apa yang berlaku apabila manusia dan model bekerjasama untuk membuat keputusan.
Payne tidak fikir ini adalah sihir muncul. Dia fikir ia tertanam. Penalaran adalah dalam bahasa, dan model -model ini telah banyak menggunakannya. Apabila mereka bertindak secara strategik, mereka bertindak seperti yang kita lakukan, bergantung kepada skrip, heuristik mental, dan peraturan-peraturan yang dibakar ke dalam teks.
Ia kadang -kadang kelihatan biasa. Ia kadang -kadang kelihatan asing. Ruang tengah itu adalah di mana soalan terbesar sekarang hidup.
Forbes5 Chatgpt Hacks Untuk membantu kehilangan 15 paun oleh Hari Buruh oleh Tor Constantino, MBA
Atas ialah kandungan terperinci Model AI ini tidak belajar bahasa, mereka belajar strategi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

NotebookLM Google adalah alat pengambilan nota AI pintar yang dikuasakan oleh Gemini 2.5, yang cemerlang dalam meringkaskan dokumen. Walau bagaimanapun, ia masih mempunyai batasan penggunaan alat, seperti topi sumber, pergantungan awan, dan ciri "Discover" baru -baru ini

Mari kita menyelam ini. Sekeping ini menganalisis perkembangan terobosan di AI adalah sebahagian daripada liputan saya yang berterusan untuk Forbes mengenai landskap kecerdasan buatan yang berkembang, termasuk membongkar dan menjelaskan kemajuan dan kerumitan utama AI utama

Tetapi apa yang dipertaruhkan di sini bukan sekadar ganti rugi retroaktif atau pembayaran balik royalti. Menurut Yelena Ambartsumian, tadbir urus AI dan peguam IP dan pengasas Ambart Law PLLC, kebimbangan sebenar adalah berpandangan ke hadapan. "Saya fikir Disney dan Universal's MA

Melihat kemas kini dalam versi terkini, anda akan melihat bahawa Alphafold 3 memperluaskan keupayaan pemodelannya ke pelbagai struktur molekul yang lebih luas, seperti ligan (ion atau molekul dengan sifat mengikat tertentu), ion lain, dan apa yang refe

Menggunakan AI tidak sama dengan menggunakannya dengan baik. Ramai pengasas telah menemui ini melalui pengalaman. Apa yang bermula sebagai percubaan menjimatkan masa sering mewujudkan lebih banyak kerja. Pasukan akhirnya menghabiskan berjam-jam menyemak semula kandungan yang dihasilkan AI atau mengesahkan output

DIA adalah pengganti kepada arka penyemak imbas yang terdahulu. Pelayar telah menggantung pembangunan arka dan memberi tumpuan kepada DIA. Penyemak imbas itu dikeluarkan dalam beta pada hari Rabu dan dibuka kepada semua ahli ARC, sementara pengguna lain dikehendaki berada di senarai menunggu. Walaupun ARC telah menggunakan kecerdasan buatan banyak -seperti mengintegrasikan ciri -ciri seperti coretan web dan pratonton pautan -DIA dikenali sebagai "pelayar AI" yang memfokuskan hampir sepenuhnya pada AI generatif. Ciri-ciri Pelayar Dia yang paling menarik di Dia mempunyai persamaan dengan ciri penarikan balik kontroversial di Windows 11. Pelayar akan mengingati aktiviti terdahulu anda supaya anda boleh meminta AI

Space Company Voyager Technologies menaikkan hampir $ 383 juta semasa IPOnya pada hari Rabu, dengan saham yang ditawarkan pada $ 31. Firma itu menyediakan pelbagai perkhidmatan yang berkaitan dengan ruang kepada pelanggan dan pelanggan komersial, termasuk aktiviti di dalam

Berikut adalah sepuluh trend yang menarik yang membentuk semula landskap AI perusahaan. Komitmen kewangan untuk llmsorganizations secara signifikan meningkatkan pelaburan mereka di LLM, dengan 72% menjangkakan perbelanjaan mereka meningkat tahun ini. Pada masa ini, hampir 40% a
