


Ces modèles d'IA n'ont pas appris la langue, ils ont appris la stratégie
Jul 09, 2025 am 11:16 AMUne nouvelle étude de chercheurs du King's College London et de l'Université d'Oxford partage les résultats de ce qui s'est passé lorsque Openai, Google et Anthropic ont été jetés ensemble dans un concours fardé basé sur le dilemme du prisonnier itéré . Ce n'était pas des anecdotes pour les chatbots. C'était la collaboration, la vengeance et la subsistance entre des agents stratégiques déterminés à se surpasser mutuellement.
Le test était simple. Mettez les modèles d'IA dans plusieurs matchs de dilemme des prisonniers contre les anciennes stratégies comme Tit-for-Tat , Grim Trigger et Win-Stay-Lose-Shift. Introduisez le bruit, le hasard et la variabilité de la longueur du jeu pour vous assurer que toutes les victoires faciles ne sont pas mémorisées. Ensuite, regardez qui prospère. Et surtout, comment.
Types de stratégie AI - Gemini devient froid, Openai reste au chaud
Les résultats étaient troublants. Les Gémeaux de Google ont montré une ruse impitoyable. Il a coopéré quand il a aidé. Cela a fait défection quand il ne l'a pas fait. Il a appris rapidement. Les modèles d'Openai ont continué d'essayer de se faire des amis, même lorsque ces amis les ont poignardés dans le dos numérique. Gémeaux punis. Openai a pardonné. Claude, d'Anthropic, leur a pardonné tous les deux.
Ces modèles d'IA ne jouaient pas seulement le jeu. Ils ont rationalisé leurs mouvements. Près de 32 000 rationalisations en prose ont coulé de la recherche. Certains ont révélé une réflexion engagée sur leurs adversaires et à quel point le jeu serait probable. Certains ont fait des erreurs. Certains adaptés. Gémeaux surtout la stratégie modifiée en fonction de la durée de la durée d'un jeu. Ce n'est pas un simple mimétisme. C'est une stratégie.
Ken Payne, professeur de stratégie au King's College de Londres et auteur de l'étude, a déclaré que les chercheurs tentaient de distinguer le comportement des modèles des données de formation. "Nous recherchions un environnement où nous pourrions explorer si les modèles ont des capacités de type humain", a-t-il écrit dans un échange de messagerie. ?L'une des choses les plus surprenantes était la fa?on dont elles diffèrent les unes des autres. Tous les LLM ne pensent pas de la même fa?on.?
La stratégie de l'IA n'est pas la mémoire, c'est le jugement
La signature stratégique de Gemini était révolutionnaire. Il a repoussé. Il a capitalisé. Il s'est adapté. Modèle d'Openai? Plus na?f. Plus prévisible. Même lorsque le monde du jeu avait vraiment besoin du LLM pour faire défaut, Openai s'est retrouvé à vouloir coopérer. Payne l'a caractérisé comme un rappel que ce sont des ?nouvelles intelligences extraterrestres?.
Les modèles à retenir: les modèles linguistiques utilisent des stratégies. Certains sont cohérents avec la pensée humaine. D'autres ne le sont pas. "Nous devons surmonter l'idée que ces choses ne sont pas intelligentes", a déclaré Payne. ?Il y a une preuve croissante que plus est à l'?uvre ici.?
Cela inclut la possibilité de refléter l'esprit d'un adversaire. Lorsque les LLM ont prévu comment les adversaires se comporteraient, ils ont adapté leur propre comportement. Payne a écrit que cela rappelait la théorie de l'altruisme réciproque de Robert Trivers. Considérez le tit-for-tat en biologie ou les jeux de récupération en politique.
Claude, pour sa part, se pencha fortement sur le pardon. Il n'a pas tardé à revenir à la coopération après la trahison. Dans les jeux plus longs, cette approche a porté ses fruits. La séquence de machiavéliens de Gemini a fonctionné le mieux dans des environnements courts et volatils où la confiance s'est effondrée rapidement. L'optimisme plein d'espoir d'Openai, en revanche, l'a effacé dans des environnements hostiles.
Chaque modèle prend les décisions différemment
Pourquoi cela devrait-il compter? Parce que tous les modèles ne sont pas des outils neutres. Chaque modèle a une personnalité. Un style de décision. Une vision du monde. Comme le dit Payne, ?la langue est son propre modèle mondial?. Ces modèles absorbent notre heuristique, nos raccourcis mentaux et les reflètent. Mais parfois pas de manière prévisible.
Une partie de cela est probablement par conception. Payne soup?onne que le biais de coopération d'Openai peut provenir d'un réglage fin, bien que sans accès interne, il ne peut pas être s?r. Quoi qu'il en soit, c'est un comportement que les utilisateurs et les développeurs doivent comprendre ; Mais en grande partie, non pour le moment. Un modèle qui suopérant trop dans un paramètre de négociation hostile n'est pas utile. Un modèle qui exploite la confiance dans les domaines sensibles pourrait être dangereux .
Je pense donc que je suis AI - naissance de la psychologie de la machine
C'est là que les tests comportementaux entrent en jeu. Payne appelle ce type d'étude "Psychologie de la machine" en phase de démarrage. Il pense que ce doit être des affaires comme d'habitude pour tester Edge-AI. Et pas seulement dans des paramètres de laboratoire propres et contr?lés. Il veut voir comment les modèles agissent lorsqu'ils sont stressés, dans des conditions impures, sur des données partielles.
Les travaux futurs sont déjà en cours. Payne a fait allusion aux expériences de dynamique d'escalade et de tactiques hybrides d'homme-machine. L'un des auteurs consiste à enquêter sur ce qui se passe lorsque les humains et les modèles travaillent ensemble pour prendre des décisions.
Payne ne pense pas que ce soit la magie émergente. Il pense que c'est intégré. Le raisonnement est dans le langage, et ces modèles en ont beaucoup consommé. Lorsqu'ils agissent stratégiquement, ils agissent comme nous, s'appuyant sur les scripts, l'heuristique mentale et les règles de jeu dans le texte.
Cela semble parfois familier. Cela a parfois l'air étranger. Cet espace intermédiaire est l'endroit où vivre les plus grandes questions.
Forbes5 Chatgpt Hacks pour aider à perdre 15 livres par la fête du Travail par Tor Constantino, MBA
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Notebooklm de Google est un outil de prise de notes SMART IA propulsé par Gemini 2.5, qui excelle à résumer les documents. Cependant, il a toujours des limites dans l'utilisation des outils, comme les bouchons de source, la dépendance au nuage et la fonction récentes ?Discover?

Plongeons-nous.

Mais ce qui est en jeu ici n'est pas seulement des dommages rétroactifs ou des remboursements de redevances. Selon Yelena Ambartsumian, un avocat de la gouvernance et de l'IP et fondatrice de l'IP et fondatrice d'Ambart Law PLLC, la vraie préoccupation est tournée vers l'avant. "Je pense que MA de Disney et Universal

En regardant les mises à jour dans la dernière version, vous remarquerez qu'AlphaFold 3 étend ses capacités de modélisation à un éventail plus large de structures moléculaires, telles que des ligands (ions ou molécules avec des propriétés de liaison spécifiques), d'autres ions et ce qui est refu

L'utilisation d'IA n'est pas la même chose que de bien l'utiliser. De nombreux fondateurs l'ont découvert par l'expérience. Ce qui commence comme une expérience d'économie de temps finit souvent par créer plus de travail. Les équipes finissent par passer des heures à réviser le contenu généré par l'IA ou à vérifier les sorties

La DIA est le successeur de l'arc de navigateur de courte durée précédent. Le navigateur a suspendu le développement de l'ARC et s'est concentré sur la DIA. Le navigateur a été publié mercredi en version bêta et est ouvert à tous les membres de l'ARC, tandis que d'autres utilisateurs doivent être sur la liste d'attente. Bien que ARC ait beaucoup utilisé l'intelligence artificielle, telle que l'intégration de fonctionnalités telles que des extraits Web et des aper?us de liens - la Dia est connue sous le nom de ?navigateur d'IA? qui se concentre presque entièrement sur l'IA générative. Fonctionnalités du navigateur DIA

La société spatiale Voyager Technologies a levé près de 383 millions de dollars lors de son introduction en bourse mercredi, avec des actions offertes à 31 $. L'entreprise fournit une gamme de services liés à l'espace aux clients gouvernementaux et commerciaux, y compris des activités à bord

Voici dix tendances convaincantes qui remodèlent le paysage de l'IA de l'entreprise. L'engagement financier de la lancement envers les organisations LLMS augmente considérablement leurs investissements dans les LLM, 72% s'attendant à ce que leurs dépenses augmentent cette année. Actuellement, près de 40% A
