


Dépassant considérablement la SFT, le secret derrière O1 / Deepseek-R1 peut également être utilisé dans les grands modèles multimodaux
Mar 12, 2025 pm 01:03 PMDes chercheurs de l'Université de Shanghai Jiaotong, de Shanghai AI Lab et de l'Université chinoise de Hong Kong ont lancé le projet open source visual-RFT (visual d'amélioration), qui ne nécessite qu'une petite quantité de données pour améliorer considérablement les performances des mockups du langage visuel (LVLM). Visual-RFT combine intelligemment l'approche d'apprentissage en renforcement basée sur les règles de Deepseek-R1 avec le paradigme de relachement de renforcement d'OpenAI (RFT), prolongeant avec succès cette approche du champ de texte au champ visuel.
En concevant les récompenses de règles correspondantes pour des taches telles que la sous-catégorisation visuelle et la détection d'objets, Visual-RFT surmonte les limites de la méthode Deepseek-R1 limitée au texte, au raisonnement mathématique et à d'autres domaines, fournissant une nouvelle fa?on de formation LVLM.
Avantages de Visual-RFT:
Par rapport aux méthodes de réglage de réglage des instructions visuelles traditionnelles (SFT), Visual-RFT présente les avantages significatifs suivants:
- Moins d'échantillons d'apprentissage: seulement 10 à 1000 données peuvent être utilisées pour atteindre un réglage fin efficace.
- Généralisation plus forte: dans les scénarios avec des données limitées, les performances sont meilleures que SFT.
Les chercheurs ont vérifié la RFT visuelle sur plusieurs taches de perception visuelle (détection, classification, emplacement, etc.), et les résultats ont montré que le RFT visuel a réalisé des améliorations de performances significatives et facilement un transfert de capacités, même dans les milieux du vocabulaire ouvert et de l'apprentissage de petits échantillons.
Les chercheurs ont con?u des récompenses vérifiables correspondantes pour différentes taches: des récompenses basées sur l'IOU sont utilisées pour les taches de détection et de positionnement, et les récompenses basées sur l'exactitude de la classification sont utilisées pour les taches de classification.
Dans la tache de positionnement d'inférence, Visual-RFT montre de fortes capacités de raisonnement visuel, comme l'identification avec précision de lunettes imperméables que les athlètes doivent porter en images.
Résultats expérimentaux:
Des expériences basées sur le modèle QWEN2-VL 2B / 7B montrent que Visual-RFT est supérieur à SFT dans la détection d'objets ouverts, la détection de petits échantillons, la classification à grains fins et les taches de positionnement d'inférence. Même si vous détectez un caractère d'anime spécifique (comme Slime), Visual-RFT peut être réalisé avec juste une petite quantité de données.
Informations open source:
Le projet Visual-RFT est open source et contient une formation, un code d'évaluation et des données.
Adresse du projet: http://miracleart.cn/link/ec56522bc9c2e15be17d11962eeec453
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undress AI Tool
Images de déshabillage gratuites

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
échangez les visages dans n'importe quelle vidéo sans effort grace à notre outil d'échange de visage AI entièrement gratuit?!

Article chaud

Outils chauds

Bloc-notes++7.3.1
éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Dans le contexte des fluctuations violentes sur le marché des crypto-monnaies, la demande des investisseurs de préservation des actifs devient de plus en plus importante. Cet article vise à répondre à la manière de couvrir efficacement les risques dans le cercle de monnaie turbulent. Il introduira en détail le concept de stablecoin, un outil de couverture de base, et fournira une liste de stablescoins TOP3 en analysant les options très reconnues actuelles sur le marché. L'article expliquera comment sélectionner et utiliser ces stablescoins en fonction de leurs propres besoins, afin de mieux gérer les risques dans un environnement de marché incertain.

Cet article discutera des stablescoins mondiaux et analysera les stablescoins qui ont l'attribut d'aversion au risque du "substitut d'or" dans le cycle à la baisse du marché (marché baissier). Nous expliquerons comment juger et choisir un outil de stockage de valeur relativement stable dans un marché baissier en comparant la valeur marchande, le mécanisme d'approbation, la transparence et la combinaison de vues communes sur Internet, et expliquer ce processus d'analyse.

Au fur et à mesure que les conditions du marché accélèrent, de plus en plus d'investisseurs intelligents ont commencé à augmenter tranquillement leurs positions dans le cercle des devises. Beaucoup de gens se demandent ce qui les fait prendre de manière décisive lorsque la plupart des gens attendent et voient? Cet article analysera les tendances actuelles à travers des données sur la cha?ne pour aider les lecteurs à comprendre la logique des fonds intelligents, afin de mieux saisir la prochaine série de possibilités de croissance potentielle de la richesse.

Cet article introduira plusieurs stablescoins grand public et expliquera en profondeur comment évaluer la sécurité d'un stablecoin à partir de plusieurs dimensions telles que la transparence et la conformité, afin de vous aider à comprendre quelles étalines sont généralement considérées comme des choix relativement fiables sur le marché, et à apprendre à juger vous-même leurs attributs "de danger".

Récemment, Bitcoin a frappé un nouveau sommet, Dogecoin a inauguré un fort rebond et le marché était chaud. Ensuite, nous analyserons les moteurs du marché et les aspects techniques pour déterminer si Ethereum a toujours des opportunités de suivre la montée.

Les pièces de monnaie stables maintiennent la stabilité des prix en ancrant les monnaies fiduciaires telles que le dollar américain, qui sont principalement divisées en trois catégories: 1. Types de garantie de la monnaie Fiat tels que l'USDT et l'USDC; 2. Types de garantie des crypto-monnaies tels que DAI; 3. Les types d'algorithmes présentent des risques plus élevés. Les stablescoins grand public comprennent l'USDT avec la valeur marchande la plus élevée et la meilleure liquidité. L'USDC est connu pour sa conformité et sa transparence. DAI s'appuie sur le mécanisme décentralisé. TUSD adopte l'audit en temps réel en cha?ne. Busd se retire progressivement du marché en raison de la supervision. L'USDP est connu pour sa forte conformité et sa sécurité. Les deux sont largement diffusés sur les échanges traditionnels.

Le modèle dans le champ de la cha?ne publique montre une tendance de "un super, beaucoup de forts et une centaine de fleurs fleurissant". Ethereum mène toujours avec ses douves écologiques, tandis que Solana, Avalanche et d'autres sont difficiles à affronter les performances. Pendant ce temps, Polkadot, Cosmos, qui se concentre sur l'interopérabilité, et ChainLink, qui est une infrastructure critique, forment une image future de plusieurs cha?nes coexistant. Pour les utilisateurs et les développeurs, le choix de la plate-forme n'est plus un seul choix, mais nécessite un compromis entre les performances, le co?t, la sécurité et la maturité écologique basée sur des besoins spécifiques.

Les stablecoins sont des crypto-monnaies qui sont fixées à des actifs tels que le dollar américain et visent à maintenir une valeur stable. Ils sont principalement divisés en trois types: garantie de monnaie fiduciaire, garantie de crypto-monnaie et algorithmes. 1. Les types de garanties de la monnaie Fiat tels que l'USDT et l'USCD sont soutenus par les réserves du dollar américain; 2. 3. L'algorithme repose sur des contrats intelligents pour ajuster l'alimentation mais présente des risques élevés. Les raisons pour lesquelles il est vivement discuté sur des plates-formes telles que Douyin incluent: En tant qu'outil de couverture lorsque le marché de la cryptographie tombe, un pont pour les novices pour entrer dans le monde de la cryptographie, un moyen d'obtenir une gestion financière à haut rendement en Defi et l'application de paiements transfrontaliers à faible co?t. Pour obtenir des stablecoins, vous pouvez échanger par des échanges traditionnels tels que Binance, Ouyi et Huobi.
