xxxxx性bbbbb欧美,4hu四虎永久在线观看

AIS夢想著電羊嗎？

在框外思考太多

粉碎夢

首頁

科技週邊

IT業(yè)界

為什麼AI會更頻繁地進行Hallucin，我們如何停止它？

Christopher Nolan

Jul 08, 2025 am 01:44 AM

為什麼AI會更頻繁地進行Hallucin，我們如何停止它？

人工智能（AI）越先進，它越傾向於“幻覺”並提供錯誤或不準確的信息。

根據Openai的研究，當使用PersonQA基準測試時，其最新和強大的推理模型（O3和O4-Mini）分別降低了33％和48％的幻覺率。這是較舊的O1模型中看到的速率的兩倍以上。儘管與早期版本相比，O3提供了更準確的響應，但它也顯示出更高的幻覺趨勢。

IEEE成員兼AI倫理工程師Eleanor Watson表示，這種趨勢引起了人們對大語言模型（LLM）（LLM）（例如AI Chatbots）的準確性和可靠性的擔憂。

沃森告訴《 Live Science》：“當系統(tǒng)產生捏造的信息（例如虛構的事實，引用或事件），其與事實內容相同的流利性和連貫性時，它會以微妙但重要的方式誤導用戶?！?/p>

相關： openai和Deepseek體驗的尖端AI模型在面臨過於復雜的問題時“完全崩潰”，研究發(fā)現

專家強調，這個幻覺問題強調了仔細評估和監(jiān)視LLM和推理模型產生的輸出的重要性。

AIS夢想著電羊嗎？

推理模型的關鍵特徵是它通過將其分解為較小的部分並製定解決每個策略來解決複雜任務的能力。與僅依靠統(tǒng)計概率產生答案的模型不同，推理模型創(chuàng)建了與人類思維類似的問題解決策略。

為了註冊AI生成創(chuàng)意和潛在新穎的解決方案的Live Science Daily新聞通訊訂單，它必須參與某種水平的幻覺 - 否則，它將僅限於反省已經學到的數據。

Vectra AI的AI研究員Sohrob Kazerounian在接受Live Science採訪時說：“了解幻覺不是幻覺，而是AI的特徵，而是AI的特徵?！?“正如同事曾經說過的那樣，'LLM產生的一切都是幻覺。這只是其中一些幻覺恰好是真的。'如果AI僅生成了培訓期間看到的確切副本，那麼AI將不過是大規(guī)模的搜索引擎。”

“這意味著只編寫以前寫過的代碼，只發(fā)現已經知道的屬性的分子，並僅回答以前被問到的家庭作業(yè)問題。您將無法要求LLM為圍繞AI奇異性的概念專輯寫歌詞，結合了Snoop Dogg和Bob Dylan的風格?！?/p>

有效地，LLMS和他們權力的AI系統(tǒng)需要幻覺才能產生原始內容，而不是簡單地重複現有知識。從概念上講，這類似於人類夢想或想像場景引發(fā)新想法。

在框外思考太多

但是，當目標是傳遞精確和正確的信息時， AI幻覺就會成為問題，尤其是當用戶接受無驗證的輸出時。

沃森解釋說：“這在事實準確性至關重要的領域尤其令人關注，例如醫(yī)學，法律或金融?！?“儘管更高級的模型可能會減少明顯的事實錯誤，但幻覺的微妙形式仍然存在。隨著時間的流逝，這些捏造會破壞對AI系統(tǒng)的信任，並且當用戶對未驗證的信息採取行動時，可能會導致現實世界中的傷害?！?/p>

此外，隨著AI技術的進展，這一挑戰(zhàn)似乎也會增長。沃森指出：“隨著模型的改善，錯誤通常變得不那麼明顯，但很難檢測到。” “現在被捏造的內容嵌入了令人信服的敘述和邏輯推理鏈中。這造成了獨特的危險：用戶可能沒有意識到存在錯誤，並且可以將輸出視為確定性。該問題從濾除明顯的錯誤到識別出僅在仔細檢查下浮出水面的細微扭曲而轉變?！?/p>

Kazerounian支持這種觀點。他說：“儘管對AI幻覺會隨著時間的流逝而逐漸減少，但有證據表明，較新的推理模型實際上可能比簡單的幻覺更頻繁地幻覺，而且對為什麼會發(fā)生這種情況尚無共識?！?/p>

由於難以理解LLM如何得出結論，這種情況與我們仍然不完全理解人腦的功能相似，這使情況更加複雜。

AI Company Anthropic的首席執(zhí)行官Dario Amodei在最近的一篇文章中指出，關於AIS如何產生響應缺乏透明度。他寫道：“當生成性AI總結了財務文件時，我們對為什麼要做出特定的單詞選擇或為什麼偶爾會出錯，儘管通常是正確的?！?/p>

Kazerounian強調，AI產生虛假信息的後果已經非常真實。他說：“沒有可靠的方法可以確保LLM正確回答有關它可以訪問的任何給定數據集的問題?！?“不存在參考，客戶服務聊天機器人發(fā)明公司政策和其他不準確的實例現在令人震驚?！?/p>