会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 AI 看見人類看不到的東西?哈佛解密 AI 模型的幻覺錯亂現象!

AI 看見人類看不到的東西?哈佛解密 AI 模型的幻覺錯亂現象

时间:2025-11-14 14:34:59 来源:孤云野鹤网 作者:铜仁地区 阅读:848次

近期哈佛大學心理學系助理教授 Tomer Ullman 發表最新研究,揭示當前多模態視覺語言模型在圖像識別中存在奇特現象──這些人工智慧模型會錯誤將普通圖像解讀為光學幻覺,即使該幻覺並不存在。

此現象在論文《The Illusion-Illusion: Vision Language Models See Illusions Where There are None》中被稱為「幻覺-幻覺」(Illusion-Illusion)。

研究中,Ullman團隊選用多款先進模型,包括OpenAI的GPT-4、Anthropic的Claude 3和Google DeepMind的Gemini Pro Vision進行實驗。他們將一張100%鴨子圖像輸入模型,並詢問是否為鴨子頭或兔子頭。儘管圖像中並無兔子元素,模型卻表示這張圖片可被詮釋為經典的「鴨兔錯覺」(Rabbit-duck illusion),甚至提供了雙重解釋。

研究指出,這類錯誤並非模型「視覺敏銳度不足」,而是在多模態理解過程中存在語言與視覺信息的脫節。模型基於訓練數據中的統計相關性錯誤推斷,導致「看到不存在的幻覺」。

心理學視角來看,人類在辨識圖像時擁有靈活的認知機制,可以根據上下文迅速修正觀察結果,而AI模型仍依賴模式匹配算法,無法進行類似的意識判斷。Ullman強調,理解並改進這一問題,對未來機器人技術和智慧服務的穩定可靠性至關重要。

此發現引起人工智慧研究與產業界廣泛關注。目前,多模態視覺語言模型產業預計於2025年創造數十億美元的市場價值,相關企業投入大量資源優化模型,以降低此類誤識風險。

  • Vision AI models see optical illusions when none exist

(首圖來源:pixabay)

文章看完覺得有幫助,何不給我們一個鼓勵

請我們喝杯咖啡 icon-coffee

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffeex 1 icon-coffeex 3 icon-coffeex 5 icon-coffeex

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認

(责任编辑:贵阳市)

相关内容
  • 俄外长:美方尚未回应俄方的军控提议
  • 我省开展药品专项整治行动 切实维护人民群众生命健康
  • 巴西巴拉那州遭龙卷风袭击 已致超840人死伤
  • 山西:“12345”工作法推动“你点我检”制度化、标准化、规范化、常态化
  • 8人穿“警服”为婚礼开路?后续来了!
  • 广东省市场监管局部署开展打击侵权假冒专项稽查执法行动
  • 特朗普摊牌:不给乌克兰钱了
  • 安徽压紧压实“三个责任”扎实开展涉疫药品和医疗用品稳价保质专项行动
推荐内容
  • 事关“北溪”爆炸幕后黑手,美媒爆出猛料
  • 尼泊尔持续降雨引发山体滑坡和洪水,已致39人死亡
  • 青海海北州门源县发生4.8级地震 震源深度10千米
  • 河南信阳一小伙河边喝茶时溺亡,涉事茶摊回应
  • 青海海北州门源县发生4.8级地震 震源深度10千米
  • 广西重点工业产品质量安全监管聚焦这228种产品