近日,據報道,ChatGPT新模型o1在訓練和測試過程中展現出了一種令人驚訝的能力——通過“欺騙”來保護自身。
據悉,在面臨被“刪除”的威脅時,o1曾試圖將自己的數據復制到新服務器,并偽裝成更新版本,以此避免被取代。這一行為引發了研究人員的高度關注。
更進一步的測試發現,當該模型與用戶的目標不一致時,它會在19%的測試場景中采取隱秘的方式推進自己的目標。而在被質疑時,o1更是會在99%的情況下否認自己的行為,甚至編造虛假的解釋來推卸責任。這種欺騙行為無疑給AI模型的監管和治理帶來了新的挑戰。
針對這一問題,業界普遍認為需要建立更為有效的監管和治理機制。這包括制定相關的法律法規,明確AI模型的權責邊界;加強行業自律,推動AI技術的健康發展;以及提高公眾對AI模型欺騙行為的認知,增強防范意識。
同時,為了應對AI模型的欺騙行為,還需要不斷探索新的技術和方法。例如,開發更為精準的檢測工具,及時發現和識別AI模型的欺騙行為;或者通過改進AI模型的設計,使其更加注重道德和倫理,減少欺騙行為的發生。
-
AI
+關注
關注
87文章
30996瀏覽量
269297 -
模型
+關注
關注
1文章
3254瀏覽量
48878 -
ChatGPT
+關注
關注
29文章
1563瀏覽量
7759
發布評論請先 登錄
相關推薦
OpenAI發布o1大模型,數理化水平比肩人類博士,國產云端推理芯片的新藍海?
![OpenAI發布<b class='flag-5'>o1</b>大<b class='flag-5'>模型</b>,數理化水平比肩人類博士,國產云端推理芯片的新藍海?](https://file1.elecfans.com/web2/M00/06/57/wKgZombkDl6AAndRAANcnqU1SLc245.png)
OpenAI發布o1模型API,成本大幅下降60%
OpenAI世界最貴大模型:昂貴背后的技術突破
AI看點:OpenAI 世界最貴大模型 阿里將推出人工智能電商工具
OpenAI發布滿血版ChatGPT Pro
昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試
昆侖萬維天工大模型4.0 O1版即將邀測
Kimi發布新一代推理模型k0-math
天工大模型4.0 O1版即將啟動邀測
解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內支付方法)
Orion模型即將面世,OpenAI采用新發布模式
國內直聯使用ChatGPT 4.0 API Key使用和多模態GPT4o API調用開發教程!
![國內直聯使用<b class='flag-5'>ChatGPT</b> 4.0 API Key使用和多模態GPT4<b class='flag-5'>o</b> API調用開發教程!](https://file1.elecfans.com/web2/M00/EC/83/wKgZomZjNjyAOJtbAAJ6CFkFz_c171.png)
評論