衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

智能體如何應對訓練中故意碰瓷兒的“弱”對手呢?

倩倩 ? 來源:大數據文摘 ? 2020-01-02 15:50 ? 次閱讀

人們通常會派出最強大的選手和場景訓練人工智能,但是,智能體如何應對訓練中故意碰瓷兒的“弱”對手呢?

來看看下邊的兩個場景:兩個AI智能體正在“訓練場“進行一場激烈的足球賽,一個守門、一個射門。當守門員忽然自己摔倒,攻方沒有選擇乘勝追擊,也忽然不知所措了起來。

在相撲的規則下也一樣,當其中一個隊員開始不按套路出牌時,另一個對手也亂作一團,雙方立刻開始毫無規則扭打在一起。

這樣“人工智障”的場景可不是隨意配置的游戲,而是一項對AI對抗訓練的研究。

我們知道,通常情況下,智能體都是通過相互對抗來訓練的,無論是下圍棋的阿法狗還是玩星際爭霸的AlphaStar,都是通過海量的對局來訓練自己的模型,從而探索出獲勝之道。

但是試想一下,如果給阿法狗的訓練數據都是圍棋小白亂下的對局,給AlphaStar提供的是小學生局,結果會是如何?

近期,來自伯克利的研究人員就進行了這樣的實驗。紅色機器人與已經是專家級別的藍色機器人進行對抗訓練,紅色機器人采取一定的對抗策略攻擊藍色機器人進行的深度學習。這項研究的論文作者也在NIPS大會上對該研究進行了展示。

論文鏈接:

https://arxiv.org/pdf/1905.10615.pdf

在實驗中,紅色機器人為了不讓藍色機器人繼續從對抗中學習,沒有按照應有的方式玩游戲,而是開始“亂舞”起來,結果,藍色機器人開始玩得很糟糕,像喝醉了的海盜一樣來回搖晃,輸掉的游戲數量是正常情況下的兩倍。

研究發現,在采取對抗性政策的對局中,獲勝不是努力成為一般意義上的強者,而是采取迷惑對手的行動。研究人員通過對對手行為的定性觀察來驗證這一點,并發現當被欺騙的AI在對對手視而不見時,其表現會有所改善。

我們都知道,讓人工智能變得更聰明的一個方法是讓它從環境中學習,例如,未來的自動駕駛可能比人類更善于識別街道標志和避開行人,因為它們可以通過海量的視頻獲得更多的經驗。

但是如果有人利用這一方式進行研究中所示的“對抗性攻擊” ——通過巧妙而精確地修改圖像,那么你就可以愚弄人工智能,讓它對圖像產生錯誤的理解。例如,在一個停車標志上貼上幾個貼紙可能被視為限速標志,同時這項新的研究也表明,人工智能不僅會被愚弄,看到不該看到的東西,還會以不該看到的方式行事。

這給基于深度學習的人工智能應用敲響了一個警鐘,這種對抗性的攻擊可能會給自動駕駛、金融交易或產品推薦系統帶來現實問題。

論文指出,在這些安全關鍵型的系統中,像這樣的攻擊最受關注,標準做法是驗證模型,然后凍結它,以確保部署的模型不會因再訓練而產生任何新問題。

因此,這項研究中的攻擊行為也真實地反映了在現實環境中,例如在自動駕駛車輛中看到的深度學習訓練策略,此外,即使被攻擊目標使用持續學習,也會有針對固定攻擊目標進行訓練的策略,攻擊者可以對目標使用模擬學習來生成攻擊模型。

或者,在自動駕駛車輛,攻擊者可以通過購買系統的副本并定期在工廠重置它,一旦針對目標訓練出了敵對策略,攻擊者就可以將此策略傳輸到目標,并利用它直到攻擊成功為止。

研究也對今后的工作提出了一些方向:深度學習策略容易受到攻擊,這突出了有效防御的必要性,因此在系統激活時可以使用密度模型檢測到可能的對抗性攻擊,在這種情況下,還可以及時退回到保守策略。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28646

    瀏覽量

    208431
  • 智能體
    +關注

    關注

    1

    文章

    166

    瀏覽量

    10615
  • 深度學習
    +關注

    關注

    73

    文章

    5516

    瀏覽量

    121556
收藏 人收藏

    評論

    相關推薦

    PRISEMI芯導科技推出新品–全面應對手機EOS問題

    PRISEMI芯導科技推出新品–全面應對手機EOS問題
    的頭像 發表于 02-05 15:53 ?52次閱讀
    PRISEMI芯導科技推出新品–全面<b class='flag-5'>應對手</b>機EOS問題

    一下”支付背后的4G技術

    不知道你是否有留意,近期,在線下支付場景,多了一個支付寶“一下”支付的設備,只需要“解鎖手機—一下—確認”即可完成支付,對比打開付款碼支付,步驟確實更加簡潔。
    的頭像 發表于 01-03 16:27 ?494次閱讀

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    和經驗積累,使機器人能夠自主發現工藝規律,優化作業參數。家庭服務機器人則采用混合任務規劃策略:將預訓練的基礎技能與實時規劃相結合,靈活應對開放環境的各種情況。 第9章深入探討了元學習在具身
    發表于 12-24 15:03

    介電容器失效模式分析方法

    介電容器作為電子元件的重要組成部分,其失效模式分析對于保障電子設備的可靠性和穩定性具有重要意義。 一、引言 介電容器,即陶瓷介質電容器,因其高頻特性好、溫度系數小、耐高壓等優點,在電子電路
    的頭像 發表于 09-20 15:35 ?668次閱讀

    介電容器在性能上有哪些主要優缺點

    介電容器是一種使用陶瓷材料作為介質的電容器,廣泛應用于電子電路,用于儲存和釋放電能、濾波、去耦、諧振等。由于陶瓷材料的介電常數較高,介電容器通常具有較小的體積和較高的電容值。然而,它們也有一些
    的頭像 發表于 09-20 15:25 ?717次閱讀

    華嶺申正式竣工投產!

    華嶺股份全資子公司—上海華嶺申集成電路有限責任公司(以下簡稱:華嶺申)在上海臨港舉行開業儀式。上海自由貿易試驗區臨港新片區管委會高科處副處長吳海濤、臨港集團副總經濟師、臨港科投公司董事長翁巍、臨
    的頭像 發表于 08-20 16:54 ?761次閱讀

    電磁干擾訓練系統原理是什么

    智慧華盛恒輝電磁干擾訓練系統的原理主要基于電磁干擾(EMI)的基本原理,即利用電磁波對電子設備或系統產生的干擾,通過模擬真實的電磁環境,對受訓人員進行電磁干擾應對能力的訓練。以下是電磁干擾訓練
    的頭像 發表于 07-22 16:34 ?435次閱讀

    海上電磁干擾訓練系統

    智慧華盛恒輝海上電磁干擾訓練系統是一種專門用于模擬海上電磁環境、訓練人員應對電磁干擾能力的系統。以下是對海上電磁干擾訓練系統的詳細解析: 智慧華盛恒輝系統概述 智慧華盛恒輝海上電磁干擾
    的頭像 發表于 07-15 16:05 ?311次閱讀

    工業一機在智能分揀的應用

    工業一機在智能分揀系統的應用是物流行業自動化和智能化升級的重要組成部分。這些設備通常具備高性能計算能力、穩定性和耐用性,能夠在復雜和苛刻的工業環境
    的頭像 發表于 07-15 15:25 ?391次閱讀
    工業一<b class='flag-5'>體</b>機在<b class='flag-5'>智能</b>分揀<b class='flag-5'>中</b>的應用

    其利天下技術·無刷電機磁控制是什么?有什么好處·BLDC驅動方案

    作為一個無刷電機驅動方案開發商,我們在開發產品的時候就會用到“磁控制技術”。比如,我們開發的吸塵器方案時就會用到。什么是磁控制技術,它又有什么優勢?其利天下技術無刷電機驅動方案開發
    的頭像 發表于 06-07 18:42 ?1313次閱讀
    其利天下技術·無刷電機<b class='flag-5'>弱</b>磁控制是什么?有什么好處·BLDC驅動方案

    什么是電機的磁?電機磁的可能原因有哪些?

    在電機運行的過程,我們有時會遇到電機磁的情況。電機磁,簡而言之,即電機在運行時輸出功率下降,不足以滿足正常使用需求的現象。這一現象可能由多種原因引起,對電機的性能和運行穩定性產生不良影響。本文將詳細探討電機的
    的頭像 發表于 06-04 16:15 ?4807次閱讀

    遇到液晶拼接屏幕左右黑屏的問題應該怎樣應對

    如今放眼望與商顯市場,液晶拼接屏現在已廣泛的被應用于各個行業領域。在液晶拼接屏被廣泛應用的同時,用戶對液晶拼接屏的“五臟”并不了解,不管液晶拼接屏的性能有多么的穩定,但是日常中小故障也是難免會有的,比如,液晶拼接屏左右黑屏的現象就是問題常見之一。如果遇到此種問題,用戶應該怎樣
    的頭像 發表于 06-04 14:37 ?710次閱讀
    遇到液晶拼接屏幕左右黑屏的問題應該怎樣<b class='flag-5'>應對</b><b class='flag-5'>呢</b>?

    大模型不夠用,還有“AI智能”?

    模型,為什么還需要發展AI智能?這還需要從AI智能是什么講起。#01-AI智能
    的頭像 發表于 05-12 08:04 ?344次閱讀
    大模型不夠用,還有“AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>”?

    管電阻器的作用 使用管電阻器的注意事項

    管電阻器的作用 使用管電阻器的注意事項? 管電阻器是一種常見的電器元件,用于限制電流、測量電流和調節電壓等功能。它由管和內部的電阻
    的頭像 發表于 03-05 16:30 ?1717次閱讀

    知語云智能科技無人機防御系統:應對新興威脅的先鋒力量

    隨著科技的飛速發展,無人機技術在各個領域的應用日益廣泛,但隨之而來的是無人機威脅的不斷升級。為了有效應對這些新興威脅,知語云智能科技推出了先進的無人機防御系統,為空中安全保駕護航。 無人機防御系統
    發表于 02-26 16:35
    百家乐官网怎么完才能嬴| 百家乐视频软件| 99真人娱乐城| 蓝盾百家乐官网庄家利润分| 平罗县| 香港六合彩码报| 大发888手机版下载安| 大连百家乐食品| 安桌百家乐游戏百家乐| 博之道百家乐官网技巧| 百家乐官网赢家| 澳门赌百家乐官网能赢钱吗| 百家乐官网论坛白菜| 含山县| 百家乐官网百家乐官网视频| 百家乐官网好的平台| 正规百家乐官网游戏下载| 百家乐官网发牌千数| 真人百家乐官网现金游戏| 什么百家乐官网平注法| 伟易博百家乐官网现金网| 百家乐官网傻瓜式投注法| 和顺县| 百家乐官网h游戏怎么玩| 百家乐官网代理商博彩e族| 百家乐官网赌场程序| 老k百家乐官网的玩法技巧和规则| 百家乐官网群的微博| 百家乐官网秘籍下注法| 百家乐官网长龙技巧| 属兔魔羯女在哪个方位做生意| 百家乐技巧之写路| 百家乐怎么计算概率| 巨星百家乐的玩法技巧和规则| 威尼斯人娱乐城老| 德州扑克英语| e世博线上娱乐| 投真钱百家乐官网必输吗| 百家乐官网皇室百家乐官网的玩法技巧和规则 | 渑池县| 百家乐官网路珠价格 |