衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AppAgent讓移動App應(yīng)用測試更輕松

vliwulianw ? 來源:軟件質(zhì)量報道 ? 2023-12-26 10:26 ? 次閱讀

AppAgent 的創(chuàng)新技術(shù)值得我們測試人員的關(guān)注。

最近大語言模型(LLMs)的進(jìn)展導(dǎo)致了智能代理(Agent)的創(chuàng)建,這些代理能夠執(zhí)行復(fù)雜的任務(wù)。而由騰訊團(tuán)隊(duì)開發(fā)的AppAgent, 其智能代理能力可以用于操作任何 App,它在 50 個復(fù)雜手機(jī)任務(wù)上展示了強(qiáng)大的能力。

這項(xiàng)技術(shù)通過引入一種基于大型語言模型(LLMs)的多模態(tài)智能代理(Agent)框架,賦予了智能體操作智能手機(jī)應(yīng)用的能力。與傳統(tǒng)的智能助手如 Siri 不同,AppAgent 不依賴于系統(tǒng)后端訪問,而是通過簡化的操作空間來操作智能手機(jī)應(yīng)用程序,可以模擬人類的點(diǎn)擊和滑動等操作,直接與手機(jī)應(yīng)用的圖形用戶界面(GUI)互動。這種獨(dú)特的方法不僅提高了安全性和隱私性,還確保了智能體能夠適應(yīng)應(yīng)用界面的變化和更新,從而擴(kuò)大了它在各種應(yīng)用程序中的適用性。

AppAgent 的核心在于其創(chuàng)新的學(xué)習(xí)方式,智能體可以通過自主探索或觀察人類演示來學(xué)習(xí)如何導(dǎo)航和使用新應(yīng)用。在自主探索過程中,。這個過程還可以通過觀察少數(shù)幾個人類演示來加速,使智能體能夠更快地理解復(fù)雜功能。

AppAgent分為兩個階段,分別稱為探索階段和部署階段。在自主探索階段,AppAgent智能體通過一系列預(yù)定義的動作與應(yīng)用互動,觀察不同應(yīng)用程序的用戶界面交互(每個動作帶來的界面變化),AppAgent與智能手機(jī)應(yīng)用程序進(jìn)行交互,并從結(jié)果中學(xué)習(xí),所學(xué)到的知識被精心編制成文件(構(gòu)建知識庫)。一旦這個學(xué)習(xí)階段完成,AppAgent變得擅長使用應(yīng)用程序,就準(zhǔn)備好行動了,即在探索階段之后的部署階段,AppAgent利用編制在此文檔中的信息來高效地操作和導(dǎo)航應(yīng)用程序,完成不同應(yīng)用程序中的各種復(fù)雜任務(wù)。

ab92392a-a217-11ee-8b88-92fbcf53809c.png

(圖1 框架的兩階段方法:探索階段和部署階段)

為了驗(yàn)證其實(shí)用性,研究團(tuán)隊(duì)對 AppAgent 進(jìn)行了廣泛測試,覆蓋了社交媒體、電子郵件、地圖、購物以及復(fù)雜的圖像編輯工具等 10 種不同的應(yīng)用中的 50 個任務(wù)。測試結(jié)果證明,AppAgent 在處理各種高級任務(wù)方面表現(xiàn)出色,顯示出其適應(yīng)性、用戶友好性以及高效的學(xué)習(xí)和操作能力。

1.實(shí)驗(yàn)環(huán)境

實(shí)驗(yàn)環(huán)境建立在Android操作系統(tǒng)的命令行界面(CLI)上,允許AppAgent與智能手機(jī)應(yīng)用程序進(jìn)行交互。代理接收兩個關(guān)鍵輸入:顯示應(yīng)用程序界面的實(shí)時截圖和詳細(xì)的交互元素的XML文件。為了增強(qiáng)AppAgent識別和無縫交互這些元素的能力,我們?yōu)槊總€元素分配了一個唯一的標(biāo)識符。這些標(biāo)識符要么來自XML文件中的資源ID(如果提供),要么是通過組合元素的類名、大小和內(nèi)容構(gòu)建而成。這些元素以半透明的數(shù)字疊加在截圖上。這有助于AppAgent在不需要指定屏幕上精確位置的情況下準(zhǔn)確交互,并增強(qiáng)了AppAgent在控制手機(jī)時的精度。

行動空間:AppAgent的行動空間反映了人們在智能手機(jī)上的常見交互方式:輕觸和滑動,設(shè)計(jì)了四種基本功能,并用到Android的兩個系統(tǒng)級的操作:

Tap(element : int):這個函數(shù)模擬對屏幕上標(biāo)有數(shù)字的UI元素進(jìn)行輕觸。例如,tap(5)將點(diǎn)擊標(biāo)有“5”的元素。

Long_press(element : int):這個函數(shù)模擬對UI元素進(jìn)行長按(1秒)。

Swipe(element : int, direction : str, dist : str):在指定方向(上、下、左、右)和距離(短、中、長)上滑動一個元素。例如,swipe(21, "up", "medium")將在元素“21”上向上滑動一段中等距離。

Text(text : str):為了繞過低效的虛擬鍵盤輸入,這個函數(shù)在虛擬鍵盤可見時直接將文本輸入到輸入框中。例如,text("Hello, world!")輸入字符串“Hello, world!”。

Back():系統(tǒng)級功能,幫助代理返回到前一個UI頁面,特別適用于退出不相關(guān)頁面。

Exit():特地的函數(shù)用于結(jié)束進(jìn)程,通常在成功完成任務(wù)時調(diào)用。

這些預(yù)定義的動作旨在簡化AppAgent的交互,特別是通過消除對精確屏幕坐標(biāo)的需求,這對于大語言模型(LLM)準(zhǔn)確預(yù)測來說可能會帶來挑戰(zhàn)。

2. 探索階段

探索階段是這個框架的核心。

在此階段,AppAgent被分配一個任務(wù),并開始自主與UI元素進(jìn)行交互,通過試錯學(xué)習(xí)智能手機(jī)應(yīng)用程序的功能和特性

AppAgent使用不同的動作,并觀察應(yīng)用界面的變化,以了解其工作原理。由LLM驅(qū)動的AppAgent試圖通過分析每個動作之前和之后的截圖來弄清楚UI元素的功能和特定動作的影響。這些信息被編制成一個記錄了對不同元素應(yīng)用的動作效果的文檔。

當(dāng)一個UI元素被多次操作時,AppAgent將根據(jù)過去的文檔和當(dāng)前觀察更新文檔以提高質(zhì)量。為了使探索更加高效,如果當(dāng)前UI頁面似乎與應(yīng)用的主要任務(wù)無關(guān),如廣告頁面,AppAgent將停止進(jìn)一步探索UI元素。在這種情況下,它使用Android系統(tǒng)的Back()函數(shù)返回到前一個UI頁面。

與隨機(jī)探索(如深度優(yōu)先搜索和廣度優(yōu)先搜索)相比,這種目標(biāo)導(dǎo)向的探索方法確保代理專注于對應(yīng)用程序有效操作至關(guān)重要的元素。AppAgent還利用LLM對用戶界面的現(xiàn)有知識來提高探索效率。當(dāng)AppAgent完成分配的任務(wù)時,探索停止。

通過觀看演示進(jìn)行探索。另一種常見且通常更有效的探索方法涉及AppAgent觀察人類示范。這些演示為代理提供了高效使用應(yīng)用程序的示例,特別是對于理解可能通過自主交互難以發(fā)現(xiàn)的復(fù)雜功能。在這種方法中,一個人類用戶操作應(yīng)用程序,而AppAgent觀察并記錄人類使用的元素和動作。這種策略縮小了探索空間,防止代理與無關(guān)的應(yīng)用頁面進(jìn)行交互,使其與自主交互相比成為更加簡化和高效的方法。

3. 部署階段

在探索階段之后,代理已經(jīng)具備了執(zhí)行復(fù)雜任務(wù)的能力,這是基于其積累的經(jīng)驗(yàn)。當(dāng)給定任務(wù)時,代理遵循一種逐步的方法,每一步都包括對當(dāng)前UI截圖的訪問和動態(tài)生成的文檔,詳細(xì)說明了UI元素的功能以及動作對當(dāng)前UI頁面的影響。提示還提供了所有可用動作的詳細(xì)解釋。

在每一步中,代理首先被要求提供對當(dāng)前UI的觀察,然后闡述其對任務(wù)和當(dāng)前觀察的思考過程。隨后,代理開始執(zhí)行動作,調(diào)用可用的函數(shù)。在每個動作之后,代理總結(jié)了交互歷史和當(dāng)前步驟中所采取的動作。這些信息被納入下一個提示中,為代理提供了一種記憶形式。這種細(xì)致的方法增強(qiáng)了代理行動的可靠性和可解釋性,從而促進(jìn)了更明智的決策制定。當(dāng)代理確定任務(wù)已經(jīng)完成時,部署階段停止,此時它可以通過執(zhí)行Exit()動作退出流程。

aefef242-a217-11ee-8b88-92fbcf53809c.gif









審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • GUI
    GUI
    +關(guān)注

    關(guān)注

    3

    文章

    662

    瀏覽量

    39893
  • XML技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    6035
  • CLI
    CLI
    +關(guān)注

    關(guān)注

    1

    文章

    79

    瀏覽量

    8600

原文標(biāo)題:震撼:AppAgent讓移動App應(yīng)用測試更輕松

文章出處:【微信號:軟件質(zhì)量報道,微信公眾號:軟件質(zhì)量報道】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    App發(fā)布前完整測試的重要性:從Sonos的失敗中汲取教訓(xùn)

    在當(dāng)今數(shù)字化時代,App 已成為企業(yè)與用戶溝通的關(guān)鍵橋梁,其質(zhì)量直接關(guān)乎企業(yè)的聲譽(yù)與命運(yùn)。Sonos 公司的 App 更新失敗事件,堪稱一場災(zāi)難性的警示,淋漓盡致地展現(xiàn)了 App 發(fā)布前進(jìn)行完整
    的頭像 發(fā)表于 01-16 09:12 ?119次閱讀

    LambdaTest發(fā)布新一代SmartUI,重塑可視化測試體驗(yàn)

    升級,旨在徹底改變傳統(tǒng)的可視化測試工作流程,測試過程變得更加無縫、直觀且高效。通過引入一系列創(chuàng)新功能和優(yōu)化界面設(shè)計(jì),LambdaTest的新一代SmartUI為用戶提供了一個更加簡潔明了的操作環(huán)境,使得
    的頭像 發(fā)表于 01-02 13:56 ?152次閱讀

    “兼具”性能與成本,INDEMIND新一代視覺方案機(jī)器人落地更輕松!

    機(jī)器人開發(fā)更快速,落地更穩(wěn)健。
    的頭像 發(fā)表于 12-06 14:46 ?172次閱讀
    “兼具”性能與成本,INDEMIND新一代視覺方案<b class='flag-5'>讓</b>機(jī)器人落地<b class='flag-5'>更輕松</b>!

    谷歌Pixel Recorder應(yīng)用用戶參與度顯著提升

    Google Pixel 的 Recorder 應(yīng)用允許用戶錄制、轉(zhuǎn)錄、保存和共享音頻。為了用戶更輕松地管理和回顧自己的錄音,Recorder 的開發(fā)者將目光鎖定在功能強(qiáng)大的設(shè)備端大語言模型
    的頭像 發(fā)表于 11-15 13:46 ?276次閱讀

    移動終端測試儀的技術(shù)原理和應(yīng)用場景

    不同的實(shí)際環(huán)境中進(jìn)行現(xiàn)場測試,評估手機(jī)的性能表現(xiàn)。 教學(xué)和培訓(xùn):在電子通信相關(guān)的教學(xué)和培訓(xùn)中,便攜綜測儀可以學(xué)生更直觀地了解手機(jī)的性能測試過程。 移動終端
    發(fā)表于 11-04 16:01

    Python常用函數(shù)大全

    在 Python 世界里,有一些寶藏函數(shù)和模塊,它們可以你編程更輕松、代碼更高效。這篇文章將帶你一一認(rèn)識這些神器,你的開發(fā)生活瞬間輕松不少!
    的頭像 發(fā)表于 10-27 17:20 ?347次閱讀

    移動電源的測試方法與測試標(biāo)準(zhǔn)規(guī)范

    移動電源測試系統(tǒng)是針對便攜式移動電源綜合性能測試的自動化測試軟件,能夠全面檢測移動電源性能和質(zhì)量
    的頭像 發(fā)表于 08-23 11:41 ?921次閱讀
    <b class='flag-5'>移動</b>電源的<b class='flag-5'>測試</b>方法與<b class='flag-5'>測試</b>標(biāo)準(zhǔn)規(guī)范

    谷歌針對Android和iOS版Chrome發(fā)布五項(xiàng)更新

    移動設(shè)備上搜索內(nèi)容應(yīng)該像在電腦上一樣流暢。近期,我們針對 Android 和 iOS 版 Chrome 發(fā)布了五項(xiàng)更新,旨在您能夠更輕松地在手機(jī)或平板電腦上進(jìn)行搜索。
    的頭像 發(fā)表于 08-09 16:56 ?806次閱讀

    涂鴉App開發(fā)工具App SDK

    聯(lián)網(wǎng)移動應(yīng)用(IoTApp)開發(fā)打造的一系列SDK,為開發(fā)者提供了豐富的組件和示例代碼,可以快速實(shí)現(xiàn)移動App對智能設(shè)備的連接、控制以及豐富的智能場景應(yīng)用。今天要為
    的頭像 發(fā)表于 05-24 08:15 ?910次閱讀
    涂鴉<b class='flag-5'>App</b>開發(fā)工具<b class='flag-5'>App</b> SDK

    bootloader開多線程做引導(dǎo)程序,跳app初始化后直接進(jìn)hardfualt,為什么?

    如標(biāo)題,想做一個遠(yuǎn)程升級的項(xiàng)目,bootloader引導(dǎo)區(qū)域和app都是開多線程跑的,就是自己寫了個小的任務(wù)調(diào)度器,沒什么功能主要是想程序快速的響應(yīng),延時不會對其他程序造成堵塞,程序測試
    發(fā)表于 04-18 06:07

    茂森智能手機(jī)變身移動數(shù)據(jù)釆集器

    內(nèi)建全球最小二維條碼識讀引擎,可透過螢?zāi)挥|控按鈕ScanKey?幫助用戶精準(zhǔn)快速輕松掃碼,輕巧方便攜帶、隨插即用,運(yùn)用磁吸式USB Type -C接頭連接一般智能手機(jī),用戶端主程序APP免修改,即可達(dá)到市售移動數(shù)據(jù)釆集器相同效果
    的頭像 發(fā)表于 04-09 17:06 ?590次閱讀
    茂森<b class='flag-5'>讓</b>智能手機(jī)變身<b class='flag-5'>移動</b>數(shù)據(jù)釆集器

    具有增強(qiáng)AI功能的Minitab 22發(fā)布!新增多種新功能讓數(shù)據(jù)分析更輕松

    以實(shí)現(xiàn)自動化,帶來更智能、更快速、更輕松的可視化和數(shù)據(jù)分析。 通過添加史上首個專有自動化能力分布,Minitab 將徹底改變從業(yè)者分析過程的方式。自動化且增強(qiáng)的可視化將為客戶提供更多強(qiáng)大的方法,以交互式
    的頭像 發(fā)表于 03-27 10:48 ?585次閱讀

    機(jī)智云開發(fā)者中心:移動APP應(yīng)用開發(fā)更智能化

    移動應(yīng)用市場的蓬勃發(fā)展中,開發(fā)者們面臨著不斷提高效率和創(chuàng)新的挑戰(zhàn)。為了幫助開發(fā)者更好地實(shí)現(xiàn)移動應(yīng)用開發(fā)的目標(biāo),機(jī)智云物聯(lián)網(wǎng)的新版開發(fā)者中心,通過自動生成移動APP應(yīng)用的功能,
    的頭像 發(fā)表于 03-26 16:45 ?375次閱讀
    機(jī)智云開發(fā)者中心:<b class='flag-5'>讓</b><b class='flag-5'>移動</b><b class='flag-5'>APP</b>應(yīng)用開發(fā)更智能化

    無刷電機(jī)無感FOC控制培訓(xùn)系列課程

    高頻注入 死區(qū)補(bǔ)償,效率補(bǔ)償,等一次性給你系統(tǒng)講解。你工作中遇到問題不在疑惑。?4.凡事課程購買者,工作中遇到硬件或者軟件算法難以解決的問題,本工作室可以直播給您解答.您工作更輕松,學(xué)習(xí)
    發(fā)表于 03-10 13:52
    百家乐五湖四海娱乐场| 百家乐骗局视频| 大发888游戏官方下载客户端 | 澄江县| 百家乐注册优惠平台| 泰来百家乐官网导航| 利高百家乐游戏| 太阳城百家乐官网口诀| 大赢家娱乐城官方网| 博彩网百家乐全讯网| 澳门百家乐投注法| 网络百家乐官网诈骗| 永吉县| 娱乐城开户送彩金| 多台百家乐的玩法技巧和规则 | 棋牌娱乐城注册送58| 大地百家乐的玩法技巧和规则 | 百家乐官网赌博论坛| 抚顺县| 利记国际娱乐| 威尼斯人娱乐城信誉怎么样| 尊龙百家乐娱乐平台| 百家乐视频双扣下载| 免费百家乐官网的玩法技巧和规则 | 娱乐城百家乐高手| 新彩百家乐官网的玩法技巧和规则 | 澳门百家乐官网群代理| 呼玛县| 广发娱乐城| 北京太阳城三期| 百家乐百博亚洲| 易球百家乐娱乐城| 百家乐三路法| 网上百家乐辅助软件| 去澳门百家乐娱乐城| 澳门百家乐信誉| 豪华百家乐人桌| 百家乐筹码盒| 澳门百家乐打法百家乐破解方法| 澳门百家乐网上直赌| 百家乐对冲套红利|