色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AppAgent讓移動App應用測試更輕松

vliwulianw ? 來源:軟件質量報道 ? 2023-12-26 10:26 ? 次閱讀

AppAgent 的創新技術值得我們測試人員的關注。

最近大語言模型(LLMs)的進展導致了智能代理(Agent)的創建,這些代理能夠執行復雜的任務。而由騰訊團隊開發的AppAgent, 其智能代理能力可以用于操作任何 App,它在 50 個復雜手機任務上展示了強大的能力。

這項技術通過引入一種基于大型語言模型(LLMs)的多模態智能代理(Agent)框架,賦予了智能體操作智能手機應用的能力。與傳統的智能助手如 Siri 不同,AppAgent 不依賴于系統后端訪問,而是通過簡化的操作空間來操作智能手機應用程序,可以模擬人類的點擊和滑動等操作,直接與手機應用的圖形用戶界面(GUI)互動。這種獨特的方法不僅提高了安全性和隱私性,還確保了智能體能夠適應應用界面的變化和更新,從而擴大了它在各種應用程序中的適用性。

AppAgent 的核心在于其創新的學習方式,智能體可以通過自主探索或觀察人類演示來學習如何導航和使用新應用。在自主探索過程中,。這個過程還可以通過觀察少數幾個人類演示來加速,使智能體能夠更快地理解復雜功能。

AppAgent分為兩個階段,分別稱為探索階段和部署階段。在自主探索階段,AppAgent智能體通過一系列預定義的動作與應用互動,觀察不同應用程序的用戶界面交互(每個動作帶來的界面變化),AppAgent與智能手機應用程序進行交互,并從結果中學習,所學到的知識被精心編制成文件(構建知識庫)。一旦這個學習階段完成,AppAgent變得擅長使用應用程序,就準備好行動了,即在探索階段之后的部署階段,AppAgent利用編制在此文檔中的信息來高效地操作和導航應用程序,完成不同應用程序中的各種復雜任務。

ab92392a-a217-11ee-8b88-92fbcf53809c.png

(圖1 框架的兩階段方法:探索階段和部署階段)

為了驗證其實用性,研究團隊對 AppAgent 進行了廣泛測試,覆蓋了社交媒體、電子郵件、地圖、購物以及復雜的圖像編輯工具等 10 種不同的應用中的 50 個任務。測試結果證明,AppAgent 在處理各種高級任務方面表現出色,顯示出其適應性、用戶友好性以及高效的學習和操作能力。

1.實驗環境

實驗環境建立在Android操作系統的命令行界面(CLI)上,允許AppAgent與智能手機應用程序進行交互。代理接收兩個關鍵輸入:顯示應用程序界面的實時截圖和詳細的交互元素的XML文件。為了增強AppAgent識別和無縫交互這些元素的能力,我們為每個元素分配了一個唯一的標識符。這些標識符要么來自XML文件中的資源ID(如果提供),要么是通過組合元素的類名、大小和內容構建而成。這些元素以半透明的數字疊加在截圖上。這有助于AppAgent在不需要指定屏幕上精確位置的情況下準確交互,并增強了AppAgent在控制手機時的精度。

行動空間:AppAgent的行動空間反映了人們在智能手機上的常見交互方式:輕觸和滑動,設計了四種基本功能,并用到Android的兩個系統級的操作:

Tap(element : int):這個函數模擬對屏幕上標有數字的UI元素進行輕觸。例如,tap(5)將點擊標有“5”的元素。

Long_press(element : int):這個函數模擬對UI元素進行長按(1秒)。

Swipe(element : int, direction : str, dist : str):在指定方向(上、下、左、右)和距離(短、中、長)上滑動一個元素。例如,swipe(21, "up", "medium")將在元素“21”上向上滑動一段中等距離。

Text(text : str):為了繞過低效的虛擬鍵盤輸入,這個函數在虛擬鍵盤可見時直接將文本輸入到輸入框中。例如,text("Hello, world!")輸入字符串“Hello, world!”。

Back():系統級功能,幫助代理返回到前一個UI頁面,特別適用于退出不相關頁面。

Exit():特地的函數用于結束進程,通常在成功完成任務時調用。

這些預定義的動作旨在簡化AppAgent的交互,特別是通過消除對精確屏幕坐標的需求,這對于大語言模型(LLM)準確預測來說可能會帶來挑戰。

2. 探索階段

探索階段是這個框架的核心。

在此階段,AppAgent被分配一個任務,并開始自主與UI元素進行交互,通過試錯學習智能手機應用程序的功能和特性。

AppAgent使用不同的動作,并觀察應用界面的變化,以了解其工作原理。由LLM驅動的AppAgent試圖通過分析每個動作之前和之后的截圖來弄清楚UI元素的功能和特定動作的影響。這些信息被編制成一個記錄了對不同元素應用的動作效果的文檔。

當一個UI元素被多次操作時,AppAgent將根據過去的文檔和當前觀察更新文檔以提高質量。為了使探索更加高效,如果當前UI頁面似乎與應用的主要任務無關,如廣告頁面,AppAgent將停止進一步探索UI元素。在這種情況下,它使用Android系統的Back()函數返回到前一個UI頁面。

與隨機探索(如深度優先搜索和廣度優先搜索)相比,這種目標導向的探索方法確保代理專注于對應用程序有效操作至關重要的元素。AppAgent還利用LLM對用戶界面的現有知識來提高探索效率。當AppAgent完成分配的任務時,探索停止。

通過觀看演示進行探索。另一種常見且通常更有效的探索方法涉及AppAgent觀察人類示范。這些演示為代理提供了高效使用應用程序的示例,特別是對于理解可能通過自主交互難以發現的復雜功能。在這種方法中,一個人類用戶操作應用程序,而AppAgent觀察并記錄人類使用的元素和動作。這種策略縮小了探索空間,防止代理與無關的應用頁面進行交互,使其與自主交互相比成為更加簡化和高效的方法。

3. 部署階段

在探索階段之后,代理已經具備了執行復雜任務的能力,這是基于其積累的經驗。當給定任務時,代理遵循一種逐步的方法,每一步都包括對當前UI截圖的訪問和動態生成的文檔,詳細說明了UI元素的功能以及動作對當前UI頁面的影響。提示還提供了所有可用動作的詳細解釋。

在每一步中,代理首先被要求提供對當前UI的觀察,然后闡述其對任務和當前觀察的思考過程。隨后,代理開始執行動作,調用可用的函數。在每個動作之后,代理總結了交互歷史和當前步驟中所采取的動作。這些信息被納入下一個提示中,為代理提供了一種記憶形式。這種細致的方法增強了代理行動的可靠性和可解釋性,從而促進了更明智的決策制定。當代理確定任務已經完成時,部署階段停止,此時它可以通過執行Exit()動作退出流程。

aefef242-a217-11ee-8b88-92fbcf53809c.gif









審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GUI
    GUI
    +關注

    關注

    3

    文章

    660

    瀏覽量

    39698
  • XML技術
    +關注

    關注

    0

    文章

    15

    瀏覽量

    6012
  • CLI
    CLI
    +關注

    關注

    1

    文章

    79

    瀏覽量

    8558

原文標題:震撼:AppAgent讓移動App應用測試更輕松

文章出處:【微信號:軟件質量報道,微信公眾號:軟件質量報道】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    “兼具”性能與成本,INDEMIND新一代視覺方案機器人落地更輕松!

    機器人開發更快速,落地更穩健。
    的頭像 發表于 12-06 14:46 ?116次閱讀
    “兼具”性能與成本,INDEMIND新一代視覺方案<b class='flag-5'>讓</b>機器人落地<b class='flag-5'>更輕松</b>!

    谷歌Pixel Recorder應用用戶參與度顯著提升

    Google Pixel 的 Recorder 應用允許用戶錄制、轉錄、保存和共享音頻。為了用戶更輕松地管理和回顧自己的錄音,Recorder 的開發者將目光鎖定在功能強大的設備端大語言模型
    的頭像 發表于 11-15 13:46 ?214次閱讀

    移動終端測試儀的技術原理和應用場景

    不同的實際環境中進行現場測試,評估手機的性能表現。 教學和培訓:在電子通信相關的教學和培訓中,便攜綜測儀可以學生更直觀地了解手機的性能測試過程。 移動終端
    發表于 11-04 16:01

    Python常用函數大全

    在 Python 世界里,有一些寶藏函數和模塊,它們可以你編程更輕松、代碼更高效。這篇文章將帶你一一認識這些神器,你的開發生活瞬間輕松不少!
    的頭像 發表于 10-27 17:20 ?258次閱讀

    移動電源的測試方法與測試標準規范

    移動電源測試系統是針對便攜式移動電源綜合性能測試的自動化測試軟件,能夠全面檢測移動電源性能和質量
    的頭像 發表于 08-23 11:41 ?764次閱讀
    <b class='flag-5'>移動</b>電源的<b class='flag-5'>測試</b>方法與<b class='flag-5'>測試</b>標準規范

    谷歌針對Android和iOS版Chrome發布五項更新

    移動設備上搜索內容應該像在電腦上一樣流暢。近期,我們針對 Android 和 iOS 版 Chrome 發布了五項更新,旨在您能夠更輕松地在手機或平板電腦上進行搜索。
    的頭像 發表于 08-09 16:56 ?764次閱讀

    涂鴉App開發工具App SDK

    聯網移動應用(IoTApp)開發打造的一系列SDK,為開發者提供了豐富的組件和示例代碼,可以快速實現移動App對智能設備的連接、控制以及豐富的智能場景應用。今天要為
    的頭像 發表于 05-24 08:15 ?816次閱讀
    涂鴉<b class='flag-5'>App</b>開發工具<b class='flag-5'>App</b> SDK

    bootloader開多線程做引導程序,跳app初始化后直接進hardfualt,為什么?

    如標題,想做一個遠程升級的項目,bootloader引導區域和app都是開多線程跑的,就是自己寫了個小的任務調度器,沒什么功能主要是想程序快速的響應,延時不會對其他程序造成堵塞,程序測試
    發表于 04-18 06:07

    茂森智能手機變身移動數據釆集器

    內建全球最小二維條碼識讀引擎,可透過螢幕觸控按鈕ScanKey?幫助用戶精準快速輕松掃碼,輕巧方便攜帶、隨插即用,運用磁吸式USB Type -C接頭連接一般智能手機,用戶端主程序APP免修改,即可達到市售移動數據釆集器相同效果
    的頭像 發表于 04-09 17:06 ?547次閱讀
    茂森<b class='flag-5'>讓</b>智能手機變身<b class='flag-5'>移動</b>數據釆集器

    具有增強AI功能的Minitab 22發布!新增多種新功能讓數據分析更輕松!

    以實現自動化,帶來更智能、更快速、更輕松的可視化和數據分析。 通過添加史上首個專有自動化能力分布,Minitab 將徹底改變從業者分析過程的方式。自動化且增強的可視化將為客戶提供更多強大的方法,以交互式
    的頭像 發表于 03-27 10:48 ?537次閱讀

    機智云開發者中心:移動APP應用開發更智能化

    移動應用市場的蓬勃發展中,開發者們面臨著不斷提高效率和創新的挑戰。為了幫助開發者更好地實現移動應用開發的目標,機智云物聯網的新版開發者中心,通過自動生成移動APP應用的功能,
    的頭像 發表于 03-26 16:45 ?343次閱讀
    機智云開發者中心:<b class='flag-5'>讓</b><b class='flag-5'>移動</b><b class='flag-5'>APP</b>應用開發更智能化

    單片機供電模塊測試方案

    用戶自己設計的電路板或者是單片機電源,是否能夠持續穩定的輸出,對設備的運行狀態有著至關重要的影響。所以用戶自制的電源能否按工程師的設定要求給設備供電,是電源的一項基礎測試。使用ITECH艾德克斯IT8500+系列電子負載,能讓這項測試變得
    的頭像 發表于 01-20 10:20 ?931次閱讀
    單片機供電模塊<b class='flag-5'>測試</b>方案

    APP盾的防御機制及應用場景

    移動應用(APP)在我們日常生活中扮演著越來越重要的角色,但隨之而來的是各種網絡安全威脅的增加。為了保障APP的安全性,APP盾作為一種專門設計用于防御
    的頭像 發表于 01-20 08:31 ?2083次閱讀
    <b class='flag-5'>APP</b>盾的防御機制及應用場景

    GBT 37729-2019《信息技術 智能移動終端應用軟件(APP)技術要求》

    GB/T 37729-2019是中國國家標準之一,旨在規范智能移動終端應用軟件(APP)的技術要求。該標準提供了移動終端APP的技術要求,包括功能性、性能效率、兼容性、易用性、可靠性、
    的頭像 發表于 01-10 10:07 ?732次閱讀

    使用App盾方案加固移動應用

    擁有對企業數據訪問權限的易受攻擊的應用程序是此類威脅的潛在渠道,并且在與受限制的商業環境進行交互時很少受到監控。大量的應用程序存儲在App Store中,其中很大一部分是未經緩解的移動應用程序
    的頭像 發表于 01-08 15:09 ?369次閱讀
    主站蜘蛛池模板: 伊人电院网| 亚洲国产日韩欧美高清片a| 中文国产乱码在线人妻一区二区| 国产精品无码AV天天爽人妻蜜桃| 日本夜夜夜| 超清无码波多野吉衣与黑人| 欧美午夜不卡在线观看| 99久久久久国产精品免费| 辣文肉高h粗暴| 中文字幕午夜福利片| 久久午夜宫电影网| 中文字幕日本在线mv视频精品| 久久久无码精品亚洲欧美 | 永久精品视频无码一区| 精品国产乱码久久久久久软件| 亚洲精品国产精品麻豆99| 国内精自品线一区91| 亚洲日本乱码中文论理在线电影| 娇小萝被两个黑人用半米长| 亚洲伊人色| 久久人人玩人妻潮喷内射人人| 在线A亚洲老鸭窝天堂AV高清| 久久综合视频网站| 97夜夜澡人人爽人人模人人喊| 女人的选择hd| 超碰97人人做人人爱少妇| 色狗综合网| 国产人妻精品午夜福利免费不卡| 亚洲AV噜噜88| 久久99re66热这里只有精品| 中国老太60old mantv| 美女内射视频WWW网站午夜| ASIAN大陆明星裸休合成PICS| 人人爽久久久噜噜噜丁香AV| 古代又黄又肉到湿的爽文| 吸奶舔下面| 精品性影院一区二区三区内射| 中文国产成人精品久久免费| 欧美成人momandson| 调教玩弄奶头乳夹开乳震动器| 午夜在线观看免费完整直播网页|