衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高通在2023年國際計算機視覺與模式識別會議上,展示先進研究成果并將生成式AI引入邊緣側

高通中國 ? 來源:未知 ? 2023-06-27 19:15 ? 次閱讀
6月18日至22日,IEEE/CVF國際計算機視覺與模式識別會議(CVPR)在溫哥華舉行,該會議不僅是計算機視覺,也是AI領域最重要的年度活動之一。會議期間,高通展示了已被業界認可的研究論文和技術演示。本文將介紹CVPR 2023上高通的展示亮點。

技術演示

高通在AI、計算機視覺、XR和自動駕駛汽車等領域的研究,已從核心理論創新擴展到下游實際應用,例如:

·運行在手機上的全球最快的

ControlNet演示

幾個月前,高通展示了全球首個運行在Android手機上的Stable Diffusion終端側演示,該演示在CVPR上再次呈現。此外,高通AI研究演示了ControlNet圖像生成圖像模型,該模型擁有15億參數,可以完全在手機上運行。ControlNet是一項生成式AI解決方案,被稱為語言-視覺模型(LVM)。它能夠通過調整輸入圖像和輸入文本描述,更精準地控制生成圖像。在這項演示中,只用不到12秒即可在移動終端上生成AI圖像,無需訪問任何云端,便能提供高效、有趣、可靠且私密的交互式用戶體驗。這項驚艷的技術演示通過一套跨模型架構、AI軟件和神經網絡硬件加速器的全棧式AI優化而實現。在此過程中使用的高通先進AI工具和硬件包括:高通AI模型增效工具包(AIMET)、高通AI軟件棧和高通AI引擎。

·支持基于實時視覺大語言模型的 健身教練 高通AI研究利用生成式AI打造出在準確度和真實感方面超越現有解決方案的數字健身教練。健身教練能夠提供實時互動,鼓勵、糾正并幫助用戶實現其健身目標。我們的演示展示了基于視覺的大語言模型如何支持情境式、多模態的實時交互。用戶的運動視頻流先經過動作識別模型進行處理。根據識別的動作,狀態編排器(stateful orchestrator)提供提示并輸入給大語言模型。健身教練通過一個語音合成(文本生成語音)的虛擬化身,將大語言模型的答復送回給用戶。這項演示的實現主要歸功于三項關鍵創新:為檢測精細化健身動作而訓練的視覺模型、為生成基于視覺概念的語言而訓練的語言模型,以及能夠協調兩個模態之間流動交互的編排器,便于實時對話式的輔導反饋。憑借上述創新,就能夠支持健身教練為用戶提供實時的沉浸式動態交互體驗。

·全球首個在手機上進行的1080p

神經網絡視頻編碼

終端側AI的另一項全球首創即在移動終端上的1080p視頻編碼和解碼過程。神經網絡編解碼器用途十分廣泛:可針對特定視頻需求進行定制,通過生成式AI的優勢對感知質量進行優化,擴展至全新模態,在通用AI硬件上運行。但同時也將帶來難以在計算能力有限的終端上應對的諸多挑戰。高通設計了全新高效的神經網絡視頻幀間壓縮架構,支持在終端上進行1080p視頻編碼。在演示中,神經網絡視頻編解碼器能夠準確地保留高清視頻的豐富視覺結構和復雜動作。

·面向XR的3D重建

高通成功開發了先進的實時3D重建系統,該系統在準確度和高效方面表現出色,能夠在任何環境下賦能創建高精度的3D模型。該解決方案在移動終端上運行,從單個圖像生成深度圖,并將其組合成3D場景。有了準確的實時3D地圖,開發者可以解鎖大量AR和VR應用。全新設計的互動演示展示了高通的創新實力,用戶可向場景中的真實物體(比如墻壁和家具)射擊虛擬球,見證基于精確物理計算的逼真反彈效果。該感知技術提升了沉浸式體驗,并有望加速元宇宙的廣泛普及。

·面向智能攝像頭的計算機視覺

基于AI的計算機視覺的進步,推動照片和視頻拍攝能力持續演進。高通演示了語義分割、單目深度估測和基于實例分割的虛化效果、背景替換、電影模式,以及銳度、平滑度、清晰度與對比度方面相關的圖像質量提升。這些神經網絡在搭載驍龍平臺的終端上實時運行視頻增強特性。

·為增強安全性的駕駛員監測技術

駕駛員監測系統(DMS)演示中展示了如何利用計算機視覺判斷危險駕駛狀況以提高安全性。駕駛員監測系統通過座艙內主動紅外攝像機實時監測駕駛員的特征,如眼睛睜開程度、凝視方向、頭部姿勢、面部表情和肢體動作等,從而判斷駕駛員的駕駛狀態。該系統在檢測到類似注意力分散和瞌睡等危險駕駛情況時會向司機發出警告,最終幫助挽救生命。駕駛員監測系統和先進駕駛輔助系統(ADAS)能夠同時在Snapdragon Ride Flex系統級芯片上同步運行。

·XR虛擬頭像

無論逼真或卡通風格,虛擬化身是賦能元宇宙中沉浸式XR體驗的基本要素。借助一張或多張2D照片,利用終端側AI生成個性化網格和相應的紋理。使用頭戴式攝像機來觀察用戶眼睛和嘴巴的移動,實時渲染虛擬頭像。由此,可生成更接近于標準現實重建和動畫后的虛擬化身,并根據環境進行光照處理。高通的目標是在元宇宙和人機界面中使用的驍龍XR平臺上提供數字人。

除了以上技術演示,高通還展示了公司已被業界認可的研究論文。CVPR 2023期間,高通共有八篇論文被主會議收錄,主要從充分利用數據和打造更佳架構兩大類別出發,對推動計算機視覺前沿發展具有深遠影響。

欲了解更多信息請點擊【閱讀原文】。

*本文內容來自高通技術公司工程技術副總裁Ning Bi、高通技術公司高級技術總監Fatih Porikli的署名博客。

a9b9112a-14da-11ee-962d-dac502259ad0.gif ?


原文標題:高通在2023年國際計算機視覺與模式識別會議上,展示先進研究成果并將生成式AI引入邊緣側

文章出處:【微信公眾號:高通中國】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 高通
    +關注

    關注

    77

    文章

    7506

    瀏覽量

    191171
  • 生成式AI
    +關注

    關注

    0

    文章

    514

    瀏覽量

    547

原文標題:高通在2023年國際計算機視覺與模式識別會議上,展示先進研究成果并將生成式AI引入邊緣側

文章出處:【微信號:Qualcomm_China,微信公眾號:高通中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    開源項目 ! 利用邊緣計算打造便攜視覺識別系統

    環境中測試,還是動態環境里進行測試,該系統都能提供從快速迭代到移動監控等全方位的功能支持。 面向開發者的視覺識別 隨著人工智能和計算機視覺
    發表于 12-16 16:31

    NVIDIA ResearchECCV 2024展示多項創新成果

    米蘭舉行的歐洲計算機視覺國際會議 (ECCV) ,NVIDIA Research 展示了多項
    的頭像 發表于 11-19 15:07 ?379次閱讀

    NVIDIA Research端到端自動駕駛模型引領國際挑戰賽

    NVIDIA 國際計算機視覺模式識別會議(CVPR)
    的頭像 發表于 09-09 10:11 ?568次閱讀

    初創公司SEA.AI利用NVIDIA邊緣AI計算機視覺技術變革航海安全系統

    總部位于奧地利林茨的初創公司正在利用 NVIDIA 邊緣 AI計算機視覺技術變革航海安全系統,讓每一次出海變得更安全。
    的頭像 發表于 09-09 09:32 ?595次閱讀

    銳思智芯展示融合視覺感知技術創新與產品應用

    日前,計算機視覺和人工智能領域最具影響力的頂級學術會議——IEEE國際計算機視覺
    的頭像 發表于 08-28 14:36 ?574次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實現這一目標,計算機視覺技術依賴于
    的頭像 發表于 07-24 12:46 ?1083次閱讀

    機器視覺計算機視覺有什么區別

    機器視覺計算機視覺是兩個密切相關但又有所區別的概念。 一、定義 機器視覺 機器視覺,又稱為計算機
    的頭像 發表于 07-16 10:23 ?629次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領域,它利用計算機和數學算法來模擬人類視覺系統對圖像和視頻進行
    的頭像 發表于 07-10 18:24 ?2295次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別
    的頭像 發表于 07-09 09:25 ?762次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、
    的頭像 發表于 07-09 09:23 ?1084次閱讀

    計算機視覺和機器視覺區別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區別的領域。 一、定義 計算機視覺 計算機
    的頭像 發表于 07-09 09:22 ?529次閱讀

    計算機視覺人工智能領域有哪些主要應用?

    計算機視覺是人工智能領域的一個重要分支,它主要研究如何讓計算機能夠像人類一樣理解和處理圖像和視頻數據。計算機
    的頭像 發表于 07-09 09:14 ?1624次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有
    的頭像 發表于 07-09 09:11 ?1420次閱讀

    深度學習計算機視覺領域的應用

    深度學習技術的引入,極大地推動了計算機視覺領域的發展,使其能夠處理更加復雜和多樣化的視覺任務。本文將詳細介紹深度學習
    的頭像 發表于 07-01 11:38 ?977次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數據等技術的快速發展,計算機
    的頭像 發表于 06-06 17:17 ?1122次閱讀
    属鼠做生意办公桌摆貔貅好不好| 中山水果机定位器| 百家乐官网投注很好| 百家乐信誉平台现金投注| 万龙百家乐官网的玩法技巧和规则 | 棋牌58w| 状元百家乐官网的玩法技巧和规则 | 香港六合彩管家婆| 全讯网六仔开奖| 米其林百家乐的玩法技巧和规则 | 百家乐破解辅助| 永利博百家乐官网现金网| 大发888集团| 威尼斯人娱乐场官网| 百家乐换房| 真人百家乐赌法| 蓝盾百家乐具体玩法技巧| 百家乐赌博娱乐城| 百家乐娱乐城玩法| 百家乐全透明牌靴| 顶尖百家乐开户| 皇冠网百家乐赢钱| 电脑版百家乐分析仪| 百家乐有好的投注法吗| 保单百家乐游戏机厂家| 威尼斯人娱乐公司| 百家乐园首选| 金臂百家乐注册送彩金| 百家乐挂机软件| 百家乐娱乐平台开户| 百家乐牡丹娱乐城| 太阳城77娱乐城| 禄劝| 哪个百家乐官网平台信誉好| 百家乐官网娱乐平台网| 百家乐官网娱乐网网| 澳门百家乐心德| 百家乐软件代理| 大发888提款| 波音开户| 大发888娱乐城游戏下载|