衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于CUDA技術(shù)的視頻顯示系統(tǒng)設(shè)計方案

電子設(shè)計 ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2018-01-18 07:30 ? 次閱讀

NVIDIA 推出的CUDA(計算統(tǒng)一設(shè)備架構(gòu))是基于GPU 進行通用計算的開發(fā)平臺,非常適合大規(guī)模的并行數(shù)據(jù)計算。在GPU 流處理器架構(gòu)下用CUDA 技術(shù)實現(xiàn)編碼并行化,并針對流處理器架構(gòu)特點進行內(nèi)存讀寫等方面的優(yōu)化。

本文在此采用CUDA技術(shù),實現(xiàn)了計算機桌面環(huán)境的多屏幕融合顯示的純軟件拼接系統(tǒng)。該系統(tǒng)不但較以往單一的視頻拼接系統(tǒng)功能更加強大,也較采用分屏器等硬件輔助的融合系統(tǒng)成本更低,適應(yīng)性更強。目前實驗表明,CUDA 技術(shù)在并行處理方面的優(yōu)越性使得該系統(tǒng)畫面實時處理快,互動展示性好,具有很大的商業(yè)使用前景。

0 引言

近年來隨著大屏幕顯示技術(shù)在各領(lǐng)域應(yīng)用的逐步深入,市場已經(jīng)不滿足單一的影片展示,更多的轉(zhuǎn)向了對互動性更強的計算機桌面環(huán)境的融合顯示上來。而目前市場上主流的桌面融合系統(tǒng),多采用分屏器等硬件輔助設(shè)備,成本高,性能差。

統(tǒng)一計算架構(gòu)(Compute Unified Device Architect-ure,CUDA)是英偉達(NVIDIA)公司近年來推出的通用并行計算架構(gòu),它以高性能顯卡GPU為硬件依托,采用CPU+GPU的混合計算極大的提高了大規(guī)模的圖形數(shù)據(jù)實時處理效率。本文設(shè)計的視頻顯示系統(tǒng),采用CUDA開發(fā)方式實現(xiàn)了計算機桌面圖片的分割計算、貝塞爾曲線擬合、以及融合圖像計算等三方面處理。實時性高,畫面數(shù)據(jù)計算理論上精確值1 4 像素,精度好。

1 系統(tǒng)框架設(shè)計

圖像處理的本質(zhì)是大規(guī)模矩陣運算,特別適合并行處理。但CPU 通用計算很難利用該特性。與此相反,GPU 在并行數(shù)據(jù)運算上具有強大的計算能力,特別適合作運算符相同而運算數(shù)據(jù)不同的運算,當(dāng)執(zhí)行具有高運算密度的多數(shù)據(jù)元素時,內(nèi)存訪問的延遲可以被忽略。CUDA 編程模型將CPU 作為主機(Host ),GPU作為協(xié)處理器(Coprocessor)或設(shè)備(Device),一個系統(tǒng)中可以存在多個設(shè)備。在這個模型中,CPU 與GPU共同工作,CPU 負(fù)責(zé)邏輯性強的事務(wù)處理和串行計算,GPU 則專注于執(zhí)行高度線程化的并行處理任務(wù)。

本系統(tǒng)以NVIDIA GeForce GTX470 搭建的計算平臺為運行環(huán)境,利用顯卡的多頭輸出特性,連接多臺投影儀組成拼接屏幕陣列,不需要額外增加其他硬件設(shè)備。由于桌面融合顯示系統(tǒng)要處理的圖像數(shù)據(jù)大、實時性高的特點,所以本系統(tǒng)的軟件設(shè)計上則廣泛使用了多CPU并行編程技術(shù)和CUDA并行計算技術(shù),針對每一個投影設(shè)備的圖像處理和顯示,系統(tǒng)會分配一個專門的線程來處理。該線程會對應(yīng)固定的CPU和固定的GPU計算核心,保證多投影設(shè)備完全并行處理,從而避免了其他系統(tǒng)由于顯示設(shè)備增多,處理數(shù)據(jù)變大而造成的性能下降。CUDA架構(gòu)如圖1所示。

本系統(tǒng)在設(shè)計中,首先設(shè)置定時器。定期采集控制屏幕圖像信息保存到公共存儲空間,然后針對外設(shè)顯示設(shè)備個數(shù)動態(tài)的開啟數(shù)個線程完成圖像的數(shù)據(jù)分割、圖像的數(shù)據(jù)融合以及圖像的顯示等工作。其中在線程開啟初始就與固定的GPU 計算核心相關(guān)聯(lián),并把數(shù)據(jù)圖形分割和融合部分采用CUDA技術(shù)進行實現(xiàn),最后同樣采用定時器技術(shù)同步各個線程中圖像數(shù)據(jù)顯示工作。

通常采用貝塞爾曲線擬合方法來完成圖像數(shù)據(jù)的融合。該方法的一般做法是先由控制點得出目標(biāo)圖像每行的貝塞爾曲線,組成二維貝塞爾曲面,再將目標(biāo)圖像數(shù)據(jù)采用貼紋理的方法擬合到貝塞爾曲線上從而實現(xiàn)圖像變形。Bezier 曲線是法國雷諾汽車公司Bezier 提出的一種用控制多邊形定義曲線和曲面的方法。它的擬合插值公式為:

式中:Pi 為構(gòu)成該曲線的特征多邊形;Bi,n (t) 是Bezier基函數(shù),是曲線上各點位置矢量的調(diào)和函數(shù)。Bezier曲線的始點、末點與其特征多邊形端點重合,且始點、末點的切線方向與特征多邊形的第一和最后一條邊一致。

該曲線具有凸包性、對稱性等特性。貝塞爾曲線的優(yōu)點是給定足夠的控制點后,它能夠擬合任意形狀的曲線。

Bezier曲線的擬合插值公式中,函數(shù)的次數(shù)是與特征多邊形的頂點數(shù)相應(yīng)的,當(dāng)特征多邊形頂點數(shù)為4時,就構(gòu)成三次Bezier 曲線。三次Bezier曲線的擬合插值公式為:

OPenGL技術(shù)提供了易于操作的貝塞爾曲線生成函數(shù)和貼圖函數(shù),但卻無法控制硬件運算,效率不高。本系統(tǒng)出于對時效性的考慮在實現(xiàn)過程中并未采用該方法,而是采用CUDA技術(shù)并行矩陣運算的方式來進行紋理貼圖。根據(jù)CUDA 程序的結(jié)構(gòu)特點,本系統(tǒng)處理時,首先根據(jù)人機交互部分得到的控制點信息采用通常方法生成目標(biāo)圖像每行的貝塞爾曲線。開辟顯存存入GPU,然后對應(yīng)CUDA 程序結(jié)構(gòu),針對目標(biāo)圖像上的每一個像素點,為其分配一個GPU thread 來進行處理。

觀察上面的計算公式發(fā)現(xiàn),當(dāng)獲得了初始控制點坐標(biāo)后,在得出每一條貝賽爾曲線上的點的過程中,彼此并不影響,具有多線程的粗粒度的特性,所以CUDA 并行計算的時效性有很大的提高。

2 性能評估

在多媒體拼接系統(tǒng)中實時性是最基本、也是最重要的指標(biāo)。我們觀看到的大屏幕拼接動態(tài)效果是由一幀一幀圖片快速顯示而產(chǎn)生的。根據(jù)正常的人眼視覺殘留水平系統(tǒng)要達到顯示流暢的畫面,1 s 要處理至少25 張圖片,也就是說整個程序一次圖像處理流程不會超過40 ms.下面本文將分析一下該系統(tǒng)的時效性。

由于圖像采集部分和處理部分采用的是異步方式,時間復(fù)用,而顯然處理部分的耗時又遠(yuǎn)遠(yuǎn)超過采集部分,所以只列出處理部分的時間消耗,又因為該部分效率主要受顯卡GPU 性能影響,所以之對比不同型號GPU 的時間消耗情況。具體如表1所示。

由此我們看出采用GeForce8800GT 顯卡可以基本上完成顯示功能,而采用GeForceGTX470則可以每秒鐘顯示35~40張圖片,是用戶完全感覺流暢的視頻體驗。

3 結(jié)語

今年來大屏幕對計算機操作演示的需求越來越多,而高性能顯卡的發(fā)展又促使GPU計算逐漸成為大規(guī)模并行計算重要的解決途徑。本系統(tǒng)采用了CUDA技術(shù)實現(xiàn)了視頻拼接系統(tǒng),目前本系統(tǒng)采用兩個雙頭顯卡組成顯示功能模塊最多實現(xiàn)四屏拼接,如果需要更多屏幕拼接顯示時可以考慮使用網(wǎng)絡(luò)C-S 結(jié)構(gòu)進行擴展。由于耗時的圖像處理部分完全有GPU 進行計算,屏幕越多需要計算的內(nèi)容也隨之增多,而同時系統(tǒng)顯卡數(shù)量也會增多,所以該系統(tǒng)不會隨著拼接屏幕增多而性能下降。由于系統(tǒng)總體采用并行技術(shù),所以將來可以方便地為系統(tǒng)加入時下流行的人機互動模塊、真實感渲染模塊等部分,使之真正成為一款高性能多媒體展示系統(tǒng),給用戶一個全方位真實的體驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5076

    瀏覽量

    103723
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4775

    瀏覽量

    129357
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    121

    瀏覽量

    13686
  • 分屏器
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    10774
收藏 人收藏

    評論

    相關(guān)推薦

    別墅能源管理系統(tǒng)通信設(shè)計方案

    水貨應(yīng)屆畢業(yè)生剛?cè)肼殞嵙?xí),領(lǐng)導(dǎo)要求提出一個別墅能源管理系統(tǒng)具體的通信方案系統(tǒng)應(yīng)該包括以下幾個部分的通信: 1光伏PV 2.逆變器pcs 3.儲能電池,電池能源管理系統(tǒng)BMS 4.電表
    發(fā)表于 10-25 14:44

    智能家居系統(tǒng)設(shè)計方案

    、安全的生活體驗。本案例將詳細(xì)介紹一套智能家居系統(tǒng)設(shè)計方案,包括系統(tǒng)架構(gòu)、功能模塊、設(shè)備選型、應(yīng)用場景以及實施步驟等方面。
    的頭像 發(fā)表于 07-23 15:28 ?2245次閱讀

    打破英偉達CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA

    、英特爾等廠商雖然在努力追趕,但目前還未能看到有威脅英偉達地位的可能。 ? 最近一家英國公司Spectral Compute推出了一款方案,可以為AMD的GPU原生編譯CUDA源代碼,目前正在RNDA2、RDNA3上進行規(guī)模測試。這或許可以打破
    的頭像 發(fā)表于 07-19 00:16 ?4886次閱讀

    復(fù)雜電磁環(huán)境模擬系統(tǒng)設(shè)計方案

    智慧華盛恒輝復(fù)雜電磁環(huán)境模擬系統(tǒng)設(shè)計方案是一個綜合性的工程任務(wù),涉及多個方面的考慮和技術(shù)實現(xiàn)。以下是一個基于現(xiàn)有技術(shù)和應(yīng)用需求的設(shè)計方案
    的頭像 發(fā)表于 07-17 17:06 ?516次閱讀

    電磁頻譜數(shù)據(jù)綜合管理系統(tǒng)設(shè)計方案

    智慧華盛恒輝電磁頻譜數(shù)據(jù)綜合管理系統(tǒng)設(shè)計方案是一個復(fù)雜且精細(xì)的過程,旨在實現(xiàn)對無線電頻譜資源的全面監(jiān)控、分析和管理。以下是一個基于當(dāng)前技術(shù)和應(yīng)用需求的設(shè)計方案概述: 智慧華盛恒輝
    的頭像 發(fā)表于 07-15 17:19 ?571次閱讀

    電磁頻譜管理系統(tǒng)設(shè)計方案

    智慧華盛恒輝電磁頻譜管理系統(tǒng)設(shè)計方案是一個綜合性的項目,旨在有效地管理和利用電磁頻譜資源,確保各種無線通信服務(wù)的順暢進行,并避免頻譜資源的沖突和浪費。以下是一個基于當(dāng)前技術(shù)和應(yīng)用需求的電磁頻譜管理
    的頭像 發(fā)表于 07-15 16:40 ?535次閱讀

    電磁軌跡預(yù)測分析系統(tǒng)設(shè)計方案

    智慧華盛恒輝電磁軌跡預(yù)測分析系統(tǒng)設(shè)計方案是一個綜合性的項目,它結(jié)合了電磁學(xué)、運動學(xué)、數(shù)據(jù)分析以及可能的人工智能或機器學(xué)習(xí)技術(shù),以實現(xiàn)對電磁運動軌跡的精確預(yù)測和深入分析。以下是一個基于當(dāng)前技術(shù)
    的頭像 發(fā)表于 07-15 16:22 ?458次閱讀

    工廠視頻智能分析系統(tǒng)解決方案 TensorFlow

    工廠視頻智能分析系統(tǒng)解決方案通過安裝在工廠生產(chǎn)施工作業(yè)現(xiàn)場的各個監(jiān)控裝置,構(gòu)建智能監(jiān)控分析預(yù)警和防范體系,工廠視頻智能分析系統(tǒng)解決
    的頭像 發(fā)表于 07-03 22:48 ?384次閱讀
    工廠<b class='flag-5'>視頻</b>智能分析<b class='flag-5'>系統(tǒng)</b>解決<b class='flag-5'>方案</b> TensorFlow

    UPS系統(tǒng)設(shè)計方案解讀

    UPS的應(yīng)用場景日趨多樣化,每個場景都有其獨特的需求,對應(yīng)不同的方案。UPS系統(tǒng)方案指南繼續(xù)上新,本文將聚焦UPS設(shè)計方案展開講述。
    的頭像 發(fā)表于 06-26 10:06 ?921次閱讀
    UPS<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>設(shè)計方案</b>解讀

    光伏儲能系統(tǒng)設(shè)計方案

    使用。本文旨在詳細(xì)闡述一個光伏儲能系統(tǒng)設(shè)計方案,包括系統(tǒng)概述、系統(tǒng)組成、設(shè)計原則、關(guān)鍵技術(shù)、設(shè)計步驟和預(yù)期效果等方面。
    的頭像 發(fā)表于 05-17 16:36 ?1449次閱讀

    Keil使用AC6編譯提示CUDA版本過高怎么解決?

    \' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1
    發(fā)表于 04-11 07:56

    LED顯示設(shè)計方案

    1、LED顯示屏基礎(chǔ)知識2、LED顯示屏設(shè)計要素3、LED顯示屏驅(qū)動方案4、LED顯示屏控制系統(tǒng)
    發(fā)表于 04-03 17:21 ?13次下載

    基于 PCIe 的多路視頻采集與顯示系統(tǒng)介紹

    電子發(fā)燒友網(wǎng)站提供《基于 PCIe 的多路視頻采集與顯示系統(tǒng)介紹.pdf》資料免費下載
    發(fā)表于 02-23 09:47 ?0次下載

    V4L2視頻采集,基于PCIe的多路視頻采集與顯示系統(tǒng)

    視頻采集與顯示系統(tǒng)可以實時采集多路視頻信號,并存儲到視頻采集隊列中,借助高效的硬實時視頻幀出入
    的頭像 發(fā)表于 02-22 20:05 ?1045次閱讀
    V4L2<b class='flag-5'>視頻</b>采集,基于PCIe的多路<b class='flag-5'>視頻</b>采集與<b class='flag-5'>顯示</b>子<b class='flag-5'>系統(tǒng)</b>

    諾瓦星云成功上市,專注LED顯示控制及視頻處理技術(shù)

    近日,主營LED顯示控制系統(tǒng)視頻處理系統(tǒng)產(chǎn)品研發(fā)、生產(chǎn)和銷售的諾瓦星云,在深圳證券交易所成功上市。這家自2008年成立的公司,長期專注于視頻
    的頭像 發(fā)表于 02-18 11:17 ?1017次閱讀
    百家乐官网种类| 百家乐下注平台| 百家乐官网视频无法显示| 足球走地| 超级老虎机系统| 百家乐网盛世三国| 风水上看做生意养金毛好吗| 最新百家乐官网电脑游戏机| 延吉市| 娱乐城开户免存送现金| 威尼斯人娱乐城会员| 百家乐庄家优势| 做生意门朝山| 百家乐官网娱乐场开户注册| 真人百家乐官网试玩账号| 青岛市| 速博娱乐| 二八杠网| 百家乐庄闲偏差有多大| 真钱百家乐游戏排行| 百家乐官网棋牌游戏币| 百家乐官网制胜法| 澳门百家乐官网真人娱乐场| 土默特右旗| 体育投注| 娱乐城送38| 大发888棋牌乐城下载| 淘金百家乐的玩法技巧和规则 | 大发888体育在线| 百家乐桌定制| 太阳城百家乐的破解| 百家乐官网是真人发牌吗| 单机百家乐官网破解方法| 百家乐官网赌场方法| k7百家乐官网最小投注| r百家乐官网娱乐下载| 措美县| 伟博娱乐| 德州扑克大赛| 申城棋牌2.0| 棋牌游戏平台有哪些|