衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解析yolov7采用的一項技術:模型結構重參化

博世蘇州 ? 來源:博世蘇州 ? 作者:博世蘇州 ? 2022-08-09 14:27 ? 次閱讀

Yolov7問世,刷新了目標檢測內卷的新上限!小博此次攜手博世AI大神Zlex做一次解析。今天,我們不準備解析yolov7,而是解析yolov7采用的一項技術:模型結構重參化。

首先,這要從古老的vgg說起,很久很久以前神經網絡還沒有很多花樣的時候,他是一個以卷積為主串聯的網絡結構,如下圖所示:

3a51761a-179c-11ed-ba43-dac502259ad0.png

3a5ec388-179c-11ed-ba43-dac502259ad0.png

由于見證了神經網絡的神奇效果,科學家工程師們前仆后繼開發了resnet, inception net, 以及自學習產生的efficientnet等等以結構創新為主的系列,以及歸一化系列(ln,bn,gn,in),激活函數系列, 卷積系列等各種新的計算層,還有各種損失函數層等等。

隨著思維的展開,除了從計算方法(數學推理角度)和網絡結構(實驗性創新角度)層面創新,還有哪些腦洞可以打開呢?是否可以實現數學和網絡結構方面的互相轉化?答案是肯定的,數學推算和結構設計之間是可以相互轉化的。

而模型結構重參化就是其中一種。

01

模型結構重參化

模型結構重參化是繼承了深度學習的特性,并作為思考點而展開的,也就是訓練(train)和推斷(deploy)分別思考的策略,通常我們是可以忍受訓練速度較慢,但是推理更加快速的部署方案。

基于這個現實的考慮,是否可能通過增加訓練的復雜度但不增加推斷運行的時間,從而達到模型能力的提升?

其實這一切都經不起科學家的推敲,這種思路的可行性答案也是肯定的,其實在很久之前的部署加速技巧—— Conv、BN、Relu 三個層融合(大部分情況是conv和bn融合)也是發現了——訓練和部署可以在網絡結構不同的情況下實現效果等價,這個數學公式等價變換思路。而tensorRT等部署加速方案也都融合了這項技術。

模型結構重參化(structural re-parameterization)是丁霄漢近年來提出的一種通用深度學習模型設計方法論。該方法論首先指出了構造一系列用于訓練的結構,并將其結構等價轉換為另一種用于測試的結構,也就是訓練和測試的結構不再相同,但是效果等效。

該理論是假設在訓練資源相對豐富的條件下,在不降低推理能力的前提下又能達到提速的目的。因此訓練時的模型可以足夠復雜,且具備優秀的性質。而轉換得到的推理時模型可以簡化,但能力不會減弱,也就是實現無損壓縮。

為什么要以vgg為例,而不是以目前各種先進復雜的結構為例解析這一設計呢?其原因在于:模型結構復雜提升了精度,但不利于硬件的各種并行加速計算。但vgg這種單一的結構更容易做很多的變形和加速操作,Repvgg就是基于vgg網絡的模型結構重參化。

論文中對比了resnet的參差結構和rep結構的不同,以及訓練和推理網絡如何轉化,如下圖所示:

3a80dd74-179c-11ed-ba43-dac502259ad0.png

以上設計方法論基于的數學關系是:

(i+c+b)*w=i*w + c*w + b*w的等式理論。

該等式畫成結構圖是:

3a988cda-179c-11ed-ba43-dac502259ad0.png

只不過在卷積的世界里,a和b表示的是一個n*n的核;而在一些設計里面,a和b的大小是不一致的。這個時候就需要把現在a和b的維度進行一致性轉換,也就是repvgg作者采用的:把1*1的核通過pad的方法補0操作變成3*3的核,達到a、b維度一致。

identity的操作相當于是1*1的單位矩陣卷積pad后就可以轉化為3*3的卷積核。還應該值得注意的是:每個卷積后面還跟著bn層,這是就用到了上述提到的conv和bn的融合計算方法。

02

Yolov7在這項技術上的發現和創新

Yolov7中的模型結構重參化做了哪些創新?

Zlex發現Rep的結構策略直接用到resnet等結構的網絡中達不到預期效果,分析后發現identity層的使用破壞了resnet的參差結構和densenet的級聯結構,因此去掉identity層,采用如下圖(g和h)的結構方式有效。

3aa93ab2-179c-11ed-ba43-dac502259ad0.png

03

Yolov7工業應用領域的改善空間

俗話說,極致的項目一般是“既要,也要,還要”的模式——既要推理速度快!也要推理精度高!還要訓練速度也不能太慢!

Yolov7無疑是吸收了很多仙氣修煉成的佳作,但也存在些許缺點,這些缺點也是該設計本質性的東西,Yolov7的訓練速度經過Zlex親測,比其他yolo系列慢了很多。對于資源有限型的AI愛好者也形成了一定的障礙,單元時間可以跑的實驗次數少了很多,驗證一些想法的節奏也慢了很多。

Yolov7給博世工業檢測、自動駕駛、數字化等領域又注入了新的超能力,應用過程中也會發現這樣或者那樣的問題,比方說訓練資源有限,速度跟不上項目的節奏,能力提升的trick不夠適應自己的應用場景,小數據訓練效果不佳,不同平臺的移植工作量大等等,需要我們博世工程師在適配、融合和改進的路上堅定的前進。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3305

    瀏覽量

    49220
  • 深度學習
    +關注

    關注

    73

    文章

    5513

    瀏覽量

    121546

原文標題:博采眾長 | 在提升深度學習模型能力方面的那些魔鬼細節:模型結構重參化

文章出處:【微信號:rbacinternalevents,微信公眾號:博世蘇州】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【「基于大模型的RAG應用開發與優化」閱讀體驗】+大模型微調技術解讀

    今天學習<基于大模型的RAG應用開發與優化>這本書。大模型微調是深度學習領域中的一項關鍵技術,它指的是在已經預訓練好的大型深度學習模型
    發表于 01-14 16:51

    ? SLA立體光固化成型:一項實現3D打印領域高精度數字模型實體的先鋒技術

    發明。自創造以來,便以優異的快速成型特征和高精度表現,成為了一項實現復雜數字模型實體的關鍵技術。它不僅突破了制造業的傳統模具模式,還能在加速將設計概念轉變成實際產品的同時,保持產品表
    發表于 01-09 18:57

    采用華為云 Flexus 云服務器 X 實例部署 YOLOv3 算法完成目標檢測

    、前言 1.1 開發需求 這篇文章講解:?采用華為云最新推出的 Flexus 云服務器 X 實例部署 YOLOv3 算法,完成圖像分析、目標檢測。 隨著計算機視覺技術的飛速發展,深度
    的頭像 發表于 01-02 12:00 ?119次閱讀
    <b class='flag-5'>采用</b>華為云 Flexus 云服務器 X 實例部署 <b class='flag-5'>YOLOv</b>3 算法完成目標檢測

    AMD獲得一項玻璃基板技術專利

    近日,處理器大廠AMD宣布獲得了一項涵蓋玻璃芯基板技術的專利(專利號“12080632”),這消息標志著AMD在高性能系統級封裝(SiP)領域的研究取得了重要進展。
    的頭像 發表于 12-02 10:33 ?255次閱讀

    手冊上新 |迅為RK3568開發板NPU例程測試

    yolov5目標檢測 6.13 yolov5-seg語義分割 6.14 yolov6目標檢測 6.15 yolov7目標檢測 6.16 yolov
    發表于 10-23 14:06

    中國電信人工智能研究院完成首個全國產萬卡萬模型訓練

    近日,中國電信人工智能研究院宣布了一項重大技術突破:成功完成國內首個基于全國產萬卡集群訓練的萬億參數大模型
    的頭像 發表于 09-30 16:41 ?1770次閱讀

    基于迅為RK3588【RKNPU2目實戰1】:YOLOV5實時目標分類

    【RKNPU2目實戰1】:YOLOV5實時目標分類 https://www.bilibili.com/video/BV1ZN411D7V8/?spm_id_from=333.999.0.0
    發表于 08-15 10:51

    手冊上新 |迅為RK3568開發板NPU例程測試

    yolov5目標檢測 6.13 yolov5-seg語義分割 6.14 yolov6目標檢測 6.15 yolov7目標檢測 6.16 yolov
    發表于 08-12 11:03

    YOLOv5的原理、結構、特點和應用

    YOLOv5(You Only Look Once version 5)是種基于深度學習的實時目標檢測算法,它屬于卷積神經網絡(CNN)的范疇。下面我將詳細介紹YOLOv5的原理、結構
    的頭像 發表于 07-03 09:23 ?6896次閱讀

    基于昇騰AI Yolov7模型遷移到昇騰平臺EA500I邊緣計算盒子的實操指南

    科技攜手昇騰推出了系列邊緣計算產品,具備性能強勁、更寬工溫、外設接口豐富、利舊性強等特點,同時,得益于昇騰AI軟件棧的全面支持,這些產品為各行業AI應用高效、低成本落地提供了強有力的支撐。 YOLOv7是目前YOLO系列目標檢測算法的
    的頭像 發表于 06-26 17:51 ?719次閱讀
    基于昇騰AI  <b class='flag-5'>Yolov7</b><b class='flag-5'>模型</b>遷移到昇騰平臺EA500I邊緣計算盒子的實操指南

    【大語言模型:原理與工程實踐】大語言模型的預訓練

    訓練數據時,數量、質量和多樣性三者缺不可。 數據的多樣性對于大語言模型至關重要,這主要體現在數據的類別和來源兩個方面。豐富的數據類別能夠提供多樣的語言表達特征,如官方知識型數據、口語表達的論壇
    發表于 05-07 17:10

    maixcam部署yolov5s 自定義模型

    部分不樣。 獲得自定義訓練得到的yolov5s onnx模型 準備自定義數據集(博主用的是VOC數據集) 數據集目錄結構如下: └─VOC2028:自定義數據集 ├─Annotat
    發表于 04-23 15:43

    NVIDIA即將推出一項新的生成式AI專業認證

    NVIDIA 即將推出一項新的生成式 AI 專業認證,助力開發者在這一重要領域證明自身技術實力。
    的頭像 發表于 03-14 09:43 ?591次閱讀

    華為技術近日公開了一項“超聲波指紋”專利

    國家知識產權局顯示,華為技術有限公司近日公開了一項“超聲波指紋”專利,該專利編號為 CN117058725A,申請日為 2023 年 7 月 4 日。
    的頭像 發表于 03-12 10:50 ?1074次閱讀
    華為<b class='flag-5'>技術</b>近日公開了<b class='flag-5'>一項</b>“超聲波指紋”專利

    機器視覺缺陷檢測是工業自動領域的一項關鍵技術

    機器視覺缺陷檢測是工業自動領域的一項關鍵技術
    的頭像 發表于 02-22 13:59 ?591次閱讀
    機器視覺缺陷檢測是工業自動<b class='flag-5'>化</b>領域的<b class='flag-5'>一項</b>關鍵<b class='flag-5'>技術</b>
    大发8888下载| 保单百家乐游戏机| 百家乐官网官网游戏| 百家乐官网公式软件| 买百家乐官网程序| 百家乐官网网站可信吗| 网上百家乐官网赌博网| 百家乐官网官| 乐中百家乐官网的玩法技巧和规则 | 百家乐作弊内幕| 澳门百家乐威尼斯| 跪求百家乐打法| 威尼斯人娱乐城是波音| 大发888 大发888游戏平台| 总统娱乐城| 镇赉县| 百家乐官网投注怎么样| 百家乐官网赌博赌博平台| 新世纪百家乐官网的玩法技巧和规则| 百家乐赢钱绝技| 百家乐澳门技巧| 百家乐开闲的几率多大| 娱乐城送白菜| 金宝博百家乐官网游戏| 玩百家乐官网秘诀| 24山坐向| 百家乐方法技巧| 泰山百家乐的玩法技巧和规则| 大发888下载安装| 兴文县| 百家乐官网一黑到底| 百家乐软件辅助| 香港百家乐赌城| 德州扑克牌| 百家乐官网平台开户哪里优惠多| 太阳百家乐官网管理网| 华侨人百家乐的玩法技巧和规则| 新葡京娱乐城开户| 百家乐官网投注心态| 百家乐EA平台| 大发888yule|