澳门赌场博彩出千案件,财神棋牌官网,线路检测页面入口图片大全(中国)·官方网站

YOLO算法，英文全稱是You Only Look Once，直接谷歌英文全稱就能找到那篇論文，同時作者也在github上開源了代碼。需要說明的是這篇推文是關于yolo v1，還有一個升級版。

顧名思義，這個算法就是只看一遍圖片就能把所有的物體都識別出來，這個算法能夠做到實時的物體檢測，大約能達到40幀每秒，速度是非?？斓摹Ｄ侨绾稳ト胧诌@個算法呢？相信大家已經看過不少介紹YOLO算法的文章了，所以我在這里也不打算深入去講解這個算法了，而是盡量用簡潔的語言去闡述一下這個如此迷人的算法。

用簡潔的語言來闡述YOLO算法

和其它推文最大的不同是，我會介紹如何從實戰的角度去自己去做一個數據集，如何讓電腦識別特定的一個物體。

那先來看一下我實現的效果是怎么樣的。首先我隨手找了我桌上的藍色水杯，收集了兩百多張自己水杯的圖片，為了減少工作量，我用水杯的數據集去替換了原來是車輛（car）的所有數據。經過十幾個小時的訓練之后，效果如下：

用簡潔的語言來闡述YOLO算法

那怎么去實現呢？首先我覺得你要先“懂”這個算法，至少你要了解它是怎么實現的，原理是什么，輸入輸出是什么。為了學習這個算法，我也是花了大量時間去看作者的論文和代碼。我覺得論文配合代碼是一個很好的學習方式。通過代碼可以很清晰去了解它是如何去實現這個算法的。

這個算法的核心在于它把圖片劃分成了7*7個網格，注意這7*7個網格不是將一張圖片切割成49個小塊，而是說一個網格會對應一個輸出結果。可能會覺得有點抽象，我們先來看圖。

比如說上面這張圖，一共有49個網格，每個網格的任務就是去判斷這個物體的中心點是否落在該網格，如果是落在自身網格，那好，那這個網格就會跟系統匯報。假定上圖中被標記的紅色網格我們把它命名為小格，然后小格發現這里好像有條狗，于是乎它跟系統匯報說：我這里有條狗，然后系統問了一句：那這條狗有多寬有多高？小格好像有點懵，但是根據它的經驗，小格大概能猜出來，于是回答了系統：這條狗大概100像素寬，250像素高吧。到這里，小格的任務就基本完成了，小格只是49個網格之一，其它的網格也一樣。于是系統就收集了49個網格的意見，然后就得到了下圖。

其實在這張圖片中可以出現49*2=81個預測框，也就是說沒一個網格可以有對目標有兩個預測，因此最多可以出現81個預測框。可以在圖中看到，其實會出現很多無用框，相鄰的網格可能會出現相似的結果，以此我們可以通過極大值抑制過濾一部分的預測框。然后就可以得到下圖結果。

但是相信我，即使你已經全部理解了上面我說的，你也不一定能一下子看懂代碼，在我閱讀代碼的時候發現雖然代碼不多，邏輯也比較清晰，但是有一些細節還是讓人難以理解。那我就帶大家來捋一下吧！

比較重要的代碼主要是在pasal_voc.py、config.py、yolo_net.py和train.py。加載數據的代碼在pasal_voc.py里面，代碼并不是很難，不過要注意一點的就是一張圖片的label其實是一個7*7*25的矩陣，一個25的向量組成是這樣的：第一位是0或1，表示是否有物體，然后接下來的四位是邊界框的信息，也就是(x,y,w,h)，剩下的就是one-hot編碼表類別。而預測的結果是7*7*30的，因為要預測兩個框。

用簡潔的語言來闡述YOLO算法

還有一個比較精髓的是它損失函數的定義，它對每一個預測值都計算了均方誤差，但是懲罰程度卻是不一樣的。

用簡潔的語言來闡述YOLO算法

其中λcoord = 5.0, λnoobj = 1.0,λclasses = 2.0，但是這組數字是這么得來的小編就不知道了，有可能是從大量測試中得到的一組最優解，也可能是從數學公式推算出來的吧。其實還有很多小細節，是很難描述出來的，如果要把一個小細節說明白可以就會牽扯到無數個細節，所以我建議你們自己通過代碼去把細節搞懂。

在你已經了解了代碼之后，就很容易做到文章開頭的那個效果了。那我講解一下我的思路和過程，最重要的還是要自己動手。當你去研究過它的數據集之后，你會發現這個數據集的標注是一個xml文件，每一個圖片就對應一個xml文件。當你收集好數據集之后就可以去做數據集標記了，但是最簡單的xml文件的格式是要求如下的：

這個是我數據集中的標注，也是能滿足代碼的最簡單的標注，我是自己寫了一個程序幫助我完成標記的，但是我推薦你們可以用別人的標注工具，因為畢竟別人已經寫好了就沒有必要再去重復造車輪。

這個就是一個標注的工具，但是我也沒用過，但是看描述應該是符合要求的。做好圖片標注之后就要考慮如何去修改它的數據集呢？難不成一張張粘貼進去，當然你可以這樣做，但是工作量是很大的，好吧，那就交給計算機去解決吧。我在加載數據集的時候做了一個判斷，如果一旦這張圖片里面有車，我就不加載這個數據了，指定一個路徑讓它去加載我們做好的數據集。

findcar = 0for obj in objs: cls_ind = obj.find('name').text.lower().strip() if cls_ind == 'car': findcar = 1 break

接下來就是你們思考如何去解決了。當你解決這個問題并能訓練的時候，如無意外你應該能得到和我一樣的結果，祝你們好運！

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4630

瀏覽量
93354

原文標題：項目實戰 | YOLO算法識別特定物體

文章出處：【微信號：gh_a204797f977b，微信公眾號：深度學習實戰】歡迎添加關注！文章轉載請注明出處。

衡阳派盒市场营销有限公司

搜索歷史

用簡潔的語言來闡述YOLO算法

評論

使用C語言進行PID算法實現

用JAVA語言實現RSA公鑰密碼算法

用C語言實現DES算法

用C語言實現FFT算法

如何編寫高效簡潔的C語言代碼

C語言實現PID算法

C語言經典算法

『 RJIBI 』-基于FPGA的YOLO-V3物體識別計算套件

如何使用Zynq SoC硬件加速實現改進TINY YOLO實時車輛檢測的算法

基于深度學習YOLO系列算法的圖像檢測

嵌入式設備的YOLO網絡剪枝算法

目標檢測—YOLO的重要性！

基于YOLO算法實現鋼筋數量的智能盤點

目標檢測YOLO系列算法的發展過程

目標檢測算法YOLO的發展史和原理