最新德州扑克店长招聘,优惠最多网上赌场,2013真钱棋牌游戏排名(中国)·官方网站

數(shù)據(jù)集是機器學(xué)習(xí)算法的命脈——從某種意義上講，數(shù)據(jù)集對于自動駕駛等人工智能應(yīng)用領(lǐng)域，最重要的是它們的質(zhì)量最高。同時，數(shù)據(jù)集也衍生出自動駕駛行業(yè)新的商業(yè)模式。

這就是為什么nuTonomy今天發(fā)布了一個名為nuScenes的自動駕駛數(shù)據(jù)集，它聲稱其規(guī)模和精確度超過了KITTI、百度的ApolloScape和Udacity自動駕駛汽車數(shù)據(jù)集等公共數(shù)據(jù)集。

Scale為nuScenes提供了數(shù)據(jù)注釋，公司首席執(zhí)行官表示，這是有史以來發(fā)布的最健壯的開放源碼，基于多傳感器自動駕駛數(shù)據(jù)集。

NuTonomy編輯了1000多個場景，其中包含140萬幅圖像、40萬次激光雷達(dá)掃描（判斷物體之間距離）和110萬個三維邊界框（用RGB相機、雷達(dá)和激光雷達(dá)組合檢測的物體）。

它們已經(jīng)通過Scale的傳感器融合注釋API進(jìn)行了細(xì)致的標(biāo)簽，該API利用人工智能和人類團(tuán)隊進(jìn)行數(shù)據(jù)注釋，并且從本周開始面向行業(yè)開源。

近年來，越來越多的公司在加入這個行列。比如，早些時候全球紅外系統(tǒng)供應(yīng)商Flir發(fā)布了基于熱成像儀拍攝的1萬多張帶標(biāo)注圖片。Mapillary公司發(fā)布了25000張街道級別的圖像，以及加州大學(xué)伯克利分校上傳了10萬張基于RGB相機拍攝的視頻序列。

之所以被稱之為比之前其他公司和機構(gòu)發(fā)布的數(shù)據(jù)集更為全面，是因為此次數(shù)據(jù)搜集使用了6個攝像頭、1個激光雷達(dá)、 5個毫米波雷達(dá)、GPS及慣導(dǎo)系統(tǒng)，包括對于自動駕駛系統(tǒng)有挑戰(zhàn)性的復(fù)雜道路、天氣條件等。

參與此次數(shù)據(jù)標(biāo)注的Scale公司，自2016年成立以來，已經(jīng)為包括Lyft、Voyage、通用汽車、Zoox和Embark在內(nèi)的客戶標(biāo)出了超過20億英里的行駛里程。

今年8月，Scale宣布了一輪1800萬美元融資，迄今該公司已籌集到2270萬美元，報告稱去年公司收入增長了15倍。

數(shù)據(jù)標(biāo)注的對象通常有圖像、語音、文本、視頻、雷達(dá)等。圖像類主要針對視覺識別類公司，所要標(biāo)注的圖像內(nèi)容包括人像、建筑物、植物、道路、交通標(biāo)志、車輛等，每項內(nèi)容下面，又會根據(jù)不同的特征進(jìn)行不同標(biāo)簽的標(biāo)注。

業(yè)內(nèi)人士表示，一般而言，客戶會有自己的需求，公司依規(guī)而行。目前在國內(nèi)，阿里巴巴、騰訊、百度等大型互聯(lián)網(wǎng)公司，擁有海量的數(shù)據(jù)標(biāo)注需求，單個訂單量都是以億元為單位。如此大的訂單，基本都是分包給不同的數(shù)據(jù)標(biāo)注公司進(jìn)行處理，國內(nèi)外還沒有一家公司能夠處理這樣大的訂單。

另外還有自動駕駛公司，以及視覺圖像處理的公司，也有著數(shù)據(jù)標(biāo)注的強烈的需求，他們需要用標(biāo)注后的數(shù)據(jù)來訓(xùn)練人工智能，而人工智能的日趨成熟，是永無止境的。

業(yè)內(nèi)人士透露，數(shù)據(jù)標(biāo)注是一個簡單又困難的事情。簡單之處在于，確定了篩選規(guī)則以后，操作人員只需依規(guī)操作即可，沒有執(zhí)行上的難度，而困難之處在于，數(shù)據(jù)標(biāo)注本質(zhì)上是要獲得更準(zhǔn)確，更精細(xì)化的數(shù)據(jù)結(jié)果，高質(zhì)量的數(shù)據(jù)是業(yè)內(nèi)急需的。

“在數(shù)據(jù)采集上，由原來的普通行車記錄儀的數(shù)據(jù)采集，到現(xiàn)在已有諸多公司開始使用特殊采集設(shè)備采集行車數(shù)據(jù)。在數(shù)據(jù)標(biāo)注上，原來的2D標(biāo)注到3D標(biāo)注，再到語義分割，3D點云的標(biāo)注需求，對數(shù)據(jù)的要求越來越專業(yè)”，龍貓數(shù)據(jù)CEO昝智表示，“我們也正不斷開發(fā)新的標(biāo)注工具，適配自動駕駛行業(yè)的發(fā)展。”

昝智表示，未來至少10年內(nèi)，各領(lǐng)域?qū)?a href="http://www.zgszdi.cn/tags/ai/" target="_blank">AI數(shù)據(jù)的獲取需求只增不減。在發(fā)展的不同階段，龍貓數(shù)據(jù)也將不斷關(guān)注技術(shù)更新，適配新的需求。

而在在行業(yè)內(nèi)特斯拉是第一家規(guī)模化采集數(shù)據(jù)的汽車制造商，他們很早就用自己的車輛來收集數(shù)據(jù)，為無人駕駛技術(shù)研發(fā)提供基礎(chǔ)數(shù)據(jù)。

由于沒有獲取車輛數(shù)據(jù)源的通道，目前有很多汽車廠商都在模仿特斯拉的做法，通過在自己公司生產(chǎn)的車輛上安裝采集設(shè)備，獲取車輛數(shù)據(jù)并回傳到平臺，這是一種最直接的方式，也是相對比較明智的做法。

目前，全球主流的自動駕駛測試數(shù)據(jù)集包括Cityscapes、Imagenet（ILSVRC）、COCO、PASCAL VOC、CIFAR、MNIST、KITTI、LFW等。

Cityscapes

Cityscapes是由奔馳與2015年推出的，提供無人駕駛環(huán)境下的圖像分割數(shù)據(jù)集。用于評估視覺算法在城區(qū)場景語義理解方面的性能。

Cityscapes包含50個城市不同場景、不同背景、不同季節(jié)的街景，提供5000張精細(xì)標(biāo)注的圖像、20000張粗略標(biāo)注的圖像、30類標(biāo)注物體。用PASCAL VOC標(biāo)準(zhǔn)的 intersection-over-union（IoU）得分來對算法性能進(jìn)行評價。

Cityscapes是目前公認(rèn)的自動駕駛領(lǐng)域內(nèi)最具權(quán)威性和專業(yè)性的圖像語義分割評測集之一，其關(guān)注真實場景下的城區(qū)道路環(huán)境理解，任務(wù)難度更高且更貼近于自動駕駛等熱門需求。

KITTI

KITTI是由德國卡爾斯魯厄理工學(xué)院和豐田芝加哥技術(shù)研究院于2012年聯(lián)合創(chuàng)辦，是目前國際上最大的自動駕駛場景下的計算機視覺算法評測數(shù)據(jù)集。

KITTI用于評測3D目標(biāo)（機動車、非機動車、行人等）檢測、3D 目標(biāo)跟蹤、道路分割等計算機視覺技術(shù)在車載環(huán)境下的性能。

KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù)，每張圖像中多達(dá)15輛車和30個行人，還有各種程度的遮擋。

ILSVRC

ILSVRC也就是通常所說的Imagenet數(shù)據(jù)集，是美國斯坦福的計算機科學(xué)家李飛飛模擬人類的識別系統(tǒng)建立的。

它是目前深度學(xué)習(xí)圖像領(lǐng)域應(yīng)用較多的一個數(shù)據(jù)集，關(guān)于圖像分類、定位、檢測等研究工作大多基于此數(shù)據(jù)集展開。Imagenet數(shù)據(jù)集有1400多萬幅圖片，涵蓋2萬多個類別；其中有超過百萬的圖片有明確的類別標(biāo)注和圖像中物體位置的標(biāo)注。

COCO

COCO（common objects Dataset）數(shù)據(jù)集，它由微軟贊助，除了基本的圖像的標(biāo)注信息外，還有對圖像的語義文本描述，COCO數(shù)據(jù)集的特點是開源，這使得它在近三來在圖像分割語義理解領(lǐng)域取得了巨大的進(jìn)展，Google的開源show and tell生成模型就是在此數(shù)據(jù)集上測試的。

PASCAL VOC

PASCAL VOC是視覺對象的分類識別和檢測的一個基準(zhǔn)測試，提供了檢測算法和學(xué)習(xí)性能的標(biāo)準(zhǔn)圖像注釋數(shù)據(jù)集和標(biāo)準(zhǔn)的評估系統(tǒng)。

雖然它在2012年后便不再舉辦，但其數(shù)據(jù)集圖像質(zhì)量好，標(biāo)注完備，非常適合用來測試算法性能。

CIFAR

CIFAR（Can ada Institude For Advanced Research）包括CIFAR 10和CIFAR 100兩個數(shù)據(jù)集，它們被標(biāo)記為8000萬個微型圖像數(shù)據(jù)集的子集。

這些數(shù)據(jù)集是由Vinod Nair、Alex Krizhevsky和Geoffrey Hinton收集的。CIFAR對于圖像分類算法測試來說是一個非常不錯的中小規(guī)模數(shù)據(jù)集。

MNIST

MNIST（THE MNIST DATABASE of handwritten digits）號稱深度學(xué)習(xí)領(lǐng)域的“Hello World!”，是一個手寫的數(shù)字?jǐn)?shù)據(jù)集。當(dāng)前主流深度學(xué)習(xí)框架幾乎無一例外將MNIST數(shù)據(jù)集的處理作為介紹及入門第一教程。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴