作者:Paula Ramos博士,前Intel技術(shù)布道師
編者按:文并不是逐字逐句翻譯,而是以更有利于中文讀者理解的目標(biāo),做了刪減、重構(gòu)和意譯,并替換了多張不適合中文讀者的示意圖。
原文鏈接:https://medium.com/@paularamos_phd/journey-into-visual-ai-exploring-fiftyone-together-part-ii-getting-started-14cca5adfcd3
一,前言
上次我們介紹了《視覺(jué)AI之旅:一起探索 FiftyOne——第一部分丨簡(jiǎn)介丨》,今天作為FiftyOne系列的第二篇,本文將帶您踏上使用這個(gè)開(kāi)源工具包的激動(dòng)人心的旅程,幫助您連接數(shù)據(jù)、模型和部署。也將展示FiftyOne如何在您處理2D圖像、3D點(diǎn)云或其他視覺(jué)數(shù)據(jù)時(shí),為您的數(shù)據(jù)集解鎖真正的價(jià)值。咖啡數(shù)據(jù)集與AI工作流程的革新
二,咖啡數(shù)據(jù)集與AI工作流程的革新
1,從哥倫比亞咖啡數(shù)據(jù)集到現(xiàn)代機(jī)器學(xué)習(xí)應(yīng)用
Paula Ramos博士曾在哥倫比亞與咖啡數(shù)據(jù)集合作,面臨數(shù)據(jù)集策劃、注釋和處理的諸多挑戰(zhàn)。本文將介紹FiftyOne如何轉(zhuǎn)變您的工作流程,加快AI生產(chǎn)過(guò)程,并從數(shù)據(jù)中提取可操作的洞察。
2,耗時(shí)的AI工作流程和看不見(jiàn)的復(fù)雜性
AI解決方案的開(kāi)發(fā)始終是耗時(shí)的。我們經(jīng)常在沒(méi)有完全理解數(shù)據(jù)中的模式、偏見(jiàn)或噪聲的情況下收集數(shù)據(jù)集。FiftyOne可以幫助我們理解這些復(fù)雜性如何影響AI方程。
3,咖啡愛(ài)好者的數(shù)據(jù)集
本文將使用我的一個(gè)數(shù)據(jù)集——用智能手機(jī)相機(jī)拍攝的咖啡樹(shù)枝圖像集合。目標(biāo)是使用語(yǔ)義分割任務(wù)計(jì)算樹(shù)枝上的咖啡果實(shí)數(shù)量。
三,為什么選擇FiftyOne?
FiftyOne是一個(gè)基于Python的API(SDK)和GUI(APP),允許您使用可操作的命令探索、策劃和分析數(shù)據(jù)集。以下是一些FiftyOne的功能,您可以在我的筆記本上復(fù)制這些操作。
1,隨機(jī)打亂數(shù)據(jù)集
import fiftyone as fo from fiftyone.utils.coco import COCODetectionDatasetImporter dataset = fo.Dataset.from_dir( dataset_type=fo.types.COCODetectionDataset, dataset_dir="./colombian_coffee", data_path="images/default", labels_path="annotations/instances_default.json", label_types="segmentations", label_field="categories", name="coffee", include_id=True, overwrite=True ) view = dataset.shuffle()
2,使用fiftyone brain了解您的數(shù)據(jù)集
FiftyOne的fiftyone brain功能可以幫助您理解數(shù)據(jù)集,識(shí)別潛在偏見(jiàn),可視化實(shí)驗(yàn)關(guān)系。
3,發(fā)現(xiàn)獨(dú)特性
import fiftyone.brain as fob fob.compute_uniqueness(dataset) # 探索最獨(dú)特的樣本 session.view = dataset.sort_by("uniqueness", reverse=True) # 探索最不獨(dú)特的樣本 session.view = dataset.sort_by("uniqueness") 4. 利用相似性搜索 python fob.compute_similarity( dataset, model="clip-vit-base32-torch", brain_key="img_sim", )
4,嵌入可視化
fob.compute_visualization(dataset, brain_key="img_viz")
四,總結(jié)
盡管目前我們?cè)?a href="http://www.zgszdi.cn/v/tag/3744/" target="_blank">計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)方面取得了進(jìn)步,但數(shù)據(jù)質(zhì)量、生產(chǎn)時(shí)間和可擴(kuò)展性等挑戰(zhàn)仍然存在。FiftyOne通過(guò)提供以數(shù)據(jù)為中心的AI方法來(lái)解決這些挑戰(zhàn)。
敬請(qǐng)期待下一篇文章,我們將探索FiftyOne的核心功能,操作數(shù)據(jù)集,并評(píng)估模型。讓我們將這次與FiftyOne的旅程變成一個(gè)協(xié)作和豐富的體驗(yàn)。編程愉快!
我們期待聽(tīng)到您的經(jīng)驗(yàn)!請(qǐng)?jiān)谠u(píng)論區(qū)分享您的看法,您的見(jiàn)解可能會(huì)幫助我們?cè)谙乱黄恼轮袔椭恕?/p>
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內(nèi)容請(qǐng)關(guān)注“算力魔方?”!
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
31513瀏覽量
270328
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論