衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

提供一種logit的調整方法來應對長尾分布的問題

工程師鄧生 ? 來源:GiantPandaCV ? 作者:Garfield ? 2022-09-05 14:31 ? 次閱讀

1. 論文信息

2. 介紹

在傳統的分類和識別任務中,訓練數據的分布往往都受到了人工的均衡,即不同類別的樣本數量無明顯差異,如最有影響力的ImageNet,每種類別的樣本數量就保持在1300張左右。

aece2de2-2cd9-11ed-ba43-dac502259ad0.jpg

在實際的視覺相關任務中,數據都存在如上圖所示的長尾分布,少量類別占據了絕大多少樣本,如圖中Head部分,大量的類別僅有少量的樣本,如圖中Tail部分。解決長尾問題的方案一般分為4種:

重采樣 (Re-sampling):采樣過程中采樣不同的策略,如對tail中的類別樣本進行過采樣,或者對head類別樣本進行欠采樣。

重加權 (Re-weighting):在訓練過程中給與每種樣本不同的權重,對tail類別loss設置更大的權重,這樣有限樣本數量。

新的學習策略 (Learning strategy):有專門為解決少樣本問題涉及的學習方法可以借鑒,如:meta-learning、transfer learning。另外,還可以調整訓練策略,將訓練過程分為兩步:第一步不區分head樣本和tail樣本,對模型正常訓練;第二步,設置小的學習率,對第一步的模型使用各種樣本平衡的策略進行finetune。

其實就筆者喜歡的風格而言,我對重加權這一方向的工作更為喜歡,因為通過各種統計學上的結論,來設計很好的loss改進來解決長尾/不均衡分布問題,我喜歡這類研究的原因是,他們(大部分)實現簡單,往往只需幾行代碼修改下loss,就可以取得非常有競爭力的結果,因為簡單所以很容易運用到一些復雜的任務中。

而從“奧卡姆剃刀”來看,我覺得各種遷移模型的理念雖然非常好,從頭部常見類中學習通用知識,然后遷移到尾部少樣本類別中,但是往往會需要設計復雜的模塊,有增加參數實現過擬合的嫌疑,我認為這其實是把簡單問題復雜化。我覺得從統計方面來設計更加優美,因此本文來介紹一篇我非常喜歡的從統計角度出發的工作。這篇論文來自Google Research,他們提供了一種logit的調整方法來應對長尾分布的問題。由于研究風格更偏向 machine learning, 所以論文風格更偏向統計類。

本文首先總結了對于logit的調整方法:

聚焦于測試階段:對學習完的logit輸出進行處理(post-hoc normalization),根據一些先驗假設進行調整。

聚焦于訓練階段:在學習中調整loss函數,相對平衡數據集來說,調整優化的方向。

aeddeafc-2cd9-11ed-ba43-dac502259ad0.png

如上圖,這兩種方法都有許多較為優秀的工作,但是文中描述了這兩種方法的幾種限制:

weight normalization非常依賴于weight的模長會因為class的data數量稀少而變小,然而這種假設非常依賴于優化器的選擇

直接修改loss進行重加權,也會影響模型的表征學習,從而導致優化過程不穩定,同時模型可能對尾部類過擬合,傷害了模型表征學習能力。

論文的motivation就是克服這些缺點,讓不同類(head and tail classed)之間的logit能有一個相對較大的margin,設以一個consistent的loss,來讓模型的性能更好。

3. 問題設定和過往方法回顧

3.1 Problem Settings

論文先從統計學的角度定義了一下這個problem settings,其實就是訓練一個映射,讓這個scorer的誤分類損失最小:

但是類別不平衡的學習的setting導致P(y)分布是存在高度地skewed,使得許多尾部類別標簽出現的概率很低。在這里,錯誤分類的比例就不是一個合適的metric: 因為模型似乎把所有的尾部類別都分類成頭部類別也更夠取得比較好的效果。所為了解決這個問題,一個自然的選擇是平衡誤差,平均每個類的錯誤率,從而讓測試計算出的metric不是有偏的。

論文總結出了一個比較general的loss形式:

這里 是類別 yy 的權重;是另一個超參, 用來控制 margin 的大小。

3.2 Post-hoc weight normalization

由于頭部類別多,容易過擬合,自然會對頭部類別overconfidence,所以我們需要通過一定的映射來調整logit。具體到調整的策略,自然是讓大類置信度低一點,小類置信度高一點。

for , where and . Intuitively, either choice of upweights the contribution of rare labels through weight normalisation. The choice is motivated by the observations that tends to correlate with . Further to the above, one may enforce during training.

這里引用了一些其他做long-tail learning的論文,可以參考以便更好地對這一塊進行理解。

3.3 Loss modification

至于對于loss的修改,就是很直接了在前面加一個權重,對于的取值,自然就是各個工作重點關注和改進的地方。

af02f478-2cd9-11ed-ba43-dac502259ad0.png

論文給予原有的各種方法各種比較全面的總結。

4. 方法

首先進行Post-hoc logit adjustment:

其實等號左邊就是一個根據類別的樣本數進行re-weighting。但是為了在exp的線性變換加上temperature時候不影響排序問題,所以把等號右邊變成上式,通過這種方式放縮不會導致原本的排序出現問題。從而使得重加權仍能夠給尾部類更高的權重。

af2dc766-2cd9-11ed-ba43-dac502259ad0.png


把loss改寫成易于理解的方式就如下:

下面這個更為直接的loss被成為為pairwise margin loss,它可以把 y 與 y' 之間的margin拉大。

然后就是實現結合:

af47e862-2cd9-11ed-ba43-dac502259ad0.png

通過一些特殊的取值和另外的trick,可以實現兩者的結合。

5. 實驗結果

af5f3152-2cd9-11ed-ba43-dac502259ad0.png

這張圖非常有意思,可以看出兩個設計理念非常有效果。

af842f0c-2cd9-11ed-ba43-dac502259ad0.pngafa47d2a-2cd9-11ed-ba43-dac502259ad0.png

可以發現該方法在頭部類和尾部類的性能都有所提升。

6. 結論

摘要:這篇寫得很好的論文重新審視了logit調整的想法,以解決長尾問題。本文首先建立了一個統計框架,并以此為基礎提出了兩種有效實現對數平差的方法。他們通過在合成和自然長尾數據集上使用幾個相關基線對其進行測試,進一步證明了這種方法的潛力。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 映射
    +關注

    關注

    0

    文章

    47

    瀏覽量

    15861
  • 雙線性變換
    +關注

    關注

    0

    文章

    2

    瀏覽量

    5574

原文標題:Google提出面向長尾分布的logit的調整新方法

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種降低VIO/VSLAM系統漂移的新方法

    本文提出了一種方法,通過使用點到平面匹配將VIO/VSLAM系統生成的稀疏3D點云與數字孿生體進行對齊,從而實現精確且全球致的定位,無需視覺數據關聯。所提方法為VIO/VSLAM系
    的頭像 發表于 12-13 11:18 ?250次閱讀
    <b class='flag-5'>一種</b>降低VIO/VSLAM系統漂移的新<b class='flag-5'>方法</b>

    一種創新的動態軌跡預測方法

    本文提出了一種動態軌跡預測方法,通過結合歷史幀和歷史預測結果提高預測的穩定性和準確性。它引入了歷史預測注意力模塊,以編碼連續預測之間的動態關系,并通過三重因子注意力模塊實現了最先進的性能。本
    的頭像 發表于 10-28 14:34 ?509次閱讀
    <b class='flag-5'>一種</b>創新的動態軌跡預測<b class='flag-5'>方法</b>

    一種基于光強度相關反饋的波前整形方法

    。在這里,課題組提出了一種基于光強度相關反饋的波前整形方法,該方法使用遺傳算法在比傳統方法更短的時間和更少的迭代次數內實現所需的波前整形。在該方法
    的頭像 發表于 10-27 16:28 ?294次閱讀
    <b class='flag-5'>一種</b>基于光強度相關反饋的波前整形<b class='flag-5'>方法</b>

    一種利用CSD16327Q3實現企業固態硬盤鉭電容短路保護的方法

    電子發燒友網站提供一種利用CSD16327Q3實現企業固態硬盤鉭電容短路保護的方法.pdf》資料免費下載
    發表于 10-25 10:22 ?0次下載
    <b class='flag-5'>一種</b>利用CSD16327Q3實現企業固態硬盤鉭電容短路保護的<b class='flag-5'>方法</b>

    一種簡單高效配置FPGA的方法

    本文描述了一種簡單高效配置FPGA的方法,該方法利用微處理器從串行外圍接口(SPI)閃存配置FPGA設備。這種方法減少了硬件組件、板空間和成本。
    的頭像 發表于 10-24 14:57 ?806次閱讀
    <b class='flag-5'>一種</b>簡單高效配置FPGA的<b class='flag-5'>方法</b>

    一種完全分布式的點線協同視覺慣性導航系統

    在本文中,我們提出了一種完全分布式的點線協同視覺慣性導航系統。我們通過蒙特卡羅模擬和真實環境數據集,在稠密特征或稀疏特征環境下將所提出的算法與其他四算法進行了比較。所有結果表明,我們的PL-CVIO優于獨立的MSCKF和CVI
    的頭像 發表于 09-30 14:45 ?507次閱讀
    <b class='flag-5'>一種</b>完全<b class='flag-5'>分布</b>式的點線協同視覺慣性導航系統

    一種利用wireshark對遠程服務器/路由器網絡抓包方法

    一種利用wireshark對遠程服務器/路由器網絡抓包方法
    的頭像 發表于 09-21 08:03 ?3540次閱讀
    <b class='flag-5'>一種</b>利用wireshark對遠程服務器/路由器網絡抓包<b class='flag-5'>方法</b>

    THS4551是否可以通過在Vocm引腳處接入電阻調整分壓比例的方法來配置輸出共模電壓?

    引腳處接入電阻調整分壓比例的方法來配置輸出共模電壓。 打個比方,比如 Vs+ = 5V,Vs- = 0V (PD常On)時,是否可以如下圖所示,通過在Vocm和Vs-間接入300k電阻將輸出信號共模電壓調整值1.66V左右。
    發表于 08-06 07:14

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發表于 07-19 06:20 ?444次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的新<b class='flag-5'>方法</b>

    rup是一種什么模型

    部分)開發的,它基于統建模語言(UML)和面向對象的軟件開發方法。RUP提供一種結構化的方法來開發軟件,它包括
    的頭像 發表于 07-09 10:13 ?1392次閱讀

    AD8338有沒有可行的方法來測量大增益?

    AD8338是款VGA芯片,可變增益范圍為-10dB至70dB。然而,理論上的70dB增益過大,導致來自源的輸入信號非常小,容易受到干擾,導致70dB增益未得到驗證。有沒有可行的方法來測量大增益?
    發表于 05-21 07:06

    如果是使用六步方波的方法來控制電機,要如何實現過電流保護?

    請問下如果是使用六步方波的方法來控制電機,要如何實現過電流保護? 以免電流過大造成板子損壞
    發表于 04-22 08:10

    熔接機sm熔接參數調整方法

    熔接機是一種用于將兩個或更多的工件通過加熱使其熔化,并在冷卻后將其粘接在起的設備。在使用熔接機進行熔接之前,需要對熔接參數進行調整,以確保最佳的熔接效果。本文將詳細介紹熔接機SM熔接參數的調
    的頭像 發表于 04-09 18:07 ?3146次閱讀

    下通過采用HPC方法來解決汽車行業工程挑戰的兩個具體實例

    大家可能都知道,將Ansys解決方案與高性能計算(HPC)相結合,可帶來巨大的投資回報(ROI)。接下來,讓我們來看下通過采用HPC方法來解決汽車行業工程挑戰的兩個具體實例。
    的頭像 發表于 03-12 14:29 ?639次閱讀

    led驅動電源如何調整電流大小的方法

    LED(Light Emitting Diode)是一種半導體器件,經常被用作照明、顯示和指示燈。為了驅動LED,需要使用LED驅動電源提供穩定的電流。調整LED的電流大小對于控制L
    的頭像 發表于 02-27 17:50 ?7305次閱讀
    属火的在属土的方向做生意好不好| 百家乐手机版| 百家乐筹码方形筹码| 威尼斯人娱乐网站| 海王星国际| 百家乐官网是怎样算牌| 蓝盾百家乐娱乐场开户注册| 曼哈顿娱乐城| 大三巴百家乐官网的玩法技巧和规则| 黄金城百家乐手机版| 百家乐官网体育博彩| 百家乐官网庄闲| 百家乐投注方法| 聂拉木县| 百家乐二代皇冠博彩| 德州扑克大小顺序| 百家乐官网对子的玩法| 网上百家乐内| 保单百家乐官网游戏机| ez百家乐技巧| 平阴县| 网上百家乐骗人的吗| 皇冠网上投注站| 百家乐统计概率| 大丰收娱乐城官网| 大连百家乐官网食品| 德州扑克中文版| 百家乐官网英皇娱乐| 七胜百家乐娱乐网| 如东县| 百家乐包赢| 百家乐官网注码技巧| 真人百家乐赢钱| 百家乐官网经验在哪找| 百家乐投注方向| 老牌百家乐官网娱乐城| 百家乐庄闲点| 玩百家乐官网平台| 威尼斯人娱乐城官方网| 百家乐官网规律和方法| 娱乐城开户送钱|