香港六合彩开报,大家旺娱乐场开户注册,战神博彩娱乐官方网站(中国)·官方网站

要說自然語言處理在18年最奪目閃耀的是什么事情，那當屬 BERT 刷新各個任務的記錄了，至今已經過去了近兩年半的時間，但其影響力未曾衰減，無論學術界還是工業界，很多的工作與部署都圍繞其展開，對很多的下游任務都有舉足輕重的作用，真的是里程碑啊。

相信大家都有過BERT、ALBERT等預訓練語言模型應用在自己任務上的實踐經歷，可能是情感分析、分類、命名實體識別、閱讀理解、相似度計算等等，使用的方法也無非是在自己任務上 fine-tune 或者作為預訓練Embedding，使用的預訓練模型大多是公開的，大佬們(財大氣粗、資源無數)訓練好的。(有錢真好)

在用預訓練模型的時候，根據任務的不同，用到信息也不同，有的需要是詞表示，比如命名實體識別、詞性標注等任務，有的需要的是句子表示，比如分類、句子語意匹配等。這里我要說的句子表示這一類的任務，大家經常會用到的 [CLS] 特征信息作為句子向量表示，CLS 作為 BERT/ALBERT序列信息中特殊的一個存在，在最開始設計模型的時候便考慮將其作為后續文本分類的表示，然而直接使用 CLS 的效果真的會滿足我們的預期嘛？相信大家在實踐的過程中都有所體會~，另外 ALBERT 和 BERT 在下游任務應用上面孰好孰壞，是否有一個定論？

我最近看到了一篇 Arxiv 的文章，題目是《Evaluation of BERT and ALBERT Sentence Embedding Perf ormance on Downstream NLP Tasks》，這篇文章在 BERT/ALBERT 提取信息作為句子信息表示應用在下游任務，對其效果進行了評測，或許會解答我們實踐中的疑惑，也或者會給我們一些預訓練模型在下游任務應用的啟發，讓我們來看下~

評測對比

有一系列的對比實驗，來看在下游任務上面的效果~

[CLS] embeddings

CLS 通過 Self-Attention 機制來獲取句子級別的信息表示，在不同的任務上 Fine-tune 之后，CLS 會捕捉特定環境下的上下文信息表示。

Pooled embeddings

將文本中的所有詞做 Avg-pooling 或者 max-pooling。

Sentence-X(SBERT/ALBERT)

BERT 在語義相似度任務上面也取得了很不錯的效果，然后其內部的結構在計算過程中會導致非常耗時，不適合做語義相似度匹配任務，特別是在工業界，BERT 的耗時無法滿足上線的需要。針對這個問題，有人提出 Sentence-BERT，采用孿生網絡模型框架，將不同的句子輸入到參數共享的兩個BERT模型中，獲取句子信息表示，用于語義相似度計算，最終相比BERT效率大大提升，滿足工業界線上需要。SBERT 從65小時降到5秒，具體詳見參考資料2。

CNN-SBERT/SALBERT

在上圖中，SBERT 采用 Avg-pooling 獲取句子向量表示，本文將其替換成 CNN 網絡結構獲取句子向量表示。

結果分析

評測任務

STS：Semantic Textual Similarity

NLI：Natural Language Inference

評測指標

Pearson and Spearman’s rank coefficients（皮爾遜和斯皮爾曼相關系數）

評測數據

Semantic Textual Similarity benchmark（STSb）

Multi-Genre Natural Language Inference（MultiNLI）

Stanford Natural Language Inference（SNLI）

上面列出來相關的評測任務、評測指標以及評測所用到的數據，下面先給出一張結果表，然后再詳細分析~

詳細分析

微調有效：這個是符合我們認知的，肯定是微調的效果要好。

CLS 效果：CLS 的效果要遜色很多，無論是在微調上面，還是不微調上面，CLS的效果都要遠遜色于平均池化操作或者其他方法。

不同方法效果：總體上來看，CNN-BERT > SBERT > Avg pooling > CLS

BERT 與 ALBERT：從上圖中大概能夠看出，不微調的情況下，兩者的效果差不多，但是微調之后，ALBERT的效果要比BERT差很多，僅僅在STSb上微調的時候，CLS 和平均池化的方法要好于BERT。

CNN的效果

從上圖來看，最好的結果是采用了 CNN 網絡結構，說明 CNN 起到了正向的作用，仔細觀察發現，CNN 對 ALBERT 的改進要遠大于對 BERT 的改善提高。ALBERT 由于內部參數共享，可能存在不穩定性，CNN 網絡結構或許可以減緩這種不穩定性。

下圖也進行了一些對比，在幾個不同的數據集上驗證 CNN 的有效性，從最終的 Avg 結果來看，CNN 網絡結構對 ALBERT 有改善提升。

以上是根據實驗結果進行的簡單分析，其中有一些結論和對比可以在我們日常的實踐中借鑒并嘗試，說不定會有不錯的效果~

原文標題：【BERT】BERT中CLS效果真的好嘛？這篇文章告訴你答案

文章出處：【微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1796

文章
47666

瀏覽量
240281
自然語言

自然語言

+關注

關注
1

文章
291

瀏覽量
13398

原文標題：【BERT】BERT中CLS效果真的好嘛？這篇文章告訴你答案

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

自然語言處理與機器學習的關系自然語言處理的基本概念及步驟

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能和語言學領域的一個分支，它致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習（Ma

發表于 12-05 15:21 ?719次閱讀

語音識別與自然語言處理的關系

在人工智能的快速發展中，語音識別和自然語言處理（NLP）成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音，而自然語言處理則讓

發表于 11-26 09:21 ?584次閱讀

ASR與自然語言處理的結合

ASR（Automatic Speech Recognition，自動語音識別）與自然語言處理（NLP）是人工智能領域的兩個重要分支，它們在許多應用中緊密結合，共同構成了自然語言理解和

發表于 11-18 15:19 ?526次閱讀

自然語言處理與機器學習的區別

在人工智能的快速發展中，自然語言處理（NLP）和機器學習（ML）成為了兩個核心的研究領域。它們都致力于解決復雜的問題，但側重點和應用場景有所不同。 1. 自然語言

發表于 11-11 10:35 ?759次閱讀

圖像識別技術包括自然語言處理嗎

計算機視覺技術對圖像進行處理、分析和理解，從而實現對圖像中的目標、場景、行為等信息的識別和理解。圖像識別技術包括圖像預處理、特征提取、分類器設計、模型訓練等多個環節。 1.2 自然語言

發表于 07-16 10:54 ?940次閱讀

用于自然語言處理的神經網絡有哪些

取得了顯著進展，成為處理自然語言任務的主要工具。本文將詳細介紹幾種常用于NLP的神經網絡模型，包括遞歸神經網絡（RNN）、長短時記憶網絡（LSTM）、卷積神經網絡（CNN）、變換器（Transformer）以及預訓練模型如BERT

發表于 07-03 16:17 ?1404次閱讀

自然語言處理技術有哪些

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個分支，它致力于使計算機能夠理解、解釋和生成人類語言。自然語言

發表于 07-03 14:30 ?1361次閱讀

自然語言處理模式的優點

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個重要分支，它致力于使計算機能夠理解、生成和處理人類語言。隨著技術的發展，

發表于 07-03 14:24 ?863次閱讀

自然語言處理技術的核心是什么

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個重要分支，其核心目標是使計算機能夠理解、生成和處理人類語言。NLP技術的發展已經取

發表于 07-03 14:20 ?887次閱讀

自然語言處理是什么技術的一種應用

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能和語言學領域的一個分支，它涉及到使用計算機技術來處理、分析和生成

發表于 07-03 14:18 ?1159次閱讀

自然語言處理包括哪些內容

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個重要分支，它涉及到計算機與人類語言之間的交互。NLP的目標是讓計算機能夠理解、生成和處理

發表于 07-03 14:15 ?1180次閱讀

自然語言處理屬于人工智能的哪個領域

之間的交互，旨在使計算機能夠理解、生成和處理自然語言。 自然語言處理：人工智能的皇冠上的明珠引言人工智能作為一門跨學科的研究領域，涵蓋了計算機科學、數學、心理學、

發表于 07-03 14:09 ?1559次閱讀

什么是自然語言處理 (NLP)

自然語言處理（Natural Language Processing, NLP）是人工智能領域中的一個重要分支，它專注于構建能夠理解和生成人類語言的計算機系統。NLP的目標是使計算機能夠像人類一樣

發表于 07-02 18:16 ?1338次閱讀

自然語言處理技術的原理的應用

自然語言處理（Natural Language Processing, NLP）作為人工智能（AI）領域的一個重要分支，旨在使計算機能夠理解和處理人類自然語言。隨著互聯網的普及和大數據

發表于 07-02 12:50 ?730次閱讀

神經網絡在自然語言處理中的應用

自然語言處理（NLP）是人工智能領域中的一個重要分支，它研究的是如何使計算機能夠理解和生成人類自然語言。隨著人工智能技術的飛速發展，神經網絡在自然語言

發表于 07-01 14:09 ?594次閱讀

衡阳派盒市场营销有限公司

搜索歷史

自然語言處理BERT中CLS的效果如何？

評論

自然語言處理與機器學習的關系自然語言處理的基本概念及步驟

語音識別與自然語言處理的關系

ASR與自然語言處理的結合

自然語言處理與機器學習的區別

圖像識別技術包括自然語言處理嗎

用于自然語言處理的神經網絡有哪些

自然語言處理技術有哪些

自然語言處理模式的優點

自然語言處理技術的核心是什么

自然語言處理是什么技術的一種應用

自然語言處理包括哪些內容

自然語言處理屬于人工智能的哪個領域

什么是自然語言處理 (NLP)

自然語言處理技術的原理的應用

神經網絡在自然語言處理中的應用

搜索歷史

自然語言處理BERT中CLS的效果如何？

評論

自然語言處理BERT中CLS的效果如何？