在加密貨幣市場中,有這樣一個既有的觀點認為這個市場容易受到來自新聞和社交媒體的輿論影響。就像任何其他新興且非理性的金融市場一樣,新聞或者社交媒體中傳達出的預期之外事件將影響到金融產品的價格。因此,人們越來越寄希望于通過采用諸如情緒分析(Sentiment Analysis)等機器學習的方式來監測市場情緒與加密貨幣和數字代幣之間可能存在的聯系。盡管這種方式很重要,但人們采用的大多數情緒分析的方法都太淺顯了,以至于這些分析很難形成有實踐意義的結論,甚至常常形成具有誤導性的結論。
如何有效的通過情緒分析來評估一項資產未來的價格走勢是具有挑戰性的,而這項挑戰也并非是在加密領域中所獨有的。在大多數情況下,通過文本情緒來產生有價值的洞見是一項非常困難的任務,這需要用到自然語言處理 (NLP) 模型對特定金融領域進行優化。大型量化對沖基金公司聘請大量機器學習領域的專家來訓練 NLP 模型以用于特定任務,比如說對收入報告進行分析,其目的在于能夠讓他們在一項中頻交易(medium frequency trade)中獲得優勢。對加密資產進行有效的情緒分析要求機器學習是有深度的和嚴密性的。
為進一步闡述上述觀點,我們不妨從對情緒分析的特點開始,漸進式地加深對情緒分析的了解。
淺談情緒分析
在著名歷史劇《黎塞留》的第二幕的第二場中,英國劇作家愛德華·布爾沃-李頓寫出了經典名句:“文字的力量勝于武力(The pen is mightier than the sword)”。蒼海浮沉,歷經百年,用這一經典名句來概括情緒分析的重要性似乎再恰當不過。相較于肢體語言,有時感情于字里行間中更能影響人們的行為。
僅從概念上來看,情緒分析從屬于 NLP ,它更專注于識別文本交流中存在的情緒狀態。不同于一般看法,情緒分析不僅僅是一門技術,它還是深度學習領域里的一個子類,用于甄別文本數據中的各類情緒因素。從這個角度來說,我們姑且可以認為以下幾種情緒分析與智能加密資產相關。
· 極性分析(Polarity Analysis):這類情緒分析將文本情緒劃分為:積極、消極和中性。比如在大多數情緒分析模型中,“比特幣價格的止跌企穩提升市場信心”這句話就被歸類為積極類。
· 情緒/語氣分析(Emotion/Tone Analysis):不同于對文本進行總體歸類,這種分析方式致力于對特定語境下所呈現的不同感情進行打分。情緒分析算法通常聚焦于難過、開心或憤怒等情緒。例如:“比特幣止損后大幅回升”將會被認定是情緒高漲。
· 情緒面分析(Aspect Sentiment Analysis):這種類型的情緒分析聚焦于對一句話中特定主體的情緒進行解讀,而并非籠統的將一句話視作一整個部分。舉例來說:在“ Bakkt 期貨市場的出現對于比特幣市場具有里程碑式的意義”這句話中,情緒面分析將會對與“ Bakkt 期貨”相關的內容進行情緒分析,而不是對整句話進行分析。
根據以上分析,我們可以清楚的看到將情緒分析用于加密資產的好處。盡管如此,在對這類技術嘗鮮之前,我們還應該考慮其中存在的風險因素。文章內容的上下文、主觀性、反語甚至是語法錯誤都可能讓最好的 NLP 算法失效。
加密資產的情緒分析
加密資產是一種新的資產類別,這種資產現在依舊受到金融市場的非理性因素影響,同時它也缺乏有效的信息披露渠道。從這個觀點來看,認為像情緒分析等 NLP 技術能夠識別 alpha 或聰明 beta(smart beta)因子以預測加密資產的行為變化情況的這種觀點僅僅是符合邏輯的,但與現實情況略有差異。(CoinDesk 中文版注:alpha 指的是資產獲得的超額收益,而 beta 指的是一種評估證券系統性風險的工具,用以度量一種證券或一個投資證券組合相對總體市場的波動性。)
當把情緒分析技術應用于加密資產時,我們可能會主要遇到兩種類型的挑戰:
1、將主流 NLP 技術應用于特定領域(如加密資產分析)時面臨的挑戰
2、錯誤的理解了新聞和社交媒體中所反映出來的真實情緒含義
第一個挑戰幾乎可以被視為是快速發展的 NLP 技術的一個預期外的副作用。如今,對于開發人員來說通過調取簡單的應用程序編程接口 (API) 從而將情緒分析技術應用于實踐是相對容易的,在這一過程中,API 調用者不需要具備任何有關深度學習的專業技能。
盡管通過調用 NLP 的 API 能夠對一個普通句子的情緒進行有效分析,但是當試圖從一句特定語句中推斷出特定領域的相關信息時,這些 API 的表現是相當糟糕的。比如說,分析“比特幣 ETF 可能即將獲批”這句話,需要 NLP 模型對特定市場下的專業術語的語義非常精通,并且能從非常微觀的層面,而并非僅從整句話中,對語境中的情緒進行推斷。
第二個挑戰來自于對新聞和社交媒體評論中所反饋出情緒的錯誤識別。作為信息的一個來源,新聞所包含的信息是相當豐富的但是在進行情緒分析是也可以說是相當無用。其直觀的原因是:好的新聞中所包含的情緒應該是中立的。社交媒體的內容表現形式則截然相反。推特(Twitter)或者電報(Telegram) 中關于加密貨幣的觀點通常會包含一些情緒,但就大多數情況而言,這些評論都是基于對一些公眾普遍關切的重大信息的情緒反饋,這就意味著這些情緒里面并沒有包含有價值的信息。除此以外,來自社交媒體的評論往往是嘈雜和相對主觀的,這可能將會誤導情緒分析的結果。
從純技術的角度來說,為加密資產搭建有效的情緒分析模型需要對模型進行加密市場專業術語的訓練,同時也需要將新聞作為信息來源和社交媒體作為情緒放大器進行分析。然而,當我們將情緒分析模型應用于加密資產領域時,我們目前面對的最大的心理誤區之一就是我們是否克服了這項技術挑戰。
市場與情緒影響的謬論
市場情緒影響謬論描述的是一種不好的或者是非理性的情形,比如說在新興的金融市場領域,投資者們認為情緒分數和金融資產的價格變動之間有直接的相關性。為了闡述這樣一種動態行為經濟學,我們假設你正在使用分析工具對最近推特上關于比特幣的情緒進行分析。從心理上來說,大多數投資者傾向于將市場情緒解讀為領先指標:
· 如果市場情緒是積極的,那么就意味著看好后市
· 如果市場情緒是消極的,那么就意味著看空后市
但是,當你的模型用于分析公開的重大信息時,以下非直覺的情緒分析應該作為滯后指標:
· 如果市場情緒表示樂觀,但是市場價格并未上升,這意味著熊市的來臨
· 如果市場情緒表示悲觀,但是市場價格并未下降,這意味著牛市的來臨
當意識到情緒—價格關系的非一致性時,這使得情緒分析不再被視作市場領指標,而是當作交易策略中的一種相關因子進行分析。
從情緒分析到市場影響分析
從信息的角度來看,加密資產市場是復雜且充滿不確定因素的。就情緒分析而言,多種因素混雜其中對當前的分析模型而言是一個噩夢。我們或許應該開發一種更全面的分析方法,而并非僅僅專注于市場情緒分析。情緒與市場的影響指標在長期來看,是集極性(消極、積極、中立)分析、情緒(不安的、興奮的、悲傷的等)分析以及基于情緒面(主題、主體等)分析于一體的。這個方法要求訓練模型精通于加密資產的動態變化,從而在特定市場環境下對市場情緒進行分析。
情緒與市場的影響模型這一觀點在概念上不算特別:量化情緒、情緒和話題組合在特定市場條件下對加密資產的影響。這一方法的部分優點在于它并不像目前大多數情緒分析模型一樣是不受監督的;它能夠通過訓練獲得加密市場特定領域的知識。比如說,我們可以通過訓練讓模型了解到對中國在加密資產市場投資進行樂觀的報道可能給上周處于相對熊市的市場帶來積極的影響。情緒與市場的影響分析模型的核心原則就是將情緒分析模型對特定加密市場的分析置于特定的語境之中。
在加密資產市場領域,情緒分析可能仍將是人們熱衷談論的頭條話題。然而,為了讓其行之有效,這些模型需要更深入的加強機器學習的嚴密性以及增加基于特定動態加密資產市場之上的知識儲備。隨著市場的發展,我們可能會看見情緒分析技術由簡單的線性分析轉變為通過對加密資產市場領域特定話題的有效量化從而形成對市場的全面分析。
Jesus Rodriguez(耶穌·羅德里格斯)是區塊鏈智能基礎設施平臺 IntoTheBlock 的首席技術官和聯合創始人,同時也是 Invector 實驗室的首席科學家。同時,他是加密貨幣和人工智能領域的活躍投資者、演講者和寫作者。
責任編輯;zl
評論
查看更多