基于用戶生成內(nèi)容的位置推斷方法
隨著在線社交媒體的快速發(fā)展和可定位設(shè)備的大量普及,地理位置作為社交媒體大數(shù)據(jù)中一種質(zhì)量極高的信息資源,開始在疾病控制、人口流動性分析和廣告精準(zhǔn)投放等方面得到廣泛應(yīng)用.但是,由于大量用戶沒有指定或者不能準(zhǔn)確指定位置,社交媒體上的地理位置數(shù)據(jù)十分稀疏.針對此數(shù)據(jù)稀疏性問題,提出一種基于用戶生成內(nèi)容的位置推斷方法UGC-Ll(user generate content driven location inference method),實現(xiàn)對社交媒體用戶和生成文本位置的推斷,為基于位置的個性化信息服務(wù)提供數(shù)據(jù)支撐.通過抽取用戶生成文本中的本地詞語,構(gòu)建一個基于詞匯地理分布差異和用戶社交圖譜的概率模型,在多層次的地理范圍內(nèi)推斷用戶位置.同時,提出一個基于位置的參數(shù)化語言模型,計算用戶生成文本發(fā)出的城市.在真實數(shù)據(jù)集上進(jìn)行的評估實驗表明:UGC-LI方法能夠在15km偏移距離準(zhǔn)確定位64.2%的用戶對用戶所在城市的推斷準(zhǔn)確率達(dá)到81.3%:同時,可正確定位32.7%的用戶生成文本發(fā)出的城市,與現(xiàn)有方法相比有明顯的提高.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
基于用戶生成內(nèi)容的位置推斷方法下載
相關(guān)電子資料下載
- 數(shù)據(jù)分析工具有哪幾種模式 83
- 中交興路入選2024北京“數(shù)據(jù)要素×”典型案例集 886
- 中國鐵塔與海康威視達(dá)成戰(zhàn)略合作 217
- spark運(yùn)行的基本流程 92
- 季豐電子與孤波科技攜手合作為車規(guī)量產(chǎn)提供大數(shù)據(jù)支持 740
- 智慧園區(qū)綜合安防系統(tǒng)解決方案 83
- 大數(shù)據(jù)采集系統(tǒng)分為幾類 269
- 如何在數(shù)字化時代實現(xiàn)精益生產(chǎn)的創(chuàng)新發(fā)展? 117
- 智慧水文監(jiān)測系統(tǒng) 87
- 大數(shù)據(jù)分析平臺網(wǎng)站 96