所謂詞云圖,又稱文字云,是通過對一個或多個關(guān)鍵詞進行重復的、字體大小顏色不一的、不規(guī)則的排列,使其看上去類似于某種形狀的圖片,是對文本中出現(xiàn)頻率較高的“關(guān)鍵詞”予以視覺化的展現(xiàn)。
詞云圖能過濾掉大量的低頻低質(zhì)的文本信息,使得瀏覽者只要一眼掃過文本就可領(lǐng)略文本的主旨。
關(guān)鍵詞云圖生成器作為生成云圖的一種工具,簡化了制作過程。目前國內(nèi)外有很多關(guān)鍵詞云圖在線生成器,普遍按月或按年收費,在付費時候盡量選擇可靠性強的。小編之前就遇到過付費后,沒多久網(wǎng)站就消失不見了。
那么如何才能自己來做詞云圖呢?有幾種常見方法
1、使用WordArt WordArt是國外網(wǎng)站,支持自定義字體、詞云形狀、顏色等,做出來的詞云圖酷炫、精美,但訪問時響應會比較緩慢。 1.1 登錄網(wǎng)站W(wǎng)ordArt.com 1.2 點擊Words-Import words導入事先準備好的關(guān)鍵詞與其對應詞頻,或是直接在對話框中輸入相應關(guān)鍵詞。同時在頻數(shù),顏色,角度,字體中進行設(shè)計,以實現(xiàn)預設(shè)效果。 說明:
Fonts:字體設(shè)置。該工具默認字體為英文,如果詞云內(nèi)容為英文可以使用素材提供的字體,而涉及到中文內(nèi)容時我們需要選擇自行添加字體或是選擇素材庫中的Noto Sans S Chinese(可以識別部分中文)。
Shapes:設(shè)計詞云的形狀。可以選擇提供的素材庫中的形狀也可以選擇Add Image/Add Text來自定義形狀。這里選擇輸入數(shù)字“2020”并在選項卡中設(shè)計斜體、輪廓、字體、背景以及字體顏色,設(shè)計完成后單擊Add將形狀添加進來。
Layout:內(nèi)容布局。在該選項卡中,可以更改設(shè)計文字方向和布局排列方式,該工具提供了許多現(xiàn)成的組合方案,只需按需加以勾選即可。同時,在Words amount ,Density中也可以對填充內(nèi)容進行設(shè)計。
Style:詞云設(shè)計,主要涉及關(guān)鍵詞具體內(nèi)容的編輯設(shè)計。通過參數(shù)調(diào)整,對背景以及底色進行編輯修改。
1.3 生成詞云:單擊Visualize,即可生成詞云圖并預覽效果。 1.4 導出圖片:點擊DOWNLOAD (選擇圖片格式)即可下載詞云圖。 ? 2、借助開源軟件 word-cloud是一款為 java 設(shè)計的云圖生成工具。目前該項目開源,地址在https://github.com/houbb/word-cloud
特性
極簡 api,一行代碼搞定一切
支持自定義云圖背景
支持中英文分詞,默認對用戶透明
支持停頓詞過濾,默認對用戶透明
支持各種用戶自定義配置
Maven引入
使用com.github.houbb word-cloud 1.2.2
WordCloudHelper.wordCloud("該作講述的是一個名為德特茅斯的衰落小鎮(zhèn)下掩埋著一個古老的廢棄王國,名叫圣巢。這個王國被瘟疫所侵蝕而廢棄,廢棄的原因則是因為名為輻光的光之古神,她可以通過思想來傳播瘟疫,被瘟疫侵蝕的蟲子都會被本能所支配,失去心智。 " + "這個王國的主人——蒼白之王,自然不會坐視不管,他在圣巢范圍之下的深淵,利用另一種遠古力量“虛空”可以壓制光明的特性,制造了容器一族。其中一位被選中的容器用來封印瘟疫,并被命名為空洞騎士。為了封印的穩(wěn)固,白王尋找了三個守夢人來進一步鞏固封印,三位守夢人的名稱分別為守望者 - 盧瑞恩,導師 - 莫諾蒙,野獸 - 赫拉。但之后蒼白之王不知去向,不完美的容器的力量的也變得逐漸虛弱,最終被輻光控制。主角就要穿過圣巢的各地,在安息之地中,我們受到曾經(jīng)輻光的信徒和眷族——飛蛾族唯一留下的族人的幫助,獲得了和輻光力量同源的夢之武器——夢之釘。夢之釘可以讀取生物內(nèi)心的想法,并可以打破守夢人的保護,進入到其夢境之中殺死守夢人。殺死了三位守夢人并解開封印后,可選的結(jié)局有到達十字路里的黑卵神殿打敗空洞騎士或去到在“尋神者”更新中新加入的地點“神居”并挑戰(zhàn)圣巢萬神殿。");添加背景
//以鯨魚的背景,可以讓文字以圖像的形式展現(xiàn): String imagePath = "backgrounds\whale_small.png"; WordCloudHelper.wordCloud(text,"out_bg.png",imagePath);效果如下 3、使用python工具 使用Python庫jieba,jieba是一個非常好用的中文工具,是以分詞起家的,但是功能比分詞要強大很多。 jieba分詞有三種模式: jieba.cut返回的結(jié)構(gòu)都是一個可迭代的 generator,可以使用 for 循環(huán)來獲得分詞后得到的每一個詞語(unicode)。
jieba.cut方法接受三個輸入參數(shù):
需要分詞的字符串
cut_all 參數(shù)用來控制是否采用全模式,一般情況下,cut_all為False
HMM 參數(shù)用來控制是否使用 HMM 模型
示例: 使用“Star.jpg”作為模板圖片和“myword.txt”文本制作詞云圖 Star.jpg
myword.txt
略
詳細代碼
###導入庫 #導入wordcloud詞云制作第三方庫,并導入WordCloud.ImageColorGenerator兩個模塊 from wordcloud import WordCloud.imageColorGenerator #導入imageio庫 importimageio # 導入jieba庫 importjieba ### 圖片處理 # 用imageio庫中的imread函數(shù)讀取本地圖片 testmg=imageio.imread("Star.jpg") # 調(diào)用wordcloud庫中的ImageColorGenerator函數(shù) image_color=ImageColorGenerator(testimg) # 給WordCloud函數(shù)傳入?yún)?shù)設(shè)置圖片相關(guān)屬性 test=WordCloud(mask=testimg,#將testng的值賦值給mask用作遮罩圖 width=500,#輸出圖片寬度為500px height=500,#輸出圖片高度為500px background_color="white",#輸出圖片背景顏色為白色 font-path="msyh.ttc"#字體路徑為微軟雅黑 scale=15)#畫布放大比例為15 ###文本處理 # 引用外部文件,并用utf-8的編碼方式 txt=open("myword.txt",encoding="utf-8").read() # 調(diào)用詞云對象test的generate方法,導入文本 # 使用jieba分詞的精確模式為文本進行分詞 test=test.recolor(color_func=image_color) ###輸出處理 #將生成的詞云保存為result.png圖片文件,保存到當前文件夾中 test.to_file("result.png")效果圖
詞云圖不僅能用來突出關(guān)鍵詞,減少信息冗余,還能用于用戶圖像分析,快來試試吧。
-
JAVA
+關(guān)注
關(guān)注
19文章
2974瀏覽量
105139 -
軟件
+關(guān)注
關(guān)注
69文章
5009瀏覽量
88067 -
生成器
+關(guān)注
關(guān)注
7文章
319瀏覽量
21126
原文標題:三種制作詞云圖的方法,你覺得用哪一種更方便?
文章出處:【微信號:IoTMaker,微信公眾號:機智云開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論