數據挖掘的特點是什么
1、基于大量數據
并非說小數據量上就不可以進行挖掘,實際上大多數數據挖掘的算法都可以在小數據量上運行并得到結果。但是,一方面過小的數據量完全可以通過人工分析來總結規律,另一方面來說,小數據量常常無法反映出真實世界中的普遍特性。
2、非平凡性
所謂非平凡,指的是挖掘出來的知識應該是不簡單的,絕不能是類似某著名體育評論員所說的“經過我的計算,我發現了一個有趣的現象,到本場比賽結束為止,這屆世界杯的進球數和失球數是一樣的。非常的巧合!”那種知識。這點看起來勿庸贅言,但是很多不懂業務知識的數據挖掘新手卻常常犯這種錯誤。
3、隱含性
數據挖掘是要發現深藏在數據內部的知識,而不是那些直接浮現在數據表面的信息。常用的BI工具,例如報表和OLAP,完全可以讓用戶找出這些信息。
4、新奇性
挖掘出來的知識應該是以前未知的,否則只不過是驗證了業務專家的經驗而已。只有全新的知識,才可以幫助企業獲得進一步的洞察力。
5、價值性
挖掘的結果必須能給企業帶來直接的或間接的效益。有人說數據挖掘只是“屠龍之技”,看起來神乎其神,卻什么用處也沒有。這只是一種誤解,不可否認的是在一些數據挖掘項目中,或者因為缺乏明確的業務目標,或者因為數據質量的不足,或者因為人們對改變業務流程的抵制,或者因為挖掘人員的經驗不足,都會導致效果不佳甚至完全沒有效果。但大量的成功案例也在證明,數據挖掘的確可以變成提升效益的利器。
-
數據挖掘
+關注
關注
1文章
406瀏覽量
24322
發布評論請先 登錄
相關推薦
評論