資料介紹
提出了一種基于局部孤立系數(LOC)的孤立點挖掘算法。該算法是對基于局部稀疏系數(LSC)孤立點挖掘論文中局部稀疏率和局部稀疏系數計算的一種改進。實驗表明,LOC 算法在發現孤立點方面比LSC 算法更高效。
孤立點檢測在數據挖掘領域是一項重要的挖掘技術。孤立點檢測的研究對象是數據集中
偏離絕大多數對象的很小一部分數據。在許多KDD 應用中,研究孤立點比研究聚類更有用、更重要。因為,在某些應用領域中研究孤立點的異常行為能發現隱藏在數據集中更有價值的知識。諸如,在欺詐探測中,孤立點可能預示著欺詐行為;在市場分析中,可用于確定極低或極高的收入的消費行為;在醫療分析中,用于發現對多種治療方式的不尋常的反映;因此,孤立點檢測是一個重要的數據挖掘任務,稱為孤立點挖掘或異常挖掘。孤立點挖掘可以描述如下:給定一個n 個數據點或對象的集合,及預期的孤立點的數目k,發現與剩余的數據相比是顯著相異的、異常的或不一致的頭k 個對象[1]。
在數據挖掘中,孤立點檢測算法大體上可分為以下幾類:統計學方法,基于距離的方法,基于偏離的方法和基于密度的方法。
基于密度的方法能夠挖掘出比基于距離異常算法所不能識別的一類異常數據—局部異
常。局部異常觀點擯棄了以前所有的異常定義中非此即彼的絕對異常觀念,這更加符合現實生活中的應用。近年來,一些研究人員提出局部孤立點探測[2,3,4,5],就是對每個對象賦予某個度,這個度決定了這個對象成為孤立點的程度。每個點的孤立程度只與它和周圍點的距離有關,而與數據集中其他的點沒有任何關系,這就體現了“局部”的特性。局部稀疏系數(LSC)就是其中一種,Malik Agyemang 提出的基于局部稀疏系數 (LSC)孤立點挖掘[4]算法的主要思想是對數據集中每個對象,計算出離它最近K 個對象的距離,并從中選出最大的距離作為該點的K-距離,對數據集中每個對象計算出與它的距離不大于該對象K-距離的鄰近對象形成一個集合,然后計算每個對象與其對應集合的所有對象之間平均距離的反比,即局部稀疏率,最后計算集合內所有對象的局部稀疏率之和與該點的局部稀疏率比值的平均比率,即局部稀疏系數(LSC);根據每個對象的LSC 值從大到小的順序排列整個數據集,并把前n 個對象作為孤立點。
在局部稀疏系數(LSC)算法中,需要計算數據集中每個對象的局部稀疏率和局部稀疏
系數,當數據集很大時,計算每個對象的局部稀疏率和局部稀疏系數耗費很大的計算量。本文提出了基于局部孤立系數(LOC)孤立點算法,它是對LSC 算法的改進,LOC 算法的主要思想是:對于數據集中每個點,計算出離它最近K 個對象的距離并選出其中最大距離作為該點的K-距離,并把最近K 個距離的和作為該點的局部距離之和;然后計算每個點的局部距離之和與它K-距離內每個對象的局部距離之和的總和平均值的比率(LOC)作為該點的孤立因子,按LOC 值從大到小的順序選出前n 個作為孤立點。本文給出了LSC 算法和LOC 算法的實驗結果,實驗結果表明LOC 算法在發現孤立點方面比LSC 算法效率高。
孤立點檢測在數據挖掘領域是一項重要的挖掘技術。孤立點檢測的研究對象是數據集中
偏離絕大多數對象的很小一部分數據。在許多KDD 應用中,研究孤立點比研究聚類更有用、更重要。因為,在某些應用領域中研究孤立點的異常行為能發現隱藏在數據集中更有價值的知識。諸如,在欺詐探測中,孤立點可能預示著欺詐行為;在市場分析中,可用于確定極低或極高的收入的消費行為;在醫療分析中,用于發現對多種治療方式的不尋常的反映;因此,孤立點檢測是一個重要的數據挖掘任務,稱為孤立點挖掘或異常挖掘。孤立點挖掘可以描述如下:給定一個n 個數據點或對象的集合,及預期的孤立點的數目k,發現與剩余的數據相比是顯著相異的、異常的或不一致的頭k 個對象[1]。
在數據挖掘中,孤立點檢測算法大體上可分為以下幾類:統計學方法,基于距離的方法,基于偏離的方法和基于密度的方法。
基于密度的方法能夠挖掘出比基于距離異常算法所不能識別的一類異常數據—局部異
常。局部異常觀點擯棄了以前所有的異常定義中非此即彼的絕對異常觀念,這更加符合現實生活中的應用。近年來,一些研究人員提出局部孤立點探測[2,3,4,5],就是對每個對象賦予某個度,這個度決定了這個對象成為孤立點的程度。每個點的孤立程度只與它和周圍點的距離有關,而與數據集中其他的點沒有任何關系,這就體現了“局部”的特性。局部稀疏系數(LSC)就是其中一種,Malik Agyemang 提出的基于局部稀疏系數 (LSC)孤立點挖掘[4]算法的主要思想是對數據集中每個對象,計算出離它最近K 個對象的距離,并從中選出最大的距離作為該點的K-距離,對數據集中每個對象計算出與它的距離不大于該對象K-距離的鄰近對象形成一個集合,然后計算每個對象與其對應集合的所有對象之間平均距離的反比,即局部稀疏率,最后計算集合內所有對象的局部稀疏率之和與該點的局部稀疏率比值的平均比率,即局部稀疏系數(LSC);根據每個對象的LSC 值從大到小的順序排列整個數據集,并把前n 個對象作為孤立點。
在局部稀疏系數(LSC)算法中,需要計算數據集中每個對象的局部稀疏率和局部稀疏
系數,當數據集很大時,計算每個對象的局部稀疏率和局部稀疏系數耗費很大的計算量。本文提出了基于局部孤立系數(LOC)孤立點算法,它是對LSC 算法的改進,LOC 算法的主要思想是:對于數據集中每個點,計算出離它最近K 個對象的距離并選出其中最大距離作為該點的K-距離,并把最近K 個距離的和作為該點的局部距離之和;然后計算每個點的局部距離之和與它K-距離內每個對象的局部距離之和的總和平均值的比率(LOC)作為該點的孤立因子,按LOC 值從大到小的順序選出前n 個作為孤立點。本文給出了LSC 算法和LOC 算法的實驗結果,實驗結果表明LOC 算法在發現孤立點方面比LSC 算法效率高。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 解決辦法:虛擬機狀態顯示孤立的,打開電源失敗
- 集成流挖掘和圖挖掘的內網異常檢測方法 7次下載
- 如何使用MATLAB進行語音識別算法研究的論文資料免費下載 44次下載
- 自適應局部均值的EMD方法 0次下載
- 含高滲透率光伏電源的孤立電網機組組合 0次下載
- 孤立微電網分布式二級功率優化控制 11次下載
- 基于神經網絡的漢語孤立詞語音識別_朱淑琴 0次下載
- 柔性直流輸電改善孤立電網穩定性的研究 21次下載
- 基于TMS320C6711 DSP的非特定人、孤立詞語音識別
- 基于片上系統SoC的孤立詞語音識別算法設計
- 基于片上系統SoC的孤立詞語音識別算法設計
- 稅務系統信息集成的研究和實現
- 基于灰色關聯分析的孤立點挖掘算法
- 工程熱力學試卷試題-華南理工大學2004年研究生入學考試試卷
- 基于平均密度的孤立點檢測研究
- 開關電容加法器的電路詳解 1130次閱讀
- 噪聲系數是什么?噪聲系數在系統中的應用有哪些? 4689次閱讀
- 數字PLL孤立頻點失鎖是什么原因?又應該怎么解決呢? 1753次閱讀
- 通過RepSurf點云結構實現多項任務SOTA 1591次閱讀
- 局部放電以及為什么應該檢測局部放電? 5537次閱讀
- 使用STM32實現云連接應用的資料概述 3722次閱讀
- 局部放電的定義_局部放電的類型和特點 2w次閱讀
- 局部放電的危害_局部放電產生原因 1.1w次閱讀
- 熱擴散系數的定義及測量 1.8w次閱讀
- 關于Velodyne LiDAR的時間同步 2w次閱讀
- 梯度下降兩大痛點:陷入局部極小值和過擬合 2w次閱讀
- 怎么學習數據挖掘_如何系統地學習數據挖掘 4805次閱讀
- 什么叫數據挖掘_數據挖掘技術解析 1.9w次閱讀
- 基于Matlab的孤立逆變電源設計方案 3761次閱讀
- 通信連接器的分類及應用 3640次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論