資料介紹
K-匿名是數據發布應用場景下重要的隱私保護模型。近年來數據集K-匿名化的算法得到廣泛的研究,Median Mondrian算法是目前唯一的多維K-匿名劃分方法。文中研究了Median Mondrian算法,指出其不能有效地平衡數據劃分精度與數據隱私安全性之間的矛盾,由此提出基于熵測度機制的多維K-匿名劃分方法以及評估K-匿名化結果安全性的測量標準。實驗表明該算法是可行的,能有效地提高數據安全性。
關 鍵 詞 熵; K-匿名; 多維劃分; 準標識符
中圖分類號 TP309.2 文獻標識碼 A
Multidimensional K-anonymity Partition Method Using Entropy
YAN Hua,LIU Gui-song
(Computational Intelligence Laboratory, University of Electronic Science and Technology of China Chengdu 610054)
Abstract K-anonymity is an important privacy preserving model in the data publishing scenario. The algorithms on dataset K-anonymization are researched extensively in recent years, Median Mondrian algorithm is the only multidimensional K-anonymity partition method. However, our research shows that Median Mondrian algorithm is not well-balanced on dealing with the contradiction between data partition precision and data privacy preserving. In this paper, we propose an entropy-based multidimensional K-anonymity partition method and a new evaluation measure on K-anonymization results. The experimental results show that our new method is feasible and preserves the privacy much more efficiently than Median Mondrian algorithm.
Key words entropy; K-anonymity; multidimensional partition; quasi-identifier
近年來,數據的安全與隱私問題已經成為數據挖掘領域研究的重要課題之一。由于個人數據極容易被商業用途的應用收集與分析,所以越來越多的數據擁有者不愿意提供個人信息,除非個人信息中的敏感信息的隱私能得到保障。保護個人隱私信息最直接的方法是將能唯一標識一個人的屬性信息(Identifier)隱藏,如姓名和身份證號碼。但這種方法無法解決另一種隱私威脅問題,即鏈接攻擊[1]。
鏈接攻擊是指用戶通過對發布的數據和其他渠道獲得的數據進行鏈接處理,推演出隱私數據,從而造成隱私泄露。文獻[1]提出的K-匿名數據模型正是為了解決鏈接攻擊問題。為了實現數據集的K-匿名化,最有代表性的一類算法[2-4]是通過用戶定義的概念層次結構實現K-匿名化,都屬于單維的劃分方法,其質量取決于使用的概念層次結構。文獻[5-6]提出了目前唯一的一個多維K-匿名劃分方法,即Median Mondrian算法。實驗結果表明該近似的貪心算法能有效地實現數據集的K-匿名化。
K-匿名化后的數據以數值范圍替代原始數據的精確值,并且至少有K個數據具有相同的表示,即數據的K-匿名化以損失數據的精確度實現數據的隱私保護。數據的精確度和數據的隱私安全性是相互矛盾的,現有的算法很難在上述兩個指標上獲得平衡。理想的數據K-匿名化結果應該是在盡可能地減少數據信息損失的情況下,實現數據的隱私安全的最大化。如果兩組數據分布具有相同數值范圍但數據分布不同,那么數據分布離散程度高的數據安全性高于數據分布相對集中的數據。Median Mondrian算法的設計是在簡單滿足K-匿名模型要求的前提下,追求數據劃分精度的最大化,而在數據隱私安全性方面考慮不夠。
熵是最能反映數據點多樣性和不確定性的度量機制,因此,基于熵的概念,本文提出一種多維K-匿名劃分方法,并針對數據隱私安全性提出新的K-匿名劃分結果評價標準。
1 K-匿名模型中的基本概念
K-匿名模型相關概念的定義如下:已知數據集屬于一個更大的數據分布12n,擁有屬性集12為數據記錄的第i個屬性,為數據記錄t屬性[tA的值。
定義 1 標識符(Identifier)。數據集T的標識符I是指能唯一標識數據記錄的屬性。
- 基于密度的改進K-均值聚類組合方法 3次下載
- 基于節點分類的改進k度匿名隱私保護方法 4次下載
- 分布式K-自同構社會網絡隱私保護算法 4次下載
- 一種基于密度的改進k-均值聚類組合方法 16次下載
- 基于MapReduce和加權網絡信息熵的DBWGIE-MR算法 11次下載
- 一種基于圖熵極值理論的領域概念聚類方法 10次下載
- 可劃分邊界區域數據的粗糙K-Means算法 13次下載
- 基于MapReduce/Spark的大規模壓縮模糊K-近鄰算法 5次下載
- 基于層次社區結構的大規模社會網絡K-出入度匿名算法 8次下載
- 一種針對數據泄露的匿名模型GDPPR 18次下載
- 基于改進模糊熵和證據推理的多屬性決策方法 1次下載
- 使用信息熵抑制的軌跡來保護隱私方法資料概述 0次下載
- 基于局部信息熵值的子模式劃分方法 1次下載
- 改進的K-均值算法在巖相識別中的應用
- 基于多維泛化路徑的K-匿名算法
- 電機類型劃分 1606次閱讀
- 數據鏈?系統的時隙劃分方法 4412次閱讀
- 詳述多維度紅外光電探測器 2793次閱讀
- 利用比特幣匿名交易的常見方式 2758次閱讀
- MCU固件升級的閃存劃分方法分享 4973次閱讀
- 中國四大運營商在2G-5G頻段劃分范圍詳細數據 2.9w次閱讀
- 采用FPGA技術芯片模塊實現運動估計的設計方案并進行仿真研究 740次閱讀
- 多維力傳感器原理_多維力傳感器的優點 3027次閱讀
- 基于條件概率分類的兩種模型算法:logistic回歸模型與最大熵模型。 7166次閱讀
- 如何選擇以及有效使用不同的湍流模型 1.2w次閱讀
- 如何進行分FPGA模塊劃分 5124次閱讀
- vlan的劃分方法有哪些_vlan技術詳解 10.1w次閱讀
- 多維數據庫有哪些 7251次閱讀
- 多維數據集是什么 9681次閱讀
- 學習KNN算法的基本原理,并用Python實現該算法以及闡述其應用價值 5966次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論