衡阳派盒市场营销有限公司

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

基于Hadoop平臺的分布式重復數據刪除解決方案

大小:0.96 MB 人氣: 2017-12-22 需要積分:1

  針對數據中心存在大量數據冗余的問題,特別是備份數據造成的存儲容量浪費,提出一種基于Hadoop平臺的分布式重復數據刪除解決方案。該方案通過檢測并消除特定數據集內的冗余數據,來顯著降低數據存儲容量,優化存儲空間利用率。利用Hadoop大數據處理平臺下的分布式文件系統(HDFS)和非關系型數據庫HBase兩種數據管理模式,設計并實現一種可擴展分布式重刪存儲系統。其中,MapReduce并行編程框架實現分布式并行重刪處理,HDFS負責重刪后的數據存儲,在HBase數據庫中構建索引表,實現高效數據塊索引查詢。最后,利用虛擬機鏡像文件數據集對系統進行了測試,基于Hadoop平臺的分布式重刪系統能在保證高重刪率的同時,具有高吞吐率和良好的可擴展性。

基于Hadoop平臺的分布式重復數據刪除解決方案

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      百家乐官网过滤| 百家乐和抽水官网| 皇冠网址推介| 网上百家乐娱乐场开户注册| 百家乐官网开户导航| 金狮娱乐| 百家乐红桌布| 百家乐轮盘桌| 苹果百家乐官网的玩法技巧和规则 | 精英百家乐现金网| 娱乐城百家乐官网怎么样| 大发888怎么提款| 蓝盾百家乐平台| 百家乐官网群lookcc| 百家乐官网3珠路法| 百家乐官网如何写路| K7百家乐的玩法技巧和规则| 网上的百家乐官网是真是假| 波音百家乐官网现金网| 博狗| 大发888 漏洞| 大发888 充值淘宝| 百家乐长路投注法| 优博百家乐官网的玩法技巧和规则 | 阿玛尼百家乐的玩法技巧和规则| 百家乐庄闲最佳打法| 百家乐官网正负计算| 百家乐官网平台有什么优惠 | 大发888娱乐在线| 大发888官方爱好| 百家乐德州| 百家乐德州扑克桌布| 百家乐官网娱乐官网网| 广东百家乐官网网| 七胜百家乐官网娱乐平台| 百家乐官网千术手法| 百家乐官网筹码防伪定制| 大世界百家乐官网现金网| 百家乐官网有哪些注| 金赞百家乐官网娱乐城| 优博百家乐官网yobo88|