衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析

集成電路應(yīng)用雜志 ? 來源:cc ? 2019-02-14 14:45 ? 次閱讀

1 引言

大數(shù)據(jù)處理系統(tǒng)始終是分析大數(shù)據(jù)的基礎(chǔ),因為大數(shù)據(jù)本身具有信息量繁多冗雜、擴(kuò)展速度極快、信息多樣性且價值密度高等特點,所以要求大數(shù)據(jù)處理系統(tǒng)具有極強的專業(yè)性和高效性,能夠合理并有效的處理大規(guī)模的數(shù)據(jù)并形成可用的數(shù)據(jù)體系[1-3]。目前較為典型的大數(shù)據(jù)處理系統(tǒng)有三種。分別為大數(shù)據(jù)實時流式處理系統(tǒng)、離線批量處理系統(tǒng)、交互式處理系統(tǒng)以及大數(shù)據(jù)可視化處理系統(tǒng),本文將依次介紹這三種大數(shù)據(jù)處理系統(tǒng)的概念及其特點并分析其應(yīng)用場景。

2 實時流式處理系統(tǒng)及應(yīng)用場景

(1)流式大數(shù)據(jù)概念及其特點。流式大數(shù)據(jù)又被稱為實時大數(shù)據(jù),流式處理系統(tǒng)是以分析實時數(shù)據(jù)為基礎(chǔ),是基于實時數(shù)據(jù)流的數(shù)據(jù)處理,一般處理時間是在數(shù)百毫秒到數(shù)秒之間。

(2)大數(shù)據(jù)實時處理系統(tǒng)的技術(shù)架構(gòu)。根據(jù)大數(shù)據(jù)實時流式處理的特點可以總結(jié)出,這種數(shù)據(jù)處理系統(tǒng)其實就是數(shù)據(jù)的收集、傳輸、處理和展現(xiàn)的過程。其中數(shù)據(jù)的處理中涉及數(shù)據(jù)的聚合,而且整個過程需要能夠在秒級或毫秒級得到相應(yīng)的響應(yīng)。目前針對這一系列特點形成了 Flume + kafka + Storm / Spark + Hbase / Redis 的技術(shù)框架。

(3)大數(shù)據(jù)實時流式處理系統(tǒng)的應(yīng)用場景。流式大數(shù)據(jù)實時處理系統(tǒng)主要廣泛應(yīng)用于金融、公安、電信、交通等領(lǐng)域,在金融行業(yè),流式大數(shù)據(jù)實時處理系統(tǒng)在金融風(fēng)控反欺詐方面發(fā)揮著重要作用,能夠搜集融合眾多專家知識以及機器研究結(jié)果的數(shù)百條規(guī)則,作為對每筆交易的風(fēng)險評估依據(jù),判斷該筆交易是否能夠安全進(jìn)行。

3 離線處理系統(tǒng)及應(yīng)用場景

(1)大數(shù)據(jù)離線處理系統(tǒng)概念及其特點。根據(jù)數(shù)據(jù)分析的時效性,我們可以把大數(shù)據(jù)分析處理系統(tǒng)分為實時處理和離線處理兩種類型。

(2)大數(shù)據(jù)離線處理處理系統(tǒng)的常用工具。相對于在線處理系統(tǒng)所呈現(xiàn)的技術(shù)架構(gòu),大數(shù)據(jù)離線處理系統(tǒng)已經(jīng)相對成熟,大數(shù)據(jù)離線處理的流程通常是利用 Hdfs 存儲數(shù)據(jù),確保數(shù)據(jù)有效存儲之后,再利用 MapReduce 進(jìn)行離線數(shù)據(jù)的批量運算,批量計算所得出的數(shù)據(jù)如果需要進(jìn)入數(shù)據(jù)倉庫進(jìn)行存儲,可以直接接入 Hive,用過 Hive 進(jìn)行展示。① Hdfs 是一種分布式的文件系統(tǒng),可以對數(shù)據(jù)進(jìn)行多次備份。② MapReduce 是一種批量計算技術(shù)框架,同樣是分布式布局,分為兩個階段:Map 階段和 Reduce 階段。③ Hive 中的數(shù)據(jù)存儲于文件系統(tǒng)中,并且大部分?jǐn)?shù)據(jù)是使用 Hdfs 來存儲的。Hive 為方便訪問數(shù)據(jù)倉庫中的數(shù)據(jù)提供了一種方法,HQL 方法,該方法能夠滿足大數(shù)據(jù)離線處理中需要對批量處理的數(shù)據(jù)結(jié)果進(jìn)行查詢的要求。

(3)大數(shù)據(jù)離線處理系統(tǒng)目前較常見的應(yīng)用場景是,大數(shù)據(jù)團(tuán)隊通過統(tǒng)一計算引擎入口,降低用戶接入門檻。充分利用集群本身數(shù)據(jù),有效促進(jìn)集群本身的建設(shè),加強對隊列、任務(wù)及主機失敗率的監(jiān)控,使用戶能夠自主分析任務(wù)性能并進(jìn)行自主調(diào)整。

4 交互可視化處理系統(tǒng)及應(yīng)用場景

(1)大數(shù)據(jù)交互可視化處理的概念及其特點。大數(shù)據(jù)交互可視化處理是將大數(shù)據(jù)形象化,可視化也就是將數(shù)據(jù)呈現(xiàn)出可視效果。大數(shù)據(jù)交互可視化處理具有兩個特點:首先表現(xiàn)方式多樣化,包括圖形、地圖、故事情節(jié)圖、結(jié)構(gòu)化插圖等。其次是適用范圍廣泛,具有領(lǐng)域創(chuàng)新性,隨著大數(shù)據(jù)的發(fā)展,傳統(tǒng)的數(shù)據(jù)表現(xiàn)形式已經(jīng)不能滿足需要,就要求對數(shù)據(jù)進(jìn)行可視化處理。

(2)大數(shù)據(jù)交互可視化處理的主要手段。① D3 經(jīng)常出現(xiàn)在表格插件中,是目前最受歡迎的可視化庫之一。D3 可以將數(shù)據(jù)綁定到 DOM 并將其驅(qū)動轉(zhuǎn)移應(yīng)用到 Document 之中。同時 D3 是繪制交互桑葚圖的一種非常簡單的工具,桑葚圖也就是桑葚能量分流圖,它作為一種類型獨特的流程圖,一般多用于能源、金融等大數(shù)據(jù)的可視化分析。另外,D3 也可以作為對 Sunburst Partition 的可視化工具,主要用來描述用戶群體的路徑點擊狀況。② ECharts 即商業(yè)級數(shù)據(jù)圖表,可以在 PC 端和移動設(shè)備上流暢運行的純 Javascript 圖表庫,為我們提供生動形象,可交互,可個性定制的大數(shù)據(jù)可視化圖表,能夠高效增強用戶體驗效果。③ R 語言是目前功能比較強大的大數(shù)據(jù)可視化解決路徑,R 語言基本可以獨立自主地完成數(shù)據(jù)處理、可視化分析、建模以及模型分析等工作,同時可以作為配合完成與其他工具的數(shù)據(jù)交互。

除此之外,R 語言能夠完成頂尖的制圖工作,不僅可以完成lattcie 包、ggplot2 包的復(fù)雜數(shù)據(jù)可視化,還可以完成rCharts 包、recharts 包、plotly 包的數(shù)據(jù)交互可視化。

(3)大數(shù)據(jù)交互可視化處理的應(yīng)用場景。大數(shù)據(jù)作為一個新的研究領(lǐng)域在近幾年受到越來越多的關(guān)注,大數(shù)據(jù)可視化也正成為一大熱點。以下將介紹三種大數(shù)據(jù)交互可視化較典型的應(yīng)用場景。

第一是應(yīng)用于社會關(guān)系的可視化,隨著移動互聯(lián)網(wǎng)的不斷發(fā)展,互聯(lián)網(wǎng)社會網(wǎng)絡(luò)數(shù)據(jù)已成為十分重要的數(shù)據(jù)資源,社會網(wǎng)絡(luò)分析就是利用這些數(shù)據(jù)資源分析各種網(wǎng)絡(luò)現(xiàn)象。另外,用戶社交性設(shè)計在最近幾年的移動端網(wǎng)游中也受到越來越多的關(guān)注和重視,用戶社交型設(shè)計就需要以數(shù)據(jù)交互可視化為基礎(chǔ),從而建立并美化游戲模式,增強用戶游戲體驗。

第二個應(yīng)用場景是地理信息的可視化。例如百度遷移圖,就是基于大數(shù)據(jù)可視化的地理信息可視化的典型例子,可以通過分析處理動態(tài)數(shù)據(jù),將數(shù)據(jù)進(jìn)行動態(tài)連線處理,從而形成流向圖,一目了然。除此之外也可以利用 Remap 實現(xiàn)天氣預(yù)報的功能,也可以實現(xiàn)會議在地圖上的可視化,如中國 2015 年 R 語言會議在各個城市舉行情況的可視化展示。近幾年較為流行的另外一種地理信息可視化方式是城市熱力圖,圖示以不同深淺的顏色來表示各個地區(qū)的實際數(shù)據(jù)。

第三是美國大選的大數(shù)據(jù)可視化,在美國大選期間,美國媒體產(chǎn)出大量選舉相關(guān)的數(shù)據(jù)報道,通過對這些大數(shù)據(jù)的可視化,選民可以清晰了解選舉動態(tài)。通過以上幾種大數(shù)據(jù)可視化的典型例子,我們可以看出,大數(shù)據(jù)可視化是一個具有多種可能,且并不難以實現(xiàn)的大數(shù)據(jù)處理系統(tǒng),而且具有極大的發(fā)展空間。

5 結(jié)語

大數(shù)據(jù)處理系統(tǒng)會隨著大數(shù)據(jù)研究的深入以及數(shù)據(jù)處理技術(shù)的發(fā)展而更加多元更加完善,也將會在更多行業(yè)或領(lǐng)域中被實際應(yīng)用。大數(shù)據(jù)已經(jīng)深入到我們生活的方方面面,如何能夠更有效更充分挖掘大數(shù)據(jù)中的價值仍需要不斷地研究和探索。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    93

    瀏覽量

    16695
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8908

    瀏覽量

    137791

原文標(biāo)題:大數(shù)據(jù)處理系統(tǒng)模式及其應(yīng)用分析

文章出處:【微信號:appic-cn,微信公眾號:集成電路應(yīng)用雜志】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Hadoop 生態(tài)系統(tǒng)大數(shù)據(jù)處理中的應(yīng)用與實踐

    隨著數(shù)據(jù)量的爆發(fā)式增長,大數(shù)據(jù)處理技術(shù)成為企業(yè)關(guān)注焦點,Hadoop 生態(tài)系統(tǒng)在其中扮演著核心角色。 Hadoop Distributed File System(HDFS)是其分布式文件存儲
    的頭像 發(fā)表于 01-21 17:48 ?104次閱讀

    自動零件分析儀的原理和應(yīng)用

    、自動控制技術(shù)和數(shù)據(jù)處理技術(shù)。其主要由進(jìn)樣系統(tǒng)分析系統(tǒng)數(shù)據(jù)處理系統(tǒng)三部分組成。 進(jìn)樣系統(tǒng):負(fù)
    發(fā)表于 12-23 15:22

    緩存對大數(shù)據(jù)處理的影響分析

    緩存對大數(shù)據(jù)處理的影響顯著且重要,主要體現(xiàn)在以下幾個方面: 一、提高數(shù)據(jù)訪問速度 在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)存儲通常采用分布式存儲系統(tǒng)
    的頭像 發(fā)表于 12-18 09:45 ?244次閱讀

    cmp在數(shù)據(jù)處理中的應(yīng)用 如何優(yōu)化cmp性能

    ,然后在多個處理器上并行處理,顯著提高了數(shù)據(jù)處理的速度和吞吐量。 1. CMP在大數(shù)據(jù)處理中的應(yīng)用 在大數(shù)據(jù)處理中,CMP技術(shù)可以應(yīng)用于
    的頭像 發(fā)表于 12-17 09:27 ?400次閱讀

    eda中常用的數(shù)據(jù)處理方法

    探索性數(shù)據(jù)分析(EDA)是一種統(tǒng)計方法,用于使用統(tǒng)計圖表、圖形和計算來發(fā)現(xiàn)數(shù)據(jù)中的模式、趨勢和異常值。在進(jìn)行EDA時,數(shù)據(jù)處理是至關(guān)重要的,因為它可以幫助我們更好地理解
    的頭像 發(fā)表于 11-13 10:57 ?410次閱讀

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)在大數(shù)據(jù)分析中的應(yīng)用主要體現(xiàn)在提高存儲系統(tǒng)的性能、可靠性和容量上。以下是RAID在大數(shù)據(jù)分析
    的頭像 發(fā)表于 11-12 09:44 ?313次閱讀

    海量數(shù)據(jù)處理需要多少RAM內(nèi)存

    海量數(shù)據(jù)處理所需的RAM(隨機存取存儲器)內(nèi)存量取決于多個因素,包括數(shù)據(jù)的具體規(guī)模、處理任務(wù)的復(fù)雜性、數(shù)據(jù)庫管理系統(tǒng)的效率以及所使用軟件的優(yōu)
    的頭像 發(fā)表于 11-11 09:56 ?473次閱讀

    FPGA在數(shù)據(jù)處理中的應(yīng)用實例

    FPGA(現(xiàn)場可編程門陣列)在數(shù)據(jù)處理領(lǐng)域有著廣泛的應(yīng)用,其高度的靈活性和并行處理能力使其成為許多高性能數(shù)據(jù)處理系統(tǒng)的核心組件。以下是一些FPGA在數(shù)據(jù)處理中的應(yīng)用實例: 一、通信協(xié)議
    的頭像 發(fā)表于 10-25 09:21 ?544次閱讀

    電源模塊測試系統(tǒng)ATE的數(shù)據(jù)報告與數(shù)據(jù)分析功能

    自動化測試與數(shù)據(jù)收集分析于一體的綜合測試軟件,打破了傳統(tǒng)測試系統(tǒng)數(shù)據(jù)處理系統(tǒng)分散獨立的限制,提供了一站式自動化測試服務(wù)體驗,讓電源模塊測試更智能高效。
    的頭像 發(fā)表于 09-10 18:34 ?453次閱讀
    電源模塊測試<b class='flag-5'>系統(tǒng)</b>ATE的<b class='flag-5'>數(shù)據(jù)</b>報告與<b class='flag-5'>數(shù)據(jù)分析</b>功能

    如何構(gòu)建一個基于Imap4郵件通信協(xié)議與放射性物質(zhì)監(jiān)測數(shù)據(jù)處理系統(tǒng)

    如何構(gòu)建一個基于Imap4郵件通信協(xié)議與放射性物質(zhì)監(jiān)測數(shù)據(jù)處理系統(tǒng) 構(gòu)建一個綜合性的數(shù)據(jù)處理和存儲系統(tǒng),該系統(tǒng)將集成郵件監(jiān)控、數(shù)據(jù)解析、文件
    的頭像 發(fā)表于 09-10 18:14 ?292次閱讀

    推動智慧交通建設(shè),邊緣計算賦能交通信號燈數(shù)據(jù)處理與決策能力

    隨著智慧城市建設(shè)的快速發(fā)展,智慧交通已成為城市發(fā)展的重要組成項目。智慧交通旨在通過大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等先進(jìn)技術(shù),實現(xiàn)交通系統(tǒng)的全面感知、智能分析、主動服務(wù)和協(xié)同管理。邊緣計算在交通信號燈物聯(lián)網(wǎng)
    的頭像 發(fā)表于 07-25 16:04 ?804次閱讀
    推動智慧交通建設(shè),邊緣計算賦能交通信號燈<b class='flag-5'>數(shù)據(jù)處理</b>與決策能力

    基于MATLAB的信號處理系統(tǒng)分析

    基于MATLAB的信號處理系統(tǒng)分析,包括信號的導(dǎo)入、預(yù)處理分析、特征提取以及頻譜分析等關(guān)鍵步驟,并通過實例展示MATLAB在信號
    的頭像 發(fā)表于 05-17 14:24 ?1235次閱讀

    如何利用DPU加速Spark大數(shù)據(jù)處理? | 總結(jié)篇

    SSD速度通過NVMe接口得到了大幅提升,并且網(wǎng)絡(luò)傳輸速率也進(jìn)入了新的高度,但CPU主頻發(fā)展并未保持同等步調(diào),3GHz左右的核心頻率已成為常態(tài)。 在當(dāng)前背景下Apache Spark等大數(shù)據(jù)處理工具中,盡管存儲和網(wǎng)絡(luò)性能的提升極大地減少了數(shù)據(jù)讀取和傳輸?shù)臅r間消耗,但
    的頭像 發(fā)表于 04-02 13:45 ?1119次閱讀
    如何利用DPU加速Spark<b class='flag-5'>大數(shù)據(jù)處理</b>? | 總結(jié)篇

    上位機組成部分及工作原理圖

    上位機通常是指上層的控制系統(tǒng)或者數(shù)據(jù)處理系統(tǒng),是對下位機進(jìn)行監(jiān)控、控制和數(shù)據(jù)處理的設(shè)備。
    的頭像 發(fā)表于 03-05 16:33 ?4076次閱讀
    上位機組成部分及工作原理圖

    數(shù)字圖像處理系統(tǒng)及應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《數(shù)字圖像處理系統(tǒng)及應(yīng)用.pdf》資料免費下載
    發(fā)表于 02-23 14:49 ?0次下載
    澳博娱乐| 最新百家乐网评测排名| 香港六合彩总公司| 真人百家乐代理合作| 岑巩县| 優博百家乐客服| 真钱百家乐官网哪里最好| 百家乐官网娱乐礼金| 宜兰市| 丽都百家乐的玩法技巧和规则 | 博E百百家乐官网现金网| 威尼斯人娱乐城 线路畅通中心| 任你博百家乐官网娱乐城| 汕尾市| 百家乐博彩网址| 百家乐官网孖宝揽| 新竹县| 大发888娱乐鸿博娱乐| 手机百家乐官网能兑换现金棋牌游戏| 阿坝县| 大发888娱乐场下载com| 百家乐有几种打法| 百家乐官网棋牌交友| 88娱乐城2官方网站| 网上的百家乐是真是假| 皇室百家乐官网的玩法技巧和规则 | 班戈县| 太阳城的故事| 百家乐最佳投注办法| 电脑打百家乐官网怎么赢| 阜康市| 水果机上分器| 百家乐推锅| 成都百家乐官网的玩法技巧和规则| 微博| 大发888 无法进入网页| 百家乐如何制| 百家乐官网开户| 百家乐官网连跳规律| 六合彩预测| 百家乐怎么玩请指教|