衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析? 華為云數(shù)據(jù)庫(kù)GaussDB (for Cassandra) 3個(gè)秘訣搞定

IT科技蘇辭 ? 來(lái)源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀

50億海量數(shù)據(jù)如何高效存儲(chǔ)和分析?

華為云數(shù)據(jù)庫(kù)GaussDB (for Cassandra) 3個(gè)秘訣搞定

當(dāng)下,信息社會(huì)正在從互聯(lián)網(wǎng)時(shí)代走向物聯(lián)網(wǎng)時(shí)代,信息交互變得更加龐雜、高效和智能。對(duì)于互聯(lián)網(wǎng)公司IOT企業(yè)來(lái)說(shuō),既是機(jī)遇,也是挑戰(zhàn)。因?yàn)?,企業(yè)不可避免的要面對(duì)數(shù)據(jù)量劇增帶來(lái)的一系列問題:如何高效存儲(chǔ)和擴(kuò)容,如何在對(duì)原有業(yè)務(wù)改動(dòng)最小的情況下做到智能化和實(shí)時(shí)分析。

針對(duì)挑戰(zhàn),華為云GaussDB (for Cassandra)為客戶提供了強(qiáng)擴(kuò)展、高存儲(chǔ)、高效導(dǎo)入/導(dǎo)出和實(shí)時(shí)分析等一系列能力,并成功服務(wù)了眾多互聯(lián)網(wǎng)公司和IOT企業(yè),獲得了客戶的高度認(rèn)可和支持。本文將以其中一個(gè)客戶業(yè)務(wù)的痛點(diǎn)問題舉例,聊聊高效存儲(chǔ)和實(shí)時(shí)分析的3個(gè)秘訣。

海量存儲(chǔ),PB級(jí)無(wú)感擴(kuò)展

該用戶在線下本地化部署使用數(shù)據(jù)庫(kù)或者使用其他的存儲(chǔ)為云盤的數(shù)據(jù)庫(kù)時(shí),常常需要在容量達(dá)到閾值時(shí),提前規(guī)劃和申購(gòu)存儲(chǔ)資源,可能還需要連帶擴(kuò)容不必要的計(jì)算資源。而使用GaussDB (for Cassandra)之后,便再無(wú)此煩惱。GaussDB (for Cassandra)采用存算分離架構(gòu),可單獨(dú)擴(kuò)展存儲(chǔ),高效擴(kuò)容,業(yè)務(wù)無(wú)感,最高可擴(kuò)展到PB級(jí)。

此外,客戶為了做大數(shù)據(jù)分析,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)再寫入一份到HDFS中,供MapReduce和Spark分析,同時(shí)需要維護(hù)兩套資源,維護(hù)和資源成本成為了痛點(diǎn)。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數(shù)據(jù)庫(kù)存儲(chǔ)和對(duì)接大數(shù)據(jù)分析的功能,同時(shí)GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發(fā),而不是資源管理。

數(shù)據(jù)變更捕獲和實(shí)時(shí)分析

客戶的一個(gè)使用場(chǎng)景需要將爬蟲或用戶輸入的數(shù)據(jù),進(jìn)行在線分析和實(shí)時(shí)推薦業(yè)務(wù),該業(yè)務(wù)中全量數(shù)據(jù)達(dá)到了50億條,但增量數(shù)據(jù)不足5億,分析對(duì)象主要是每日新增數(shù)據(jù)。在這個(gè)場(chǎng)景中,GaussDB (for Cassandra)為客戶提供了streaming服務(wù)+實(shí)時(shí)分析解決方案,在損失小部分讀寫性能的前提下,客戶端無(wú)需改造即可做到數(shù)據(jù)讀寫和實(shí)時(shí)分析并行,解決方案如下圖,該解決方案主要有以下幾個(gè)階段:

1.客戶業(yè)務(wù)用過(guò)開源驅(qū)動(dòng)寫入數(shù)據(jù)到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對(duì)外提供streaming接口,該接口可獲取數(shù)據(jù)變更捕獲

3.客戶構(gòu)建的流服務(wù)組件讀取streaming接口數(shù)據(jù)寫入到指定的Kafka隊(duì)列

4.Kafka隊(duì)列將streaming數(shù)據(jù)寫入到Spark或者Flink中

5.客戶在Spark中可對(duì)增量數(shù)據(jù)做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數(shù)據(jù)導(dǎo)出分析

客戶的另一個(gè)業(yè)務(wù)需要周期性對(duì)全量數(shù)據(jù)進(jìn)行分析和處理,但不想影響在線業(yè)務(wù),希望在閑時(shí)處理。GaussDB (for Cassandra)提供了全量數(shù)據(jù)導(dǎo)出和分析解決方案,可在業(yè)務(wù)低峰期觸發(fā)任務(wù)進(jìn)行數(shù)據(jù)導(dǎo)出和冷數(shù)據(jù)分析,數(shù)據(jù)導(dǎo)出速率是開源的10+倍,同時(shí)做到對(duì)業(yè)務(wù)讀寫基本無(wú)影響。如下為互聯(lián)網(wǎng)客戶每周定期導(dǎo)出數(shù)據(jù)分析用戶畫像的解決方案,該方案有以下幾個(gè)階段:

1.客戶根據(jù)需求配置ECS規(guī)格,并掛載obsfs并行文件系統(tǒng)

2.客戶在DLF上配置導(dǎo)出作業(yè),包括ECS信息,導(dǎo)出參數(shù)和定時(shí)任務(wù)

3.CDM下發(fā)作業(yè)任務(wù)

4.ECS上的導(dǎo)出任務(wù)將GaussDB (for Cassandra)中的指定表指定條件的數(shù)據(jù)導(dǎo)出到obsfs

5.Spark從obsfs中讀取全量數(shù)據(jù)進(jìn)行數(shù)據(jù)分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過(guò)這3個(gè)秘訣,華為云GaussDB (for Cassandra)完美解決了難擴(kuò)展、高成本、變更不及時(shí)等問題,實(shí)現(xiàn)了海量數(shù)據(jù)的高效存儲(chǔ)和實(shí)時(shí)分析,為互聯(lián)網(wǎng)公司和IOT企業(yè)的數(shù)字化發(fā)展提供了更多可能。

審核編輯黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 華為云
    +關(guān)注

    關(guān)注

    3

    文章

    2682

    瀏覽量

    17587
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    分布式數(shù)據(jù)庫(kù)有哪些類型

    分布式數(shù)據(jù)庫(kù)有哪些類型?分布式數(shù)據(jù)庫(kù)主要類型包括:關(guān)系型分布式數(shù)據(jù)庫(kù)、非關(guān)系型分布式數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 01-15 09:43 ?111次閱讀

    構(gòu)建數(shù)據(jù)庫(kù)解決方案,基于華為 Flexus X 實(shí)例容器化 MySQL 主從同步架構(gòu)

    前言**** 華為 Flexus X 實(shí)例,融合柔性算力與智能調(diào)度,為數(shù)據(jù)庫(kù)解決方案帶來(lái)全新突破。采用容器化 MySQL 主從同步架構(gòu),實(shí)現(xiàn)數(shù)據(jù)
    的頭像 發(fā)表于 01-07 17:22 ?200次閱讀
    構(gòu)建<b class='flag-5'>數(shù)據(jù)庫(kù)</b>解決方案,基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實(shí)例容器化 MySQL 主從同步架構(gòu)

    數(shù)據(jù)庫(kù)是哪種數(shù)據(jù)庫(kù)類型?

    數(shù)據(jù)庫(kù)是一種部署在虛擬計(jì)算環(huán)境中的數(shù)據(jù)庫(kù),它融合了計(jì)算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 01-07 10:22 ?142次閱讀

    使用華為 X 實(shí)例部署圖數(shù)據(jù)庫(kù) Virtuoso 并存儲(chǔ) 6500 萬(wàn)條大數(shù)據(jù)的完整過(guò)程與性能測(cè)評(píng)

    前言 ? 1. 部署Virtuoso圖數(shù)據(jù)庫(kù)的準(zhǔn)備工作 ? 1.1 選擇華為X實(shí)例的原因 ? 1.2 Virtuoso圖數(shù)據(jù)庫(kù)簡(jiǎn)介 ? 1.3 環(huán)境準(zhǔn)備與系統(tǒng)配置 ? 2. Virt
    的頭像 發(fā)表于 12-25 17:51 ?294次閱讀
    使用<b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實(shí)例部署圖<b class='flag-5'>數(shù)據(jù)庫(kù)</b> Virtuoso 并<b class='flag-5'>存儲(chǔ)</b> 6500 萬(wàn)條大<b class='flag-5'>數(shù)據(jù)</b>的完整過(guò)程與性能測(cè)評(píng)

    數(shù)據(jù)庫(kù)主機(jī)哪個(gè)好一點(diǎn)?

    數(shù)據(jù)庫(kù)主機(jī)哪個(gè)好一點(diǎn)?主機(jī)和數(shù)據(jù)庫(kù)各有優(yōu)勢(shì),選擇哪個(gè)更好取決于具體需求。
    的頭像 發(fā)表于 12-04 13:50 ?176次閱讀

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

    個(gè)運(yùn)行在存儲(chǔ)上的SQLServer數(shù)據(jù)庫(kù),有1000多個(gè)文件,大小幾十TB。數(shù)據(jù)庫(kù)每10天生成一個(gè)NDF文件,每個(gè)NDF幾百GB大小。
    的頭像 發(fā)表于 10-31 13:21 ?336次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過(guò)拼接<b class='flag-5'>數(shù)據(jù)庫(kù)</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫(kù)</b>

    數(shù)據(jù)庫(kù)可以租用嗎?完整租用流程來(lái)了

    數(shù)據(jù)庫(kù)是可以租用的,這是一種合法且便捷的數(shù)據(jù)存儲(chǔ)和管理方式。數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 10-28 09:54 ?214次閱讀

    恒訊科技分析數(shù)據(jù)庫(kù)rds和redis區(qū)別是什么如何選擇?

    數(shù)據(jù)庫(kù)RDS(Relational Database Service)和Redis是兩種不同類型的數(shù)據(jù)庫(kù)服務(wù),它們有各自的特點(diǎn)和適用場(chǎng)景: 1、數(shù)據(jù)模型:RDS是一種關(guān)系型
    的頭像 發(fā)表于 08-19 15:31 ?465次閱讀

    基于分布式存儲(chǔ)WDS的金融信創(chuàng)承載數(shù)據(jù)庫(kù)類關(guān)鍵應(yīng)用

    基于分布式存儲(chǔ)WDS的金融信創(chuàng)承載數(shù)據(jù)庫(kù)類關(guān)鍵應(yīng)用
    的頭像 發(fā)表于 08-16 09:42 ?327次閱讀
    基于分布式<b class='flag-5'>存儲(chǔ)</b>WDS的金融信創(chuàng)<b class='flag-5'>云</b>承載<b class='flag-5'>數(shù)據(jù)庫(kù)</b>類關(guān)鍵應(yīng)用

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)環(huán)境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統(tǒng)服務(wù)器使用。windows系統(tǒng)服務(wù)器內(nèi)運(yùn)行了Sql Server數(shù)據(jù)庫(kù),存儲(chǔ)空間在操作系統(tǒng)層面劃分
    的頭像 發(fā)表于 05-08 11:43 ?579次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—raid5陣列上層Sql Server<b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    華為GaussDB數(shù)據(jù)庫(kù)基礎(chǔ)版發(fā)布:旗艦性能、價(jià)格下降超60%

    高性價(jià)比:相比企業(yè)版,華為 GaussDB 基礎(chǔ)版價(jià)格大幅下調(diào)(降幅達(dá) 60%-70%),且支持全場(chǎng)景數(shù)據(jù)壓縮,具有“超高壓縮比”,性能影響僅為 5%-10%,
    的頭像 發(fā)表于 05-07 14:21 ?693次閱讀

    時(shí)序數(shù)據(jù)庫(kù)是什么?時(shí)序數(shù)據(jù)庫(kù)的特點(diǎn)

    時(shí)序數(shù)據(jù)庫(kù)是一種在處理時(shí)間序列數(shù)據(jù)方面具有高效和專門化能力的數(shù)據(jù)庫(kù)。它主要用于存儲(chǔ)和處理時(shí)間序列數(shù)據(jù)
    的頭像 發(fā)表于 04-26 16:02 ?706次閱讀

    華為多模數(shù)據(jù)庫(kù) GeminiDB 架構(gòu)與應(yīng)用實(shí)踐直播問答實(shí)錄

    多模數(shù)據(jù)庫(kù)作為一種新興的數(shù)據(jù)管理解決方案,正在受到越來(lái)越多的關(guān)注。而華為多模數(shù)據(jù)庫(kù) GeminiDB 基于云原生
    的頭像 發(fā)表于 04-08 18:25 ?1208次閱讀

    華為云原生多模數(shù)據(jù)庫(kù) GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

    近日,2023 全球分布式大會(huì)·深圳站順利召開,華為 NoSQL 數(shù)據(jù)庫(kù)研發(fā)總監(jiān)余汶龍?jiān)跁?huì)上發(fā)表了題為《華為云原生多模
    的頭像 發(fā)表于 04-08 18:23 ?1224次閱讀
    <b class='flag-5'>華為</b>云原生多模<b class='flag-5'>數(shù)據(jù)庫(kù)</b> GeminiDB 架構(gòu)與應(yīng)用實(shí)踐

    選擇 KV 數(shù)據(jù)庫(kù)最重要的是什么?

    經(jīng)常有客戶提到 KV 數(shù)據(jù)庫(kù),但卻偏偏“不要 Redis”。比如有個(gè)做安全威脅分析平臺(tái)的客戶,他們明確表示自己對(duì)可靠性要求非常高,需要的不是開源 Redis 這種內(nèi)存緩存庫(kù),而是 KV
    的頭像 發(fā)表于 03-28 22:11 ?744次閱讀
    選擇 KV <b class='flag-5'>數(shù)據(jù)庫(kù)</b>最重要的是什么?
    线上百家乐手机版| 安桌百家乐官网游戏百家乐官网 | 粤港澳百家乐娱乐平台| 大发888娱乐场官网官方下载| 沙龙百家乐官网娱乐城| 大发888游戏场下载| 百家乐官网精神| 大发888真人游戏平台| 澳门百家乐官网十大缆| 超级老虎机系统| 任你博百家乐官网的玩法技巧和规则| 大发888在线开户| 女性做生意的风水| 太子娱乐城网址| 中华百家乐娱乐城| 百家乐官网公式软件| 辽宁棋牌游戏大厅| 网上百家乐娱乐场| 盐山县| 新时代百家乐的玩法技巧和规则 | 百家乐官网与龙虎斗怎么玩| 大发888国际娱乐平台| 百家乐胜率被控制| 澳门百家乐官网网址多少| 现金二八杠游戏| 百家乐代理网址| 新葡京百家乐官网现金| 全讯网博客| 澳门百家乐21点| 乐宝百家乐官网娱乐城| 大发888网页免费游戏| 太阳城百家乐优惠| 澳门百家乐官网娱乐城网址| 日博娱乐城开户| 百家乐赌博讨论群| 尊龙百家乐官网娱乐场开户注册 | 尊龙百家乐官网娱乐场| 利博亚洲| 百家乐游戏免费试| 大桥下做生意风水好吗| k7百家乐官网最小投注|