衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

湖倉一體:揭秘數(shù)據(jù)湖架構現(xiàn)代化之道

IBM中國 ? 來源:未知 ? 2023-07-24 19:00 ? 次閱讀
wKgZomToE96AXq46AAUH1WcibZI849.gifwKgZomToE96Aa8dEAAIo1cbXNhk136.png作者:Hebert W. Pereyra,IBM 杰出工程師,Hybrid Data Management 首席架構師;譯者:劉俊 ,IBM watsonx.data 開發(fā)架構師

數(shù)據(jù)湖誕生至今已有十多年的歷史,為全球一些最大的企業(yè)提供了數(shù)據(jù)分析的支持。然而,也有人認為,絕大多數(shù)數(shù)據(jù)湖部署已經(jīng)演變成為“數(shù)據(jù)沼澤”。不論你站在哪一邊,現(xiàn)實情況是,這些系統(tǒng)中仍然承載著大量的數(shù)據(jù)。這些數(shù)據(jù)規(guī)模龐大,使得移動、遷移或對其進行現(xiàn)代化都變得異常困難。

數(shù)據(jù)湖的巨大挑戰(zhàn):單一結構的架構問題

從較高層次來看,數(shù)據(jù)湖是一個大規(guī)模的單一數(shù)據(jù)存儲庫。數(shù)據(jù)可以以原始形式存儲,也可以經(jīng)過優(yōu)化,采用適合專用引擎使用的不同格式。

就 Hadoop 而言,它是最受歡迎的數(shù)據(jù)湖之一,通過使用開源軟件實現(xiàn)該存儲庫,并在通用硬件上運行,可以以非常低的成本在系統(tǒng)中存儲大量數(shù)據(jù)。數(shù)據(jù)可以以開放的數(shù)據(jù)格式進行持久化,從而實現(xiàn)了數(shù)據(jù)消費的民主化,并通過自動復制提供了高可用性的支持。默認的處理框架具備從故障中恢復的能力。這無疑是與傳統(tǒng)分析環(huán)境有著顯著差異的重要轉變,傳統(tǒng)數(shù)據(jù)分析環(huán)境往往意味著供應商鎖定以及無法處理大規(guī)模數(shù)據(jù)。

另一個出乎意料的挑戰(zhàn)是將 Spark 引入作為大數(shù)據(jù)處理框架。由于其支持數(shù)據(jù)轉換、流式處理和 SQL,它迅速獲得了廣泛的認可。然而,它并未能與現(xiàn)有的數(shù)據(jù)湖環(huán)境友好共存,因此通常需要額外的專用計算集群才能運行 Spark。

我們將時間前移 15 年回到當下,現(xiàn)實已經(jīng)清楚地表明了這項技術所涉及的權衡和妥協(xié)。其快速的采用意味著客戶很快失去了對數(shù)據(jù)湖中數(shù)據(jù)的追蹤。同樣具有挑戰(zhàn)的是,他們無法確定數(shù)據(jù)的來源、獲取方式以及在處理過程中的轉換方式。數(shù)據(jù)治理仍然是這項技術中尚未探索的領域。雖然軟件可能是開源的,但需要有人學習如何使用、維護和支持它。僅依賴社區(qū)支持并不能持續(xù)滿足業(yè)務運營所需的響應時間。高可用性通過復制實現(xiàn)則意味著需要更多磁盤上的數(shù)據(jù)副本,增加存儲成本,并導致故障更加頻繁。而高可用的分布式處理框架則意味著不得不在性能方面做出妥協(xié),以換取彈性(這將導致交互式分析和商業(yè)智能的性能嚴重下降)。

為何要對數(shù)據(jù)湖進行現(xiàn)代化?

數(shù)據(jù)湖在特定的使用場景中已經(jīng)被證明是成功的。然而清楚的是,企業(yè)迫切需要對這些部署進行現(xiàn)代化,保護基礎設施、技能和存儲在這些系統(tǒng)中的數(shù)據(jù)的投資。

在尋找答案的過程中,行業(yè)研究了現(xiàn)有的數(shù)據(jù)平臺技術及其優(yōu)勢。很明顯,有效的方法是將傳統(tǒng)的(或者說是遺留的)數(shù)據(jù)倉庫或數(shù)據(jù)集市的關鍵特性與數(shù)據(jù)湖的優(yōu)勢結合起來。以下幾個關鍵要素迅速浮出水面:

  • 具備彈性和可擴展的存儲,能夠滿足日益增長的數(shù)據(jù)規(guī)模需求。

  • 采用開放的數(shù)據(jù)格式,使數(shù)據(jù)對所有人都可訪問,同時針對高性能進行優(yōu)化,并具備良好定義的結構。

  • 開放的元數(shù)據(jù)(可共享),能夠支持多個消費引擎或框架。

  • 支持數(shù)據(jù)更新(ACID 特性)和事務并發(fā)處理。

  • 綜合的數(shù)據(jù)安全和數(shù)據(jù)治理(如數(shù)據(jù)血緣、完整的數(shù)據(jù)訪問策略定義和執(zhí)行,包括地理分布)。

上述要素導致了湖倉一體的出現(xiàn)。湖倉一體是一種數(shù)據(jù)平臺,是將數(shù)據(jù)倉庫和數(shù)據(jù)湖的優(yōu)點融合在一起,形成統(tǒng)一、協(xié)調的數(shù)據(jù)管理解決方案。

利用 watsonx.data 來現(xiàn)代化數(shù)據(jù)湖的好處

站在當下數(shù)據(jù)分析的十字路口,IBM 的回應是為企業(yè)提供 watsonx.data 解決方案,這是一個用于大規(guī)模數(shù)據(jù)管理的新型開放式數(shù)據(jù)存儲,允許企業(yè)在無需遷移的情況下圍繞、增強和現(xiàn)代化其現(xiàn)有的數(shù)據(jù)湖和數(shù)據(jù)倉庫。它支持開放式的多云與混合云,可以在客戶管理的基礎設施(本地或者私有云)和公有云上運行。它建立在湖倉一體架構之上,并嵌入了一整套解決方案(以及通用軟件堆棧),適用于所有形態(tài)。

與市場上的競品相比,IBM 的方法基于開源堆棧和架構。這些組件并不是新的,而是業(yè)界已經(jīng)廣泛使用的成熟組件。IBM 關注它們的互操作性、共存性和元數(shù)據(jù)交換。用戶可以快速入門,從而大大降低了入門和使用的成本,因為其上層架構和基礎概念是大家熟悉且直觀的:

  • 通過對象存儲實現(xiàn)開放的數(shù)據(jù)(和表格格式)

  • 通過 S3 進行數(shù)據(jù)訪問

  • 使用 Presto 和 Spark 進行查詢計算(SQL、數(shù)據(jù)科學、轉換和流處理)

  • 通過 Hive 和兼容結構實現(xiàn)開放的元數(shù)據(jù)共享

Watsonx.data 為企業(yè)提供了一種保護他們在數(shù)據(jù)湖和數(shù)據(jù)倉庫數(shù)十年投資的方式,使企業(yè)可立即擴展并逐步現(xiàn)代化其安裝,將每個組件專注于對企業(yè)最重要的使用場景。

一個關鍵的差異化因素是多引擎策略,允許用戶在統(tǒng)一的數(shù)據(jù)平臺上根據(jù)實際情況選擇適合的技術。watsonx.data 使客戶能夠實現(xiàn)完全動態(tài)的分層存儲(以及相關的計算)。隨著時間的推移,這可以帶來非常顯著的數(shù)據(jù)管理和處理的成本節(jié)省。

如果最終企業(yè)的目標是通過湖倉一體架構來現(xiàn)代化現(xiàn)有的數(shù)據(jù)湖部署,那么 watsonx.data 則通過選擇計算方式來最小化數(shù)據(jù)遷移和應用遷移,從而簡化了任務。

接下來可以做什么?

在過去的幾年里,數(shù)據(jù)湖在大多數(shù)企業(yè)的數(shù)據(jù)管理策略中發(fā)揮了重要作用。如果企業(yè)的目標是對其數(shù)據(jù)管理策略進行演進和現(xiàn)代化,使之成為真正的混合分析云架構,那么 IBM 基于湖倉一體架構而構建的新型數(shù)據(jù)存儲 watsonx.data,則是值得企業(yè)考慮的技術選擇。

相關資料

1. 點擊下載電子書:《為 AI 而設的數(shù)據(jù)存儲》:

https://www.ibm.com/account/reg/us-en/signup?formid=urx-52131

2. 點擊閱讀 IBM watsonx.data 解決方案簡介:

https://www.ibm.com/downloads/cas/4Z1YXEBO

3. 瀏覽 watsonx.data 的產(chǎn)品頁面了解更多:

https://www.ibm.com/products/watsonx-data

關于 IBM

IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。

了解更多信息,請訪問:https://www.ibm.com/cn-zh


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1766

    瀏覽量

    74861

原文標題:湖倉一體:揭秘數(shù)據(jù)湖架構現(xiàn)代化之道

文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    戴爾數(shù)據(jù)助力企業(yè)數(shù)字轉型

    在數(shù)字轉型的浪潮下,企業(yè)正面臨著前所未有的數(shù)據(jù)挑戰(zhàn)。從傳統(tǒng)的結構數(shù)據(jù)到如今的非結構數(shù)據(jù)、半
    的頭像 發(fā)表于 12-20 09:31 ?171次閱讀

    T-Core一體成型貼片電感的優(yōu)勢

    小型與集成化 : T-Core一體成型貼片電感采用先進的制作工藝,能夠實現(xiàn)超薄、小尺寸的設計,非常適合現(xiàn)代電子產(chǎn)品對小型和集成化的需求。 這種小型
    發(fā)表于 11-13 22:22

    OBOO鷗柏丨PLC嵌入式工控一體機進軍現(xiàn)代工廠產(chǎn)線電子看板市場

    OBOO鷗柏作為嵌入式工控一體現(xiàn)代化品牌源頭工廠,將進軍自動機柜相關應用場景的市場規(guī)劃,OBOO鷗柏工控一體機,觸摸屏查詢一體機相關數(shù)字
    的頭像 發(fā)表于 11-13 12:28 ?243次閱讀
    OBOO鷗柏丨PLC嵌入式工控<b class='flag-5'>一體</b>機進軍<b class='flag-5'>現(xiàn)代</b>工廠產(chǎn)線電子看板市場

    測控一體化閘門遠程監(jiān)控運維系統(tǒng)解決方案

    灌區(qū)通常需要根據(jù)灌區(qū)面積和用水需求進行合理規(guī)劃,實現(xiàn)主干渠、支渠、斗渠各個閘門的合理部署,是現(xiàn)代化灌區(qū)的重要內容。測控一體化閘門是種集成了測量和控制功能的現(xiàn)代化水工設施,不僅能夠實現(xiàn)
    的頭像 發(fā)表于 09-30 17:03 ?389次閱讀
    測控<b class='flag-5'>一體化</b>閘門遠程監(jiān)控運維系統(tǒng)解決方案

    一體成型功率電感漏感原因大揭秘

    一體成型功率電感漏感原因大揭秘gujing 編輯:谷景電子 一體成型功率電感也就是我們常說的棒型電感,它在電子電路中扮演者非常重要的角色。在一體成型功率電感的實際應用中,有時候可能會出
    的頭像 發(fā)表于 08-19 21:45 ?320次閱讀

    谷景揭秘一體成型電感外殼破了有影響嗎

    谷景揭秘一體成型電感外殼破了有影響嗎 編輯:谷景電子 一體成型電感作為電子電路中非常重要的種電子元器件,它對于維護整個電路的穩(wěn)定運行有著非常重要的作用。在
    的頭像 發(fā)表于 08-14 20:45 ?354次閱讀

    一體成型電感感值低的原因

    12、谷景揭秘一體成型電感感值低的
    發(fā)表于 07-30 10:41 ?0次下載

    安消一體化平臺建設方案

    與消防一體化平臺已成為迫切需求。本文古河云科技將詳細介紹針對企業(yè)安全生產(chǎn)和消防管理需求的一體化平臺建設方案。 首先,安消一體化平臺的系統(tǒng)架構應該包括前端展示層、后端
    的頭像 發(fā)表于 07-26 14:14 ?462次閱讀

    揭秘一體成型電感和功率電感的區(qū)別

    指的是電感的線圈和磁芯在制造過程中一體成型,沒有使用焊接或者其他連接方式。一體成型電感具有高可靠性、高電流承載能力、低直流電阻以及小型設計的特點。 二、什么是功率電感 功率電感指的是用于功率轉換和分配的電感,它們
    的頭像 發(fā)表于 07-08 10:58 ?798次閱讀

    啟揚多尺寸安卓屏一體機,助力水肥一體機實現(xiàn)智能農(nóng)田管理

    隨著科技的飛速發(fā)展,農(nóng)業(yè)現(xiàn)代化已然成為趨勢。在農(nóng)業(yè)領域,水肥一體機通過引入傳感器、物聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術,精準控制水肥配比與投放,為作物提供精準的水肥管理方案,提高作物產(chǎn)量,改善農(nóng)產(chǎn)品品質,降低
    的頭像 發(fā)表于 07-06 08:00 ?411次閱讀
    啟揚多尺寸安卓屏<b class='flag-5'>一體</b>機,助力水肥<b class='flag-5'>一體</b>機實現(xiàn)智能<b class='flag-5'>化</b>農(nóng)田管理

    什么是機電一體化?它有哪些應用?

    在科技飛速發(fā)展的今天,機電一體化技術已成為現(xiàn)代工業(yè)生產(chǎn)的核心驅動力之。它融合了機械工程、電子技術、計算機技術、信息技術等多學科的理論與技術,實現(xiàn)了機械與電子的有機結合,極大地推動了制造業(yè)的智能
    的頭像 發(fā)表于 06-11 14:02 ?6259次閱讀

    什么是數(shù)據(jù)?數(shù)據(jù)數(shù)據(jù)倉庫有什么區(qū)別?

    從本質上說,數(shù)據(jù)就是個信息資源庫。人們常常將數(shù)據(jù)數(shù)據(jù)倉庫混為
    的頭像 發(fā)表于 05-20 12:38 ?678次閱讀
    什么是<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>湖</b>?<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>湖</b>和<b class='flag-5'>數(shù)據(jù)</b>倉庫有什么區(qū)別?

    護河聯(lián)合執(zhí)法 解決通信是關鍵

    我國實行河長制進行生態(tài)環(huán)境保護以來,對、河的保護治理取得了不錯的成績。隨著治理的深入,在許多大型湖泊以及西北、西南等省界、市界偏遠地區(qū),常常需要岸與、省與省、市與市之間進行聯(lián)合執(zhí)法,進
    的頭像 發(fā)表于 05-07 08:28 ?289次閱讀
    巡<b class='flag-5'>湖</b>護河聯(lián)合執(zhí)法  解決通信是關鍵

    水利監(jiān)測物聯(lián)網(wǎng)助力加強河庫“清四亂”監(jiān)管能力與響應水平

    2018年以來,我國在全國范圍內部署開展河“清四亂”專項行動并深入推進常態(tài)規(guī)范,累計清理整治河“四亂”問題24萬余個,拆除違建1.46億平方米,清除圍堤2萬公里,清理垃圾980
    的頭像 發(fā)表于 02-22 13:48 ?285次閱讀
    水利監(jiān)測物聯(lián)網(wǎng)助力加強河<b class='flag-5'>湖</b>庫“清四亂”監(jiān)管能力與響應水平

    華為推出數(shù)據(jù)解決方案及全閃存存儲新品

    此次發(fā)布的新品包括OceanStor Dorado 2100,這是業(yè)界首款面向非結構數(shù)據(jù)設計的A-A架構入門級全閃存NAS,還有對應升級的SAN存儲OceanStor Dorado 2000和支持SAN&NAS
    的頭像 發(fā)表于 02-20 14:18 ?594次閱讀
    百家乐看盘技巧| 百家乐的关键技巧| 百家乐官网咨询网址| 大发888娱乐出纳柜台| 百家乐浴盆博彩通排名| 百家乐官网学院教学视频| 168棋牌游戏| 太阳神百家乐的玩法技巧和规则| 百家乐官网群的微博| 百家乐官网真人游戏网上投注 | 网络百家乐路单图| 百家乐官网任你博娱乐网| 清苑县| 大发888真人网| 金杯百家乐的玩法技巧和规则 | 水果机规律| 百家乐tt娱乐场| 百家乐注册| 网页百家乐官网的玩法技巧和规则| 真人百家乐官网开户须知| 尊爵娱乐| 德州扑克大小规则| 百家乐官方网站| 百家乐赌博技巧论坛| 开心8百家乐娱乐城| 土豪百家乐官网的玩法技巧和规则 | 赤壁百家乐官网娱乐城| 半圆百家乐官网桌子| 鸿利国际娱乐城| 真钱娱乐场游戏| 新西兰百家乐的玩法技巧和规则| 破解百家乐打路单| 风水24山分房图| 去澳门百家乐官网的玩法技巧和规则 | 大发888娱乐场下载 zhidu| 网上百家乐群的微博| 百家乐破解方法技巧| 百家乐视频免费下载| 24个招财方法| 成都百家乐官网的玩法技巧和规则| 百家乐官网赌博导航|