11月5日,在云棲大會一體化大數據智能峰會上,由開放原子開源基金會、X-lab開放實驗室和阿里巴巴開源委員會聯合出品的《2022開源大數據熱力報告》重磅發布。
開放原子開源基金會副秘書長劉京娟
開放原子開源基金會副秘書長劉京娟對報告進行了深度解讀。報告基于公開數據研究最活躍的102個開源大數據項目,探尋出開源大數據技術發展背后的“摩爾定律”:每隔40個月,開源項目熱力值就會翻一倍,技術完成一輪更新迭代。在過去8年里,發生了5次較大規模的技術熱力躍遷,多元化、一體化、云原生成為當前開源大數據發展趨勢的最顯著特征。
定量分析“后Hadoop時代”開源趨勢
Hadoop作為開源大數據技術的起源,興起于2006年,至今已有16年歷史。報告收集了從Hadoop發展第10年(即2015年)至今的相關公開數據,并進行了關聯分析,定義了開源項目熱力值研究模型,用量化指標描述開源項目的開發迭代活躍度和受開發者歡迎程度。 報告所呈現的開源大數據熱力圖,從技術全景、技術棧分類以及項目維度對入圍項目的熱力表現進行洞察,將項目進程中的關鍵事件與熱力表現關聯分析,并訪談了開源基金會、知名開源項目等領域專家,嘗試找到項目健康發展一般規律,并對有效提升項目影響力的方法論進行了歸納總結。開源大數據技術的“摩爾定律”
報告發現,每隔40個月,熱力值會提升1倍,開源大數據完成一輪技術迭代升級,而且技術周期在加速縮短。在8年時間內,發生了多輪熱力變遷,反映出背后技術的更新換代趨勢。開發者對「數據查詢與分析」保持了長期的開發熱情,連續8年位居熱力值榜首。2017年,「流處理」熱力值超過「批處理」,大數據處理進入實時階段。數據規模不斷擴大,數據結構也更多樣化,「數據集成」從2020年開始爆發式增長。三大熱力趨勢:多元化、一體化和云原生
用戶需求多樣化推動技術多元化。「數據湖」以34%的熱力值年均復合增長率高居熱力值增速第一位,「交互式分析」、「DataOps」緊隨其后,分列第二、三位 。而原有Hadoop體系的產品迭代則趨于穩定,熱力值年均復合增長率為1%。 從2015年開始,計算部分率先進入「一體化」演進歷程,其中的典型代表「流批一體」在2019年出現了第一個熱力峰值。以數據湖存儲為代表的存儲一體化從2019年起進入了一個新的發展階段,涌現了Delta Lake、 Iceberg和Hudi等熱點項目。 云原生大規模重構開源技術棧。誕生于云原生時代的開源項目如雨后春筍般破土成長。「數據集成」、「數據存儲」、「數據開發與管理」等領域均有重大項目更迭,新項目熱力值占比已經超過了80%。開源大數據熱力榜單TOP30
本報告從102個入圍項目中,評選出了TOP30熱力榜單。Kibana以989.40的熱力值高居榜首。ClickHouse(數據查詢與分析)、Airflow(數據調度與編排)、Flink(流處理)、Airbyte(數據集成)分別摘得各自細分領域的TOP1。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一眾中國開源項目也表現出高熱力趨勢。把解決用戶痛點作為核心競爭力,是這些優秀開源項目的共同特征,這一特征保證它們與時俱進,成為熱力趨勢中的“常青樹”。 ? 感謝開源中國、InfoQ和阿里云開發者社區的戰略支持;感謝對本報告內容產出做出重要貢獻的32位專家和貢獻者;感謝CSDN、DataFun、Segmentfault思否、開源社等社區合作。 ?報告下載地址:
https://www.openatom.org/other/%E5%BC%80%E6%BA%90%E5%A4%A7%E6%95%B0%E6%8D%AE%E7%83%AD%E5%8A%9B%E6%8A%A5%E5%91%8A2022.pdf
原文標題:《2022開源大數據熱力報告》重磅發布
文章出處:【微信公眾號:開放原子】歡迎添加關注!文章轉載請注明出處。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
OpenHarmony
+關注
關注
25文章
3747瀏覽量
16584 -
開放原子基金會
+關注
關注
1文章
490瀏覽量
5273
原文標題:《2022開源大數據熱力報告》重磅發布
文章出處:【微信號:開放原子,微信公眾號:開放原子】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
小米開源2024年度報告發布
近日,小米公司正式發布了其《小米開源2024年度報告》,該報告詳細闡述了小米在開源領域所取得的顯著進展。在2024年這一關鍵年份里,小米在
2023年度《中國公路貨運運行大數據分析報告》發布
伴隨新一輪科技革命和產業變革加速演進,公路貨運行業也正處于產業升級、結構調整、轉型重構的總體發展階段。在此趨勢下,中交興路聯合長安大學等院校和機構,對公路貨運行業的運行態勢和變化特點持續關注和分析,迄今已連續六年編制《中國公路貨運運行大數據分析報告》。在多方共同合作之下,
開源鴻蒙操作系統5.0 Release版本發布
12月20日,在2024開放原子開發者大會暨首屆開源技術學術大會開幕式上,開放原子開源鴻蒙(即OpenAtom OpenHarmony,簡稱“開源鴻蒙”或“OpenHarmony”)項目群重磅
黃鶴開源社區正式發布
近日,在2024開放原子開發者大會暨首屆開源技術學術大會開幕式上,基于開放原子開源基金會旗下AtomGit開源協作平臺搭建的黃鶴開源社區正式發布
開源鴻蒙應用案例重磅發布
開源賦能千行百業,有效推動產業創新升級。隨著開放原子開源基金會的開源鴻蒙(OpenHarmony)5.0 Release版本正式發布,項目生態逐步走向成熟,眾多
Meta重磅發布Llama 3.3 70B:開源AI模型的新里程碑
?在人工智能領域,Meta的最新動作再次引起了全球的關注。今天,我們見證了Meta發布的 Llama 3.3 70B 模型,這是一個開源的人工智能模型,它不僅令人印象深刻,而且在性能上達到了一個
智慧城市與大數據的關系
智慧城市與大數據之間存在著密切的關系,這種關系體現在大數據對智慧城市建設的支撐和推動作用,以及智慧城市產生的大量數據對大數據技術的應用需求。 大數據
IBM發布《2024年數據泄露成本報告》
近日,IBM(紐約證券交易所:IBM)發布了 2024年《數據泄露成本報告》(Cost of a Data Breach Report)。報告顯示,全球
浪潮信息重磅發布“源2.0-M32”開源大模型
浪潮信息近日發布了一款全新的開源大模型——“源2.0-M32”。這款大模型在“源2.0”系列大模型的基礎上,進行了深度的技術創新與升級。
華為聯合中國信通院發布《華為星河AI數據中心網絡測試報告》
2024 開放數據中心委員會(以下簡稱ODCC)春季全會在江西婺源順利召開,全會由ODCC副主席李潔博士主持。全會期間,華為聯合中國信通院云大所數據中心團隊發布《華為星河AI數據中心網
5G智能制造熱力工廠數字孿生可視化平臺,推進熱力行業數字化轉型
開始探索數字化轉型之路。而5G智能制造工廠數字孿生可視化平臺,正是這一轉型過程中的重要工具。5G智能制造工廠數字孿生可視化平臺,通過集成物聯網、大數據、云計算、人工智能等先進技術,實現了對熱力生產全過程的數字化模擬和實時監控。
谷歌發布輕量級開源人工智能模型Gemma
谷歌近日宣布推出開源人工智能(AI)模型系列Gemma,旨在為開發人員和研究人員提供一個負責任的AI構建平臺。這一舉措標志著自2022年OpenAI的ChatGPT引領AI聊天機器人熱潮后,谷歌首次發布重要的
評論