衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于元數(shù)據(jù)管理解析

工業(yè)互聯(lián)網(wǎng)前線 ? 來(lái)源:談數(shù)據(jù) ? 作者:石秀峰 ? 2022-05-05 16:01 ? 次閱讀

數(shù)字化時(shí)代,企業(yè)需要知道他們擁有什么數(shù)據(jù),數(shù)據(jù)在哪里、由誰(shuí)負(fù)責(zé),數(shù)據(jù)中的值意味著什么,數(shù)據(jù)的生命周期是什么,哪些數(shù)據(jù)安全性和隱私性需要保護(hù),以及誰(shuí)使用了數(shù)據(jù),用于什么業(yè)務(wù)目的,數(shù)據(jù)的質(zhì)量怎么樣,等等。這些問題都需要通過(guò)元數(shù)據(jù)管理解決,缺乏有效的元數(shù)據(jù)管理,企業(yè)的數(shù)據(jù)資產(chǎn)可能會(huì)變成拖累企業(yè)利潤(rùn)的“包袱”。 01什么是元數(shù)據(jù)? 元數(shù)據(jù)(metadata)是關(guān)于數(shù)據(jù)的組織、數(shù)據(jù)域及其關(guān)系的信息,簡(jiǎn)言之,元數(shù)據(jù)就是描述數(shù)據(jù)的數(shù)據(jù)。概念總是生澀,對(duì)于沒有IT背景的人來(lái)說(shuō)比較抽象,不容易理解,下面舉幾個(gè)例子。示例1:歌詞中的元數(shù)據(jù)有一首很多80后耳熟能詳?shù)母枨小缎》肌?,歌詞中有這么一句:“村里有個(gè)姑娘叫小芳,長(zhǎng)得好看又善良。” 我們對(duì)這句歌詞做一下分析。姓名:小芳;性別:姑娘(女);長(zhǎng)相:好看;性格:善良;住址:村里。歌詞里面,“小芳”是被描述的對(duì)象,而“姓名”“性別”“長(zhǎng)相”“性格”“住址”就是描述“小芳”的元數(shù)據(jù)。示例2:戶口本中的元數(shù)據(jù)戶口本中除了有姓名、身份證號(hào)、出生日期、住址、民族等信息外,還有家庭關(guān)系,如夫妻關(guān)系、父子關(guān)系、兄弟關(guān)系等。這些信息就是描述一個(gè)人的元數(shù)據(jù),通過(guò)戶口本中的元數(shù)據(jù),我們不僅能夠了解一個(gè)人的基本信息,還能夠了解其家庭關(guān)系。示例3:圖書館中的元數(shù)據(jù)圖書館都會(huì)用一個(gè)叫作“圖書目錄”的文件夾來(lái)管理藏書,圖書目錄包含圖書名稱、編號(hào)、作者、主題、簡(jiǎn)介、擺放位置等信息,用來(lái)幫助圖書管理員管理和快速查找圖書。元數(shù)據(jù)就如同圖書館的圖書目錄一樣,能夠幫助數(shù)據(jù)管理員管理數(shù)據(jù)。示例4:元數(shù)據(jù)好比字典字典包含一個(gè)字的注音、含義、組詞、舉例等基本信息及其字體結(jié)構(gòu)、相關(guān)引用、出處等。另外,我們可以通過(guò)拼音或偏旁部首查到這個(gè)字。所有這些信息都是對(duì)這個(gè)字的詳細(xì)描述,它們就是描述這個(gè)字的元數(shù)據(jù)。示例5:元數(shù)據(jù)就像地圖地圖是按一定比例運(yùn)用線條、符號(hào)、顏色、文字注記等描繪顯示地球表面的自然地理、行政區(qū)域、社會(huì)經(jīng)濟(jì)狀況的圖。通過(guò)地圖,你能夠找到自己所處的地理位置,了解你從哪里來(lái),到哪里去,途中要路過(guò)哪些地方。元數(shù)據(jù)也具備這樣的特點(diǎn),它能夠幫助企業(yè)了解自己有哪些數(shù)據(jù),這些數(shù)據(jù)存放在哪里,數(shù)據(jù)的來(lái)源、去向及加工路徑等。元數(shù)據(jù)與數(shù)據(jù)的不同之處在于:元數(shù)據(jù)描述的不是特定的實(shí)例或記錄,IT部門和業(yè)務(wù)部門都需要高質(zhì)量的元數(shù)據(jù)來(lái)理解現(xiàn)有數(shù)據(jù);元數(shù)據(jù)是比一般意義上的數(shù)據(jù)范疇更加廣泛的數(shù)據(jù),不僅表示數(shù)據(jù)的類型、名稱、值等信息,還提供數(shù)據(jù)的上下文描述,比如數(shù)據(jù)的所屬業(yè)務(wù)域、取值范圍、數(shù)據(jù)間的關(guān)系、業(yè)務(wù)規(guī)則、數(shù)據(jù)來(lái)源等。可以用5W1H模型來(lái)理解元數(shù)據(jù),如表16-1所示:
知識(shí)類型 定義 技術(shù)示例 業(yè)務(wù)示例
Who 誰(shuí) 誰(shuí)負(fù)責(zé)數(shù)據(jù)接口的開發(fā)? 誰(shuí)是財(cái)務(wù)域、業(yè)務(wù)域的負(fù)責(zé)人?
What 干什么或是什么 CRM和DW之間的數(shù)據(jù)血緣關(guān)系是什么? 企業(yè)市場(chǎng)管理業(yè)務(wù)域的指標(biāo)體系包含哪些指標(biāo)?
When 什么時(shí)候 提取、轉(zhuǎn)換和加載(ETL)作業(yè)什么時(shí)候運(yùn)行? 我正在分析的數(shù)據(jù)上次刷新是什么時(shí)候?
Where 在哪里 所有類型的銷售訂單都分布存儲(chǔ)在哪個(gè)系統(tǒng)的哪些數(shù)據(jù)表當(dāng)中? 在哪里可以找到按營(yíng)銷活動(dòng)顯示我們的社交媒體分析的報(bào)告?
How 怎么樣,怎么做 如何設(shè)置數(shù)據(jù)質(zhì)量的管理規(guī)則? 如何獲得產(chǎn)品的競(jìng)爭(zhēng)優(yōu)勢(shì)?
Why 為什么 出現(xiàn)數(shù)據(jù)質(zhì)量問題的根本原因是什么? 為什么老客戶會(huì)不斷流失?
02元數(shù)據(jù)的類型 按照不同應(yīng)用領(lǐng)域或功能,元數(shù)據(jù)一般大致可為三類:業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)和操作元數(shù)據(jù)。1、業(yè)務(wù)元數(shù)據(jù)業(yè)務(wù)元數(shù)據(jù)描述數(shù)據(jù)的業(yè)務(wù)含義、業(yè)務(wù)規(guī)則等。通過(guò)明確業(yè)務(wù)元數(shù)據(jù),讓人們更容易理解和使用業(yè)務(wù)元數(shù)據(jù)。元數(shù)據(jù)消除了數(shù)據(jù)二義性,讓人們對(duì)數(shù)據(jù)有一致的認(rèn)知,避免“自說(shuō)自話”,進(jìn)而為數(shù)據(jù)分析和應(yīng)用提供支撐。常見的業(yè)務(wù)元數(shù)據(jù)有:
  • 業(yè)務(wù)定義、業(yè)務(wù)術(shù)語(yǔ)解釋等;

  • 業(yè)務(wù)指標(biāo)名稱、計(jì)算口徑、衍生指標(biāo)等;

  • 業(yè)務(wù)規(guī)則引擎的規(guī)則、數(shù)據(jù)質(zhì)量檢測(cè)規(guī)則、數(shù)據(jù)挖掘算法等;

  • 數(shù)據(jù)的安全或敏感級(jí)別等。

2、技術(shù)元數(shù)據(jù)技術(shù)元數(shù)據(jù)是對(duì)數(shù)據(jù)的結(jié)構(gòu)化,方便計(jì)算機(jī)或數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)進(jìn)行識(shí)別、存儲(chǔ)、傳輸和交換。技術(shù)元數(shù)據(jù)可以服務(wù)于開發(fā)人員,讓開發(fā)人員更加明確數(shù)據(jù)的存儲(chǔ)、結(jié)構(gòu),從而為應(yīng)用開發(fā)和系統(tǒng)集成奠定基礎(chǔ)。技術(shù)元數(shù)據(jù)也可服務(wù)于業(yè)務(wù)人員,通過(guò)元數(shù)據(jù)理清數(shù)據(jù)關(guān)系,讓業(yè)務(wù)人員更快速地找到想要的數(shù)據(jù),進(jìn)而對(duì)數(shù)據(jù)的來(lái)源和去向進(jìn)行分析,支持?jǐn)?shù)據(jù)血緣追溯和影響分析。常見的技術(shù)元數(shù)據(jù)有:
  • 物理數(shù)據(jù)庫(kù)表名稱、列名稱、字段長(zhǎng)度、字段類型、約束信息、數(shù)據(jù)依賴關(guān)系等;

  • 數(shù)據(jù)存儲(chǔ)類型、位置、數(shù)據(jù)存儲(chǔ)文件格式或數(shù)據(jù)壓縮類型等;

  • 字段級(jí)血緣關(guān)系、SQL腳本信息、ETL抽取加載轉(zhuǎn)換信息、接口程序等;

  • 調(diào)度依賴關(guān)系、進(jìn)度和數(shù)據(jù)更新頻率等。
3、操作元數(shù)據(jù)操作元數(shù)據(jù)描述數(shù)據(jù)的操作屬性,包括管理部門、管理責(zé)任人等。明確管理屬性有利于數(shù)據(jù)管理責(zé)任到部門和個(gè)人,是數(shù)據(jù)安全管理的基礎(chǔ)。常見的操作元數(shù)據(jù)有:
  • 數(shù)據(jù)所有者、使用者等;
  • 數(shù)據(jù)的訪問方式、訪問時(shí)間、訪問限制等;
  • 數(shù)據(jù)訪問權(quán)限、組和角色等;
  • 數(shù)據(jù)處理作業(yè)的結(jié)果、系統(tǒng)執(zhí)行日志等;
  • 數(shù)據(jù)備份、歸檔人、歸檔時(shí)間等。
03元數(shù)據(jù)管理的目標(biāo)企業(yè)元數(shù)據(jù)管理的本質(zhì)是有效利用企業(yè)數(shù)據(jù)資產(chǎn),讓數(shù)據(jù)發(fā)揮出盡可能大的價(jià)值。元數(shù)據(jù)管理可以幫助業(yè)務(wù)分析師、系統(tǒng)架構(gòu)師、數(shù)據(jù)倉(cāng)庫(kù)工程師和軟件開發(fā)工程師等相關(guān)干系人清楚地知道企業(yè)擁有什么數(shù)據(jù),它們存儲(chǔ)在哪里,如何抽取、清理、維護(hù)這些數(shù)據(jù)并指導(dǎo)用戶使用。以下元數(shù)據(jù)管理目標(biāo)是企業(yè)的普遍訴求。1、建立指標(biāo)解釋體系滿足用戶對(duì)業(yè)務(wù)和數(shù)據(jù)理解的需求,建立標(biāo)準(zhǔn)的企業(yè)內(nèi)部知識(shí)傳承的信息承載平臺(tái),建立業(yè)務(wù)分析知識(shí)庫(kù),實(shí)現(xiàn)知識(shí)共享。能夠回答以下問題:
  • 企業(yè)有哪些數(shù)據(jù)?
  • 什么是企業(yè)有效客戶?有效客戶和客戶有何區(qū)別?
  • 什么是產(chǎn)品的生命周期?
  • 這個(gè)數(shù)據(jù)還叫什么名字?
  • 數(shù)據(jù)倉(cāng)庫(kù)中的存儲(chǔ)過(guò)程是誰(shuí)寫的?它用來(lái)干什么?現(xiàn)在還有在用嗎?
典型應(yīng)用:數(shù)據(jù)資源目錄、業(yè)務(wù)術(shù)語(yǔ)表 2、提高數(shù)據(jù)溯源能力讓用戶能夠清晰地了解數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)流的來(lái)龍去脈、業(yè)務(wù)處理規(guī)則、轉(zhuǎn)換情況等,提高數(shù)據(jù)的溯源能力,支持?jǐn)?shù)據(jù)倉(cāng)庫(kù)的成長(zhǎng)需求,降低因員工換崗造成的影響。3、數(shù)據(jù)質(zhì)量稽核體系通過(guò)非冗余、非重復(fù)的元數(shù)據(jù)信息提高數(shù)據(jù)完整性、準(zhǔn)確性。元數(shù)據(jù)管理解決的問題是如何將業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)分門別類地進(jìn)行管理,建立報(bào)警、監(jiān)控機(jī)制,出現(xiàn)故障時(shí)能及時(shí)發(fā)現(xiàn)問題,為數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量監(jiān)控提供基礎(chǔ)素材。 04元數(shù)據(jù)管理的技術(shù)從技術(shù)層面來(lái)看,元數(shù)據(jù)管理的技術(shù)主要包括元數(shù)據(jù)采集、元數(shù)據(jù)管理、元數(shù)據(jù)應(yīng)用和元數(shù)據(jù)接口等。

1、元數(shù)據(jù)采集

在數(shù)據(jù)治理項(xiàng)目中,常見的元數(shù)據(jù)有數(shù)據(jù)源的元數(shù)據(jù)、數(shù)據(jù)加工處理過(guò)程的元數(shù)據(jù)、數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)主題庫(kù)的元數(shù)據(jù)、數(shù)據(jù)應(yīng)用層的元數(shù)據(jù)、數(shù)據(jù)接口服務(wù)的元數(shù)據(jù)等。元數(shù)據(jù)采集服務(wù)提供各類適配器來(lái)滿足以上各類元數(shù)據(jù)的采集需求,并將元數(shù)據(jù)整合處理后統(tǒng)一存儲(chǔ)于中央元數(shù)據(jù)倉(cāng)庫(kù),實(shí)現(xiàn)元數(shù)據(jù)的統(tǒng)一管理。在這個(gè)過(guò)程中,數(shù)據(jù)采集適配器十分重要,元數(shù)據(jù)采集不僅要能夠適配各種數(shù)據(jù)庫(kù)、各類ETL、各類數(shù)據(jù)倉(cāng)庫(kù)和報(bào)表產(chǎn)品,還需要適配各類結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)源。(1)關(guān)系型數(shù)據(jù)庫(kù)通過(guò)元數(shù)據(jù)適配器采集來(lái)自Oracle、DB2、SQL Server、MySQL、Teradata、Sybase等關(guān)系型數(shù)據(jù)庫(kù)的庫(kù)表結(jié)構(gòu)、視圖、存儲(chǔ)過(guò)程等元數(shù)據(jù)。關(guān)系型數(shù)據(jù)庫(kù)一般都提供了元數(shù)據(jù)的橋接器,例如Oracle的RDBMS,可實(shí)現(xiàn)元數(shù)據(jù)信息的快速讀取。(2)2.NoSQL數(shù)據(jù)庫(kù)元數(shù)據(jù)采集工具應(yīng)支持來(lái)自MongoDB、CouchDB、Redis、Neo4j、HBase等NoSQL數(shù)據(jù)庫(kù)中的元數(shù)據(jù),NoSQL數(shù)據(jù)庫(kù)適配器多半利用了自身管理和查詢Schema的能力。(3)數(shù)據(jù)倉(cāng)庫(kù)對(duì)于主流的數(shù)據(jù)倉(cāng)庫(kù),可以基于其內(nèi)在的查詢腳本,定制開發(fā)相應(yīng)的適配器對(duì)其元數(shù)據(jù)進(jìn)行采集。例如MPP數(shù)據(jù)庫(kù)Greenplum,其核心元數(shù)據(jù)都存儲(chǔ)在pg_database、pg_namespace、pg_class、pg_attribute、pg_proc這幾張表中,通過(guò)SQL腳本就可以對(duì)其元數(shù)據(jù)進(jìn)行采集。Hive表結(jié)構(gòu)信息存儲(chǔ)在外部數(shù)據(jù)庫(kù)中,同時(shí)Hive提供類似show table、describe table之類的語(yǔ)法對(duì)其元數(shù)據(jù)信息進(jìn)行查詢。當(dāng)然,也可以利用專業(yè)的元數(shù)據(jù)采集工具來(lái)采集數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的元數(shù)據(jù)。(4)云中的元數(shù)據(jù)隨著公有云的日趨成熟,通過(guò)提供安全的云連接,將云端企業(yè)元數(shù)據(jù)管理用作核心IT基礎(chǔ)架構(gòu)的擴(kuò)展,尤其是在中小企業(yè)之間,已經(jīng)成為現(xiàn)實(shí)。云端企業(yè)元數(shù)據(jù)管理通過(guò)各種上下文改善信息訪問,并將實(shí)時(shí)元數(shù)據(jù)管理、機(jī)器學(xué)習(xí)模型、元數(shù)據(jù)API推進(jìn)流數(shù)據(jù)管道,可以更好地管理企業(yè)數(shù)據(jù)資產(chǎn)。(5)其他元數(shù)據(jù)適配器
  • 建模工具:PowerDesigner、ERwin、ER/Studio、EA等建模工具適配器。

  • ETL工具:PowerCenter、DataStage、Kettle等ETL工具適配器。

  • BI工具:Cognos、Power BI等前端工具中的二維報(bào)表元數(shù)據(jù)采集適配器。

  • Excel適配器:采集Excel格式文件的元數(shù)據(jù)。

當(dāng)然,目前市場(chǎng)上的主流元數(shù)據(jù)產(chǎn)品中還沒有哪一個(gè)能做到“萬(wàn)能適配”,在實(shí)際應(yīng)用過(guò)程中都需要進(jìn)行或多或少的定制化開發(fā)。

2、元數(shù)據(jù)管理

從技術(shù)的角度看,元數(shù)據(jù)管理一般包括元模型管理、元數(shù)據(jù)審核、元數(shù)據(jù)維護(hù)、元數(shù)據(jù)版本管理、元數(shù)據(jù)變更管理等功能。(1)元模型管理元模型管理即基于元數(shù)據(jù)平臺(tái)構(gòu)建符合CWM規(guī)范的元數(shù)據(jù)倉(cāng)庫(kù),實(shí)現(xiàn)元模型統(tǒng)一、集中化管理,提供元模型的查詢、增加、修改、刪除、元數(shù)據(jù)關(guān)系管理、權(quán)限設(shè)置等功能,支持概念模型、邏輯模型、物理模型的采集和管理,讓用戶直觀地了解已有元模型的分類、統(tǒng)計(jì)、使用情況、變更追溯,以及每個(gè)元模型的生命周期管理。同時(shí),支持應(yīng)用開發(fā)的模型管理。支持元模型的全生命周期管理。元模型生命周期中有三個(gè)狀態(tài),分別是:設(shè)計(jì)態(tài)、測(cè)試態(tài)和生產(chǎn)態(tài)。
  • 設(shè)計(jì)態(tài)的元數(shù)據(jù)模型,通常由ERWin、PowerDesigner的等設(shè)計(jì)工具產(chǎn)生。

  • 測(cè)試態(tài)的元數(shù)據(jù)模型,通常是關(guān)系型數(shù)據(jù),如Oracle、DB2、MySQL、Teradata等;或非關(guān)系型數(shù)據(jù)庫(kù),如MongoDB、HBase、Hive、Hadoop等。

  • 生產(chǎn)態(tài)的元數(shù)據(jù)模型,本質(zhì)上與測(cè)試態(tài)元數(shù)據(jù)差異不大。

通過(guò)元數(shù)據(jù)平臺(tái)對(duì)應(yīng)用開發(fā)三種狀態(tài)的統(tǒng)一管理和對(duì)比分析,能夠有效降低元數(shù)據(jù)變更帶來(lái)的風(fēng)險(xiǎn),為下游ODS、DW的數(shù)據(jù)應(yīng)用提供支撐。(2)元數(shù)據(jù)審核元數(shù)據(jù)審核主要是審核采集到元數(shù)據(jù)倉(cāng)庫(kù)但還未正式發(fā)布到數(shù)據(jù)資源目錄中的元數(shù)據(jù)。審核過(guò)程中支持對(duì)數(shù)據(jù)進(jìn)行有效性驗(yàn)證并修復(fù)一些問題,例如缺乏語(yǔ)義描述、缺少字段、類型錯(cuò)誤、編碼缺失或不可識(shí)別的字符編碼等。(3)元數(shù)據(jù)維護(hù)元數(shù)據(jù)維護(hù)就是對(duì)信息對(duì)象的基本信息、屬性、被依賴關(guān)系、依賴關(guān)系、組合關(guān)系等元數(shù)據(jù)的新增、修改、刪除、查詢、發(fā)布等操作,支持根據(jù)元數(shù)據(jù)字典創(chuàng)建數(shù)據(jù)目錄,打印目錄結(jié)構(gòu),根據(jù)目錄發(fā)現(xiàn)、查找元數(shù)據(jù),查看元數(shù)據(jù)的內(nèi)容。元數(shù)據(jù)維護(hù)是最基本的元數(shù)據(jù)管理功能之一,技術(shù)人員和業(yè)務(wù)人員都會(huì)使用這個(gè)功能查看元數(shù)據(jù)的基本信息。(4)元數(shù)據(jù)版本管理在元數(shù)據(jù)處于一個(gè)相對(duì)完整、穩(wěn)定的時(shí)期,或者處于一個(gè)里程碑結(jié)束時(shí)期,可以對(duì)元數(shù)據(jù)定版以發(fā)布一個(gè)基線版本,以便日后對(duì)存異的或錯(cuò)誤的元數(shù)據(jù)進(jìn)行追溯、檢查和恢復(fù)。(5)元數(shù)據(jù)變更管理用戶可以自行訂閱元數(shù)據(jù),當(dāng)訂閱的元數(shù)據(jù)發(fā)生變更時(shí),系統(tǒng)將自動(dòng)通知用戶,用戶可根據(jù)指引進(jìn)一步在系統(tǒng)中查詢到變更的具體內(nèi)容及相關(guān)的影響分析。元數(shù)據(jù)管理平臺(tái)提供元數(shù)據(jù)監(jiān)控功能,一旦監(jiān)控到元數(shù)據(jù)發(fā)生變更,就在第一時(shí)間通知用戶。

3、元數(shù)據(jù)應(yīng)用

(1)數(shù)據(jù)資產(chǎn)地圖按數(shù)據(jù)域?qū)ζ髽I(yè)數(shù)據(jù)資源進(jìn)行全面盤點(diǎn)和分類,并根據(jù)元數(shù)據(jù)字典自動(dòng)生成企業(yè)數(shù)據(jù)資產(chǎn)的全景地圖。該地圖可以告訴你有哪些數(shù)據(jù),在哪里可以找到這些數(shù)據(jù),能用這些數(shù)據(jù)干什么。數(shù)據(jù)資產(chǎn)地圖支持以拓?fù)鋱D的形式可視化展示各類元數(shù)據(jù)和數(shù)據(jù)處理過(guò)程,通過(guò)不同層次的圖形展現(xiàn)粒度控制,滿足業(yè)務(wù)上不同應(yīng)用場(chǎng)景的圖形查詢和輔助分析需要:60d124e8-cba7-11ec-bce3-dac502259ad0.png圖:數(shù)據(jù)資產(chǎn)地圖示例(2)元數(shù)據(jù)血緣分析元數(shù)據(jù)血緣分析會(huì)告訴你數(shù)據(jù)來(lái)自哪里,經(jīng)過(guò)了哪些加工。其價(jià)值在于當(dāng)發(fā)現(xiàn)數(shù)據(jù)問題時(shí)可以通過(guò)數(shù)據(jù)的血緣關(guān)系追根溯源,快速定位到問題數(shù)據(jù)的來(lái)源和加工過(guò)程,減少數(shù)據(jù)問題排查分析的時(shí)間和難度。

60ee3808-cba7-11ec-bce3-dac502259ad0.jpg

圖:元數(shù)據(jù)血緣分析示例(3)元數(shù)據(jù)影響分析元數(shù)據(jù)影響分析會(huì)告訴你數(shù)據(jù)去了哪里,經(jīng)過(guò)了哪些加工。其價(jià)值在于當(dāng)發(fā)現(xiàn)數(shù)據(jù)問題時(shí)可以通過(guò)數(shù)據(jù)的關(guān)聯(lián)關(guān)系向下追蹤,快速找到有哪些應(yīng)用或數(shù)據(jù)庫(kù)使用了這個(gè)數(shù)據(jù),從而最大限度地減小數(shù)據(jù)問題帶來(lái)的影響。這個(gè)功能常用于數(shù)據(jù)源的元數(shù)據(jù)變更對(duì)下游ETL、ODS、DW等應(yīng)用的影響分析。血緣分析是向上追溯,影響分析是向下追蹤,這是這兩個(gè)功能的區(qū)別。(4)元數(shù)據(jù)冷熱度分析元數(shù)據(jù)冷熱度分析會(huì)告訴你哪些數(shù)據(jù)是企業(yè)常用數(shù)據(jù),哪些數(shù)據(jù)屬于僵死數(shù)據(jù)。其價(jià)值在于讓數(shù)據(jù)活躍程度可視化,讓企業(yè)中的業(yè)務(wù)人員、管理人員都能夠清晰地看到數(shù)據(jù)的活躍程度,以便他們更好地駕馭數(shù)據(jù),處置或激活僵死數(shù)據(jù),從而為數(shù)據(jù)的自助式分析提供支撐。(5)元數(shù)據(jù)關(guān)聯(lián)度分析元數(shù)據(jù)關(guān)聯(lián)度分析會(huì)告訴你數(shù)據(jù)與其他數(shù)據(jù)的關(guān)系,以及它們的關(guān)系是怎樣建立的。關(guān)聯(lián)度分析是從某一實(shí)體關(guān)聯(lián)的其他實(shí)體及其參與的處理過(guò)程兩個(gè)角度來(lái)查看具體數(shù)據(jù)的使用情況,形成一張實(shí)體和所參與處理過(guò)程的網(wǎng)絡(luò),如表與ETL程序、表與分析應(yīng)用、表與其他表的關(guān)聯(lián)情況等,從而進(jìn)一步了解該實(shí)體的重要程度。

4、元數(shù)據(jù)接口

建立元數(shù)據(jù)查詢、訪問的統(tǒng)一接口規(guī)范,以將企業(yè)核心元數(shù)據(jù)完整、準(zhǔn)確地提取到元數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行集中管理和統(tǒng)一共享。元數(shù)據(jù)接口規(guī)范主要包括接口的編碼方式、接口響應(yīng)、接口協(xié)議、接口安全、連接方式、技術(shù)實(shí)現(xiàn)、調(diào)用方式、報(bào)文格式等方面的內(nèi)容。
  • 接口編碼方式:接口編碼方式必須在接口的頭信息中注明,常用的接口編碼方式有UTF-8、GBK、GB2312、ISO-8859-1。

  • 接口響應(yīng)格式:元數(shù)據(jù)接口常用的報(bào)文格式,XML或JSON

  • 接口協(xié)議:REST/SOAP協(xié)議

  • 連接方式:POST

  • 接口安全:Token身份認(rèn)證

  • 接口地址:http://url/service?[query]

寫在最后的話

數(shù)據(jù)已經(jīng)成為增強(qiáng)企業(yè)競(jìng)爭(zhēng)力的核心要素,有效地管理和使用數(shù)據(jù)成為企業(yè)的剛需。越來(lái)越多的企業(yè)使用元數(shù)據(jù)管理工具來(lái)管理云計(jì)算、物聯(lián)網(wǎng)、數(shù)據(jù)湖中所產(chǎn)生的數(shù)據(jù),以便更容易地理解、更快地查找和更有效地管理企業(yè)數(shù)據(jù),以實(shí)現(xiàn)數(shù)據(jù)的價(jià)值。
審核編輯 :李倩
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)字化
    +關(guān)注

    關(guān)注

    8

    文章

    8855

    瀏覽量

    62168
  • 元數(shù)據(jù)
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    9160

原文標(biāo)題:一文讀懂元數(shù)據(jù)管理!

文章出處:【微信號(hào):IndustryIOT,微信公眾號(hào):工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    SOLIDWORKS 2025更有效的協(xié)作和數(shù)據(jù)管理

    在當(dāng)今快速變化的商業(yè)環(huán)境中,企業(yè)成功的關(guān)鍵在于有效的協(xié)作和數(shù)據(jù)管理。作為CAD領(lǐng)域的領(lǐng)軍者,SOLIDWORKS始終致力于為用戶提供優(yōu)越的三維設(shè)計(jì)與工程解決方案。隨著SOLIDWORKS 2025的發(fā)布,這款旗艦軟件在協(xié)作和數(shù)據(jù)管理方面實(shí)現(xiàn)了重大突破,為用戶帶來(lái)了更加有效
    的頭像 發(fā)表于 01-09 17:04 ?163次閱讀
    SOLIDWORKS 2025更有效的協(xié)作和<b class='flag-5'>數(shù)據(jù)管理</b>

    高效數(shù)據(jù)管理工具:PP-B2811多硬盤母源備份應(yīng)用

    PP-B2811多硬盤母源備份技術(shù),為醫(yī)療、金融和教育行業(yè)提供集中化數(shù)據(jù)管理解決方案。支持多種存儲(chǔ)設(shè)備,實(shí)現(xiàn)快速備份和數(shù)據(jù)安全。提升檢索效率,節(jié)省存儲(chǔ)空間,確保信息安全。
    的頭像 發(fā)表于 12-11 11:55 ?178次閱讀
    高效<b class='flag-5'>數(shù)據(jù)管理</b>工具:PP-B2811多硬盤母源備份應(yīng)用

    SOLIDWORKS 2025協(xié)作與數(shù)據(jù)管理功能簡(jiǎn)介

    在快速迭代的制造業(yè)環(huán)境中,設(shè)計(jì)團(tuán)隊(duì)面臨的挑戰(zhàn)日益復(fù)雜,從設(shè)計(jì)創(chuàng)新到生產(chǎn)實(shí)施,每一個(gè)環(huán)節(jié)都需要有效協(xié)作與準(zhǔn)確數(shù)據(jù)管理。SOLIDWORKS 2025作為CAD軟件領(lǐng)域的佼佼者,憑借其增強(qiáng)的協(xié)作與數(shù)據(jù)管理功能,正帶領(lǐng)著設(shè)計(jì)創(chuàng)新的新時(shí)代
    的頭像 發(fā)表于 12-02 15:24 ?195次閱讀

    PDM產(chǎn)品數(shù)據(jù)管理系統(tǒng)的必要性分析 PDM如何助力企業(yè)提升競(jìng)爭(zhēng)力

    在當(dāng)今競(jìng)爭(zhēng)激烈的制造業(yè)環(huán)境中,企業(yè)對(duì)高效、準(zhǔn)確的產(chǎn)品數(shù)據(jù)管理需求日益增長(zhǎng)。PDM(Product Data Management,產(chǎn)品數(shù)據(jù)管理系統(tǒng))正是應(yīng)對(duì)這一需求的利器。本文將深入探討PDM產(chǎn)品數(shù)據(jù)管理系統(tǒng)建設(shè)的必要性,以及它
    的頭像 發(fā)表于 11-27 11:56 ?330次閱讀

    一文讀懂什么是PDM產(chǎn)品數(shù)據(jù)管理系統(tǒng)軟件?

    在當(dāng)今高度競(jìng)爭(zhēng)且快速變化的市場(chǎng)環(huán)境中,制造企業(yè)面臨著前所未有的挑戰(zhàn)。為了保持競(jìng)爭(zhēng)力,企業(yè)需要高效、準(zhǔn)確地管理產(chǎn)品生命周期內(nèi)的所有數(shù)據(jù)。而產(chǎn)品數(shù)據(jù)管理系統(tǒng)(Product Data
    的頭像 發(fā)表于 11-20 14:31 ?382次閱讀
    一文讀懂什么是PDM產(chǎn)品<b class='flag-5'>數(shù)據(jù)管理</b>系統(tǒng)軟件?

    技術(shù)資訊 I 設(shè)計(jì)數(shù)據(jù)管理要點(diǎn)

    本文要點(diǎn)什么是設(shè)計(jì)數(shù)據(jù)管理?為什么說(shuō)管理設(shè)計(jì)數(shù)據(jù)非常重要?有效的設(shè)計(jì)數(shù)據(jù)管理要注意哪些事項(xiàng)?PCBA開發(fā)和/或生產(chǎn)的各個(gè)方面都取決于設(shè)計(jì)數(shù)據(jù)
    的頭像 發(fā)表于 11-09 01:05 ?274次閱讀
    技術(shù)資訊 I 設(shè)計(jì)<b class='flag-5'>數(shù)據(jù)管理</b>要點(diǎn)

    實(shí)驗(yàn)室數(shù)據(jù)管理與LIMS平臺(tái)的關(guān)系

    實(shí)驗(yàn)室數(shù)據(jù)管理(Laboratory Data Management)是指對(duì)實(shí)驗(yàn)室產(chǎn)生的數(shù)據(jù)進(jìn)行收集、存儲(chǔ)、處理、分析和報(bào)告的過(guò)程。這包括了樣品的接收、測(cè)試結(jié)果的記錄、質(zhì)量控制數(shù)據(jù)的跟蹤以及最終報(bào)告
    的頭像 發(fā)表于 10-28 18:10 ?545次閱讀

    SOLIDWORKS 2025數(shù)據(jù)管理新增功能

    隨著SOLIDWORKS 2025的發(fā)布,這款旗艦軟件在數(shù)據(jù)管理領(lǐng)域?qū)崿F(xiàn)了重大突破,為用戶帶來(lái)了更有效、更智能的設(shè)計(jì)體驗(yàn)。
    的頭像 發(fā)表于 10-16 15:03 ?295次閱讀

    SOLIDWORKS 2025:更有效的協(xié)作和數(shù)據(jù)管理

    在當(dāng)今快速變化的商業(yè)環(huán)境中,有效的協(xié)作和數(shù)據(jù)管理已成為企業(yè)成功的關(guān)鍵。作為CAD領(lǐng)域的領(lǐng)軍者,SOLIDWORKS始終致力于為用戶提供優(yōu)越的三維設(shè)計(jì)與工程解決方案。隨著SOLIDWORKS?2025的發(fā)布,這款旗艦軟件在協(xié)作和數(shù)據(jù)管理方面實(shí)現(xiàn)了重大突破,為用戶帶來(lái)了良好體
    的頭像 發(fā)表于 10-08 16:52 ?332次閱讀

    服務(wù)體驗(yàn)-服務(wù)管理與分享

    服務(wù)管理 通過(guò)桌面、負(fù)一屏、應(yīng)用市場(chǎng)、服務(wù)等場(chǎng)景對(duì)服務(wù)進(jìn)行添加、收藏、移除等管理操作。 服務(wù)分享 服務(wù)與服務(wù)卡片支持近場(chǎng)與遠(yuǎn)場(chǎng)分享
    發(fā)表于 07-16 15:43

    數(shù)據(jù)無(wú)界,管理有道:圖為技術(shù)T-Plant OS的數(shù)據(jù)管理之道

    在工廠全生命周期的管理中,數(shù)據(jù)作為貫穿始終的核心資產(chǎn),高效且精準(zhǔn)的數(shù)據(jù)管理,不僅能優(yōu)化工廠運(yùn)營(yíng)流程、提升生產(chǎn)效率,還能激發(fā)企業(yè)內(nèi)在創(chuàng)新潛能、強(qiáng)化市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì)。雖然隨著計(jì)算機(jī)性能和大容量存儲(chǔ)設(shè)備的出現(xiàn),
    的頭像 發(fā)表于 07-16 14:54 ?305次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>無(wú)界,<b class='flag-5'>管理</b>有道:圖為技術(shù)T-Plant OS的<b class='flag-5'>數(shù)據(jù)管理</b>之道

    工業(yè)設(shè)備數(shù)據(jù)管理的關(guān)鍵要素

    在這個(gè)信息爆炸的時(shí)代,設(shè)備數(shù)據(jù)管理已成為企業(yè)運(yùn)營(yíng)的核心環(huán)節(jié)之一。它不僅是信息技術(shù)的基石,更是企業(yè)發(fā)展的重要保障。設(shè)備數(shù)據(jù)管理是指通過(guò)一系列技術(shù)手段和管理措施,對(duì)各類設(shè)備產(chǎn)生的海量數(shù)據(jù)進(jìn)
    的頭像 發(fā)表于 07-15 15:41 ?313次閱讀
    工業(yè)設(shè)備<b class='flag-5'>數(shù)據(jù)管理</b>的關(guān)鍵要素

    鴻蒙開發(fā)接口數(shù)據(jù)管理:【@ohos.data.distributedData (分布式數(shù)據(jù)管理)】

    分布式數(shù)據(jù)管理為應(yīng)用程序提供不同設(shè)備間數(shù)據(jù)庫(kù)的分布式協(xié)同能力。通過(guò)調(diào)用分布式數(shù)據(jù)各個(gè)接口,應(yīng)用程序可將數(shù)據(jù)保存到分布式數(shù)據(jù)庫(kù)中,并可對(duì)分布式
    的頭像 發(fā)表于 06-07 09:30 ?1072次閱讀
    鴻蒙開發(fā)接口<b class='flag-5'>數(shù)據(jù)管理</b>:【@ohos.data.distributedData (分布式<b class='flag-5'>數(shù)據(jù)管理</b>)】

    食品檢測(cè)LIMS如何實(shí)現(xiàn)數(shù)據(jù)管理

    LIMS系統(tǒng)通過(guò)數(shù)據(jù)采集、處理與分析、存儲(chǔ)與管理、安全與保密、共享與協(xié)作、質(zhì)量控制以及報(bào)告生成等多個(gè)方面的功能實(shí)現(xiàn)數(shù)據(jù)管理,為食品檢測(cè)實(shí)驗(yàn)室提供全面、高效、準(zhǔn)確的數(shù)據(jù)支持。
    的頭像 發(fā)表于 05-29 13:47 ?614次閱讀

    HarmonyOS開發(fā)實(shí)例:【分布式數(shù)據(jù)管理

    eTS中分布式數(shù)據(jù)管理的使用,包括KVManager對(duì)象實(shí)例的創(chuàng)建和KVStore數(shù)據(jù)流轉(zhuǎn)的使用。
    的頭像 發(fā)表于 04-11 09:57 ?982次閱讀
    HarmonyOS開發(fā)實(shí)例:【分布式<b class='flag-5'>數(shù)據(jù)管理</b>】
    百家乐娱乐城新闻| 黄金城百家乐官网手机版| 盐山县| 大发888资讯网net| 百家乐技巧真人荷官网| 百家乐取胜秘笈| 永利百家乐官网娱乐平台| 泌阳县| 六合彩马报| 百家乐闲和庄| 百家乐必胜下注法| 百家乐官网五湖四海娱乐| 百家乐官网大眼仔路| 瑞博娱乐| 德州扑克游戏| 大发888客户端的软件| 百家乐发牌| 基础百家乐规则| 昆明百家乐装修装潢有限公司| 百家乐官网统计工具| 真人百家乐官网蓝盾娱乐场| 百家乐官网长龙怎么预判| 明陞M88| 澳门顶级赌场娱乐平台| 郑州市太阳城宾馆| 澳门百家乐官方网站破解百家乐技巧 | 赌球网址| 百家乐第三张规则| 代理百家乐试玩| 真钱百家乐大转轮| 澳门百家乐破解方法| 百家乐怎么看单| 墓地附近做生意风水| 澳门百家乐官网论坛及玩法 | 百家乐官网怎么玩能赢钱| 百家乐官网怎么投注| 现金百家乐| 注册娱乐城送体验金| 玩德州扑克技巧| bet365国际娱乐| 博彩选名门国际|