基于Hadoop的產(chǎn)品大數(shù)據(jù)分布式存儲優(yōu)化

摘要：

摘要: 研究產(chǎn)品相關(guān)大數(shù)據(jù)資源組織存儲與檢索查詢技術(shù)，提出在Hadoop平臺基礎(chǔ)上對產(chǎn)品大數(shù)據(jù)資源進行分塊存儲?；贛apReduce并行架構(gòu)模型，提出多副本一致性Hash數(shù)據(jù)存儲算法，算法充分考慮了數(shù)據(jù)的相關(guān)性和時空屬性，并優(yōu)化了Hadoop平臺的數(shù)據(jù)劃分策略和數(shù)據(jù)塊規(guī)格調(diào)整。通過對數(shù)據(jù)的優(yōu)化存儲布局，采用多源并行連接檢索方法和多通道數(shù)據(jù)融合特征提取技術(shù)實現(xiàn)產(chǎn)品大數(shù)據(jù)信息檢索，提高了數(shù)據(jù)資源管理效率。實驗表明和標準Hadoop方案比較，多源并行連接數(shù)據(jù)檢索的執(zhí)行時間為其31.9%。

1. 引言

計算機的發(fā)展和網(wǎng)絡(luò)通信技術(shù)日趨成熟，數(shù)據(jù)規(guī)模的增長在給人們帶來便利生活的同時也讓從大量數(shù)據(jù)中汲取有用信息變得困難，如何從中檢索到有用數(shù)據(jù)是目前需要面對的重要問題 [1] [2] [3]。其中有產(chǎn)品相關(guān)的數(shù)據(jù)資源包含生產(chǎn)車間監(jiān)測視頻圖像及產(chǎn)品相關(guān)數(shù)據(jù)及文檔、物料跟蹤數(shù)據(jù)、加工數(shù)據(jù)、生產(chǎn)流通數(shù)據(jù)等，其存在著數(shù)據(jù)資源規(guī)模大，種類多，來源不同且分散分布的特點 [4] [5] [6]。傳統(tǒng)的分布式數(shù)據(jù)庫受數(shù)據(jù)庫存儲能力限制，存在著架構(gòu)存儲能力有限，對數(shù)據(jù)的管理與發(fā)布支持相對較弱，管理效率低的問題 [7] [8] [9]。

目前，針對傳統(tǒng)分布式數(shù)據(jù)庫存在的問題，龐書杰 [10] 提出了一種基于Hash的關(guān)聯(lián)規(guī)則并行優(yōu)化算法(HP-AR)，通過對數(shù)據(jù)庫統(tǒng)計頻繁項集部分的并行處理結(jié)合輔助Hash表簡化挖掘過程滿足了面對大規(guī)模數(shù)據(jù)集時挖掘隱藏關(guān)聯(lián)規(guī)則的需求。潘俊輝等學者 [11] 針對基本算法Apriori的改進，提出了一種基于壓縮矩陣的優(yōu)化算法，該算法使用MapReduce計算模型對數(shù)據(jù)庫進行分塊，之后對數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則的挖掘結(jié)果進行合并，得出頻繁項集。Aisha Siddiqa等學者 [12] 為了評估不同存儲架構(gòu)的性能，使用Brewer的CAP定理比較和分析了現(xiàn)有方法，提出了一種定義明確的大數(shù)據(jù)存儲技術(shù)分類法。

本文針對目前存在的數(shù)據(jù)管理效率低、檢索速度慢等問題基于Hadoop平臺，結(jié)合分布式、分層結(jié)構(gòu)的存儲優(yōu)化和并行處理等技術(shù)，提出了一種多副本一致性Hash數(shù)據(jù)存儲算法，將數(shù)據(jù)集中的數(shù)據(jù)按照相關(guān)性以及時空屬性進行分塊處理，提高了數(shù)據(jù)處理的效率。同時在Hadoop MapReduce并行框架的基礎(chǔ)上，設(shè)計了一種多源并行連接數(shù)據(jù)檢索算法，實驗結(jié)果表明，同傳統(tǒng)Hadoop方案相比，多源并行連接數(shù)據(jù)檢索算法的運行速度明顯加快。

2. 產(chǎn)品大數(shù)據(jù)存儲優(yōu)化研究

2.1. 數(shù)據(jù)存儲及數(shù)據(jù)分布策略

基于數(shù)據(jù)相關(guān)性的多副本一致性Hash數(shù)據(jù)存儲算法(Multi-copy Consistency Hash Algorithm Based on Data Correlation, CMCHA)，進行Hadoop的數(shù)據(jù)布局優(yōu)化，優(yōu)化技術(shù)路線：盡可能集中存儲相關(guān)聯(lián)的數(shù)據(jù)，數(shù)據(jù)檢索和分析時在映射階段完成主要工作，使由映射端到約減端數(shù)據(jù)通信負載消耗降低，系統(tǒng)整體數(shù)據(jù)檢索和分析性能得到提高。每種跟蹤過程數(shù)據(jù)的類型和格式不同，可將數(shù)據(jù)的具體采集位置和時間作為數(shù)據(jù)檢索和分析時的關(guān)鍵字。

通常Hadoop平臺將數(shù)據(jù)存儲為3個副本，一份在本地，一份在同機架內(nèi)不同節(jié)點上，一份在不同機架的某一節(jié)點上。為減少整體數(shù)據(jù)傳輸帶寬消耗和數(shù)據(jù)讀取時間延時，HDFS讓讀取應(yīng)用程序讀取距離它最近的副本數(shù)據(jù)。

存儲算法考慮如下3方面的相關(guān)性：數(shù)據(jù)采集地點相關(guān)性、數(shù)據(jù)采集時間相關(guān)性和自定義數(shù)據(jù)相關(guān)性。利用一致性Hash算法，按照采集地點編號對數(shù)據(jù)副本1進行Hash映射;按照采集時間戳對數(shù)據(jù)副本2進行Hash映射;相關(guān)系數(shù)作為跟蹤過程數(shù)據(jù)的一個重要屬性，按照自定義相關(guān)系數(shù)對數(shù)據(jù)副本3進行Hash映射，實現(xiàn)不同的數(shù)據(jù)查詢和數(shù)據(jù)分析需求。根據(jù)應(yīng)用系統(tǒng)需要自定義數(shù)據(jù)相關(guān)性，給相關(guān)系數(shù)賦值，算法設(shè)計過程中構(gòu)建配置流程如圖1所示的Hash環(huán)。

Figure 1. CMCHA flow

圖1. CMCHA算法流程

步驟1：通過配置文件預定義跟蹤過程數(shù)據(jù)的相關(guān)系數(shù)以及冗余的副本數(shù)量，定義冗余副本數(shù)量為3;

步驟2：計算集群中每個數(shù)據(jù)節(jié)點的Hash值，配置到0~232的Hash環(huán)區(qū)間上;

步驟3：基于跟蹤過程數(shù)據(jù)的時間及空間屬性和相關(guān)系數(shù)計算數(shù)據(jù)的Hash值。根據(jù)數(shù)據(jù)來源位置ID，在云平臺下對第1份副本數(shù)據(jù)①，計算Hash值1，映射到Hash環(huán)上;對第2份數(shù)據(jù)②，根據(jù)跟蹤過程數(shù)據(jù)的采集時間戳，計算Hash值2，并映射到Hash環(huán)上。對第3份數(shù)據(jù)③，根據(jù)數(shù)據(jù)的相關(guān)系數(shù)計算其Hash值3，并映射到Hash環(huán)上。可配置大于3的副本數(shù)量，交替按照這3種方式計算其Hash值i，并依次映射到Hash環(huán)上，滿足更高的數(shù)據(jù)存儲可靠性;

步驟4：確定數(shù)據(jù)的存儲位置，根據(jù)數(shù)據(jù)Hash值和數(shù)據(jù)節(jié)點Hash值在CMCHA算法配置流程圖中按順時針方向?qū)?shù)據(jù)映射到距離其最近的節(jié)點(如將數(shù)據(jù)①映射到節(jié)點A上);

步驟5：如果節(jié)點空間不足或在映射過程出現(xiàn)異常，則跳過該節(jié)點尋找下一個存放節(jié)點。

2.2. 數(shù)據(jù)存儲優(yōu)化研究

按照所屬大文件，所有分塊數(shù)據(jù)存儲為一個文件，分塊數(shù)據(jù)基于Hadoop分布式存儲調(diào)度策略，被分散存放在不同的分布式存儲節(jié)點上，每個分塊數(shù)據(jù)設(shè)置相應(yīng)的存儲副本率，為便于數(shù)據(jù)檢索該存儲策略另外定義和維護分塊數(shù)據(jù)的索引鍵名。

每個大文件包含的每個分塊數(shù)據(jù)通過< key, value >記錄形式存儲到HDFS中，記為< Blk-ID, Data >，數(shù)據(jù)類型為< int, byte[] >，Blk-ID表示數(shù)據(jù)分塊順序號，Data表示數(shù)據(jù)分塊的二進制數(shù)據(jù)，通過給定的Blk-ID可得到對應(yīng)數(shù)據(jù)分塊的二進制字節(jié)數(shù)據(jù)。大文件數(shù)據(jù)分塊存儲方法如圖2。

HDFS的設(shè)計目標是存儲大文件，其數(shù)據(jù)塊規(guī)格默認為64 MB，遠大于512B的物理磁盤的塊大小。HDFS文件訪問時間主要包括系統(tǒng)尋址時間和數(shù)據(jù)傳輸時間，文件傳輸效率 ηeffectηeffect 計算公式如下：

Figure 2. Block storage process of large file

圖2. 大文件分塊存儲流程

其中， tttt 表示數(shù)據(jù)傳輸時間， tt=Sblockvtt=Sblockv; tsts 表示系統(tǒng)尋址時間; SblockSblock 表示數(shù)據(jù)塊規(guī)格; vv 表示數(shù)據(jù)傳輸速度。

從(1)可看出 ηeffectηeffect 小于1。通常在數(shù)據(jù)分布和索引方法確定情況下， tsts 和 vv 是確定的值，要提高 ηeffectηeffect 應(yīng)增加 SblockSblock。在HDFS中，通過dfs.block.size參數(shù)設(shè)置數(shù)據(jù)塊 SblockSblock 的規(guī)格。如果規(guī)格設(shè)置過大會降低系統(tǒng)負載均衡性，在調(diào)整數(shù)據(jù)塊的規(guī)格時應(yīng)綜合考慮進入系統(tǒng)的數(shù)據(jù)規(guī)模、數(shù)據(jù)傳輸率和負載均衡性。

3. 數(shù)據(jù)多源并行連接檢索

產(chǎn)品數(shù)據(jù)跟蹤管理系統(tǒng)對在線監(jiān)測的多個監(jiān)測點以及相關(guān)參數(shù)進行綜合檢索，查詢條件是監(jiān)測位置ID、采樣時間或位置和時間聯(lián)合條件等。檢索內(nèi)容包括位置信息(數(shù)據(jù)采集點設(shè)備名稱、設(shè)備運行時間、采集位置等)、環(huán)境信息(生產(chǎn)車間的溫度、濕度、氣壓等)、生產(chǎn)數(shù)據(jù)(捕撈時間、捕撈批次、數(shù)量等)等多源數(shù)據(jù)，需要將不同來源的數(shù)據(jù)進行數(shù)據(jù)連接。如在產(chǎn)品加工過程質(zhì)量控制參數(shù)的綜合檢索過程中需要連接3個數(shù)據(jù)文件：1) 加工過程數(shù)據(jù)文件(表1)，其中采樣批次即為產(chǎn)品批次碼;2) 質(zhì)量控制參數(shù)檢測數(shù)據(jù)文件(表2);3) 檢測環(huán)境文件(表3)，其中檢測位置編碼代表“車間–工段–班組–工位”。按時間進行的綜合查詢生成在2020年3月14日9:00~9:20的綜合檢測結(jié)果數(shù)據(jù)，形成質(zhì)量檢測數(shù)據(jù)列表，包括位置信息和環(huán)境信息。此過程需要將3個數(shù)據(jù)文件按照查詢條件進行連接，形成滿足綜合查詢要求的查詢結(jié)果數(shù)據(jù)列表，如表4。

位置ID	采集時間	采樣批次
DL082	2020-03-14 9:08	202003140103100
DL083	2020-03-14 9:18	202003140103300
DL081	2020-03-14 9:10	202003140103200

Table 1. Processing data file

表1. 加工過程數(shù)據(jù)文件

位置	采集時間	采樣批次	采樣信息
DL083	2020-03-14 9:10	202003140103200	31.9/7.58/50.2
DL081	2020-03-14 9:00	202003140103300	32.5/7.55/50.5
DL082	2020-03-14 9:08	202003140103100	32.2/7.57/50.4
DL082	2020-03-17 9:00	202003140103100	11.7/10.1/62.2

Table 2. Quality inspection data file

表2. 質(zhì)量參數(shù)檢測數(shù)據(jù)文件

位置ID	檢測位置	采集時間	溫度℃	濕度
DL081	ZZ01-I-02-B	2017-03-14 8:00	39	65
DL082	ZZ01-I-02-A1	2017-03-14 8:10	38	63
DL083	ZZ02-II-01-A1	2017-03-14 8:11	38	59

Table 3. Detection position data file

表3. 檢測環(huán)境數(shù)據(jù)文件

位置ID	檢測位置	采集時間	溫度/℃	濕度	采樣批次	采樣信息
DL081	ZZ01-A-026-B	2017-03-14 9:00	39	65	201703140103300	32.5/7.55/50.5
DL082	ZZ01-A-026-A1	2017-03-14 9:08	38	63	201703140103100	32.2/7.57/50.4
DL083	ZZ02-B-017-A1	2017-03-14 9:10	38	59	201703140103200	31.9/7.58/50.2

Table 4. Results of date join

表4. 數(shù)據(jù)連接結(jié)果

按照數(shù)據(jù)檢索需求和數(shù)據(jù)格式描述，設(shè)計并行過濾連接檢索算法，算法在映射端執(zhí)行，設(shè)計的主要依據(jù)是為節(jié)省網(wǎng)絡(luò)流量傳輸，提高檢索效率，過濾和連接在映射過程進行，避免要執(zhí)行的檢索操作在約減過程進行。為使數(shù)據(jù)連接時所需數(shù)據(jù)聚集到同一個數(shù)據(jù)節(jié)點，采用基于數(shù)據(jù)相關(guān)性的多副本一致性Hash算法進行數(shù)據(jù)分布。算法流程：1) 根據(jù)檢索條件過濾掉不符合檢索條件的數(shù)據(jù);2) 根據(jù)連接檢索需求，確定數(shù)據(jù)連接的組鍵(group key)：檢測位置ID、時間戳或相關(guān)系數(shù);3) 用數(shù)據(jù)文件名作為標簽，標記各數(shù)據(jù)源的各個記錄;4) 將相同屬性值的記錄根據(jù)連接組鍵劃分到一組，按照檢索條件進行數(shù)據(jù)連接。

數(shù)據(jù)進行優(yōu)化存儲分布之后進入數(shù)據(jù)連接映射階段，此階段在本地節(jié)點進行相應(yīng)任務(wù)操作，結(jié)果傳輸?shù)紿DFS，數(shù)據(jù)的優(yōu)化分布及映射端連接模式流程如圖3所示。

Figure 3. Optimized data distribution and map data join mode

圖3. 數(shù)據(jù)的優(yōu)化分布及映射端數(shù)據(jù)連接模式

4. 算例驗證

4.1. Hadoop平臺建設(shè)

采用10節(jié)點即10臺服務(wù)器建設(shè)Hadoop集群平臺，指定集群中一個節(jié)點為NameNode，指定另一臺不同的節(jié)點為JobTracker，均是主控節(jié)點。余下節(jié)點為客戶端，作為DataNode也作為TaskTracker。操作系統(tǒng)采用Windows;部署：虛擬機軟件Vmvare;Vmvare安裝好一臺Windows虛擬機后，導出或者克隆出另外兩臺虛擬機，連接為橋連，確保虛擬機和主機ip地址在同一個ip段內(nèi)，可以相互通信。設(shè)置數(shù)據(jù)塊規(guī)格為64 MB，對應(yīng)4個CPU內(nèi)核，各計算節(jié)點都分配4個任務(wù)網(wǎng)格，其中3個為映射計算任務(wù)網(wǎng)格，1個為約減計算任務(wù)網(wǎng)格。對集群的整體數(shù)據(jù)傳輸性能進行基準測試。

4.2. 算法性能驗證

為測試數(shù)據(jù)存儲分布優(yōu)化后多源連接檢索查詢算法的性能，將前述針對產(chǎn)品大數(shù)據(jù)連接算法和基于標準Hadoop平臺的連接算法進行分析比對驗證。分析使用實驗室研發(fā)的“產(chǎn)品大數(shù)據(jù)追溯系統(tǒng)”中采集存儲的數(shù)據(jù)集，如表5。

文件名	副本數(shù)	文件大小	占用空間	記錄數(shù)
加工過程	3	627 kB	1881 kB	1910
質(zhì)量檢測	3	370 GB	1110 GB	13.62 M
檢測環(huán)境	3	215 MB	645 MB	4175

Table 5. Real data set for join query

表5. 算法驗證真實數(shù)據(jù)集

1) 多源并行連接檢索運行時間變化趨勢

選擇3種典型連接查詢條件進行基于CMCHA多源并行連接檢索查詢算法的運行測試，記錄每種條件下算法的運行時間。查詢結(jié)構(gòu)化語言SQL語句的描述如表6。

類型	條件	查詢語句
全連接	不設(shè)置	Select位置ID，檢測位置，采集時間，溫度，濕度，采樣批次，采樣信息 From加工過程，質(zhì)量參數(shù)檢測，檢測環(huán)境 Where加工過程，位置ID = 質(zhì)量參數(shù)檢測，位置ID = 檢測環(huán)境，位置ID
位置條件連接	檢測工位	Select位置ID，檢測位置，采集時間，溫度，濕度，采樣批次，采樣信息 From加工過程，質(zhì)量參數(shù)檢測，檢測環(huán)境 Where加工過程，位置ID = 質(zhì)量參數(shù)檢測，位置ID = 檢測環(huán)境，位置ID and位置ID between [ID1, IDn]
時間條件連接	時間	Select位置ID，檢測位置，采集時間，溫度，濕度，采樣批次，采樣信息 From加工過程，質(zhì)量參數(shù)檢測，檢測環(huán)境 Where加工過程，位置ID = 質(zhì)量參數(shù)檢測，位置ID = 檢測環(huán)境，位置ID and采集時間between [T1, Tn]

Table 6. SQL description of join query

表6. 連接查詢實驗類SQL描述

實驗過程中在數(shù)據(jù)集中選取不同規(guī)模的子集，從10萬條記錄遞增至數(shù)據(jù)全集(13.76 M條)，基于CMCHA的多數(shù)據(jù)源并行連接檢索算法運行時間變化趨勢及運行時間與數(shù)據(jù)規(guī)模的關(guān)系如圖4?？梢钥闯?，應(yīng)用了CMCHA數(shù)據(jù)存儲算法優(yōu)化后，數(shù)據(jù)檢索運行時間隨著數(shù)據(jù)規(guī)模的增長而增長平緩。由于對數(shù)據(jù)存儲布局采用CMCHA進行了優(yōu)化，且在映射過程中完成綜合檢索查詢操作，網(wǎng)絡(luò)通信量有效降低，保證了查詢性能的穩(wěn)定性。

Figure 4. Execution time and variation trend of data join

圖4. 多源連接檢索運行時間變化趨勢

2) 數(shù)據(jù)連接檢索運行時間比較

使用基于標準Hadoop平臺的約減端連接檢索處理算法和基于CMCHA的多源并行數(shù)據(jù)連接檢索算法，針對選取的13.76 M條樣本數(shù)據(jù)全集，分別執(zhí)行全連接、以檢測位置為查詢條件和以時間為查詢條件的連接檢索操作，運行時間比較結(jié)果如圖5，后一算法的運行時間分別為前一算法運行時間的32.9%、32.5%和32.1%。CMCHA算法在運行時間上遠小于標準Hadoop算法，而且隨著事務(wù)條數(shù)的增加，雖然CMCHA算法運行時間也在增加，但是兩者的差距也在逐漸變大，當數(shù)據(jù)量逐漸越大時，CMCHA算法的優(yōu)勢也越來越明顯。數(shù)據(jù)存儲優(yōu)化布局后提高了多數(shù)據(jù)源相關(guān)數(shù)據(jù)聚集性，映射任務(wù)中的數(shù)據(jù)連接在本地就能完成，減少了映射端到約減端的數(shù)據(jù)通信，也降低了約減任務(wù)的啟動對性能的影響，所以算法的運行效率明顯提高。

Figure 5. Execution time comparison of data join based on 2 algorithms

圖5. 兩種算法多源連接運行時間比較

5. 結(jié)論

針對產(chǎn)品大數(shù)據(jù)資源，基于Hadoop平臺，采用分布式、分層結(jié)構(gòu)的存儲優(yōu)化和并行處理等技術(shù)，提出了多副本一致性Hash數(shù)據(jù)存儲算法，按照產(chǎn)品主屬性、相關(guān)系數(shù)和時間戳，在數(shù)據(jù)集群中按照規(guī)則聚集具有相關(guān)性的數(shù)據(jù)，提高數(shù)據(jù)處理效率?；谠撍惴ㄔO(shè)計了Hadoop平臺下多源并行連接數(shù)據(jù)檢索算法，測試證明通過數(shù)據(jù)的存儲分布優(yōu)化，算例的運行速度明顯加快，和標準Hadoop方案比較，多源并行連接數(shù)據(jù)檢索的執(zhí)行時間為其31.9%。

審核編輯：湯梓紅

閱讀全文

視頻(71807) 視頻(71807)
存儲(84567) 存儲(84567)
大數(shù)據(jù)(136504) 大數(shù)據(jù)(136504)

大數(shù)據(jù)時代的存儲革命：理解分布式存儲系統(tǒng)

管理的效率極低。因此，分布式存儲系統(tǒng)應(yīng)運而生。 分布式存儲就是將數(shù)據(jù)存儲在眾多的服務(wù)器或網(wǎng)絡(luò)節(jié)點上，而不是集中在單個位置。這種方式的好處包括：方便擴容、數(shù)據(jù)冗余備份提高容錯性、避免單點故障影響整個系統(tǒng)。而分布式計算則是將一個大任

2024-03-07 15:40:21

109

曙光存儲推出ParaStor分布式全閃存儲

曙光存儲推出ParaStor分布式全閃存儲，攜業(yè)內(nèi)首創(chuàng)技術(shù)XDS，以訓練加速、穩(wěn)定性強、性價比高的獨特價值，全維度涵蓋網(wǎng)絡(luò)、計算和平臺，為千行百業(yè)的AI大模型開發(fā)者提供存儲解決方案。

2024-03-01 11:30:19

137

分布式放大器 MMA023AA-放大器-分布式 DC-30 GHz，中等功率

分布式放大器MMA023AA-放大器-分布式DC-30 GHz，中等功率分布式放大器MMA023AA-放大器-分布式DC-30 GHz，中等功率狀態(tài)：生產(chǎn)中。文檔產(chǎn)品特點

2024-02-29 13:23:38

Hadoop是什么?其核心由兩大部分組成,分別是什么?

了分布式存儲和計算的方式，能夠快速有效地處理大量數(shù)據(jù)，并具備良好的擴展性和容錯性。 Hadoop的核心由兩大部分組成，分別是Hadoop分布式文件系統(tǒng)（Hadoop Distributed File

2024-02-05 10:52:01

301

保障數(shù)據(jù)完整性：分布式無紙化交互系統(tǒng)的關(guān)鍵特性

來百度APP暢享高清圖片保障數(shù)據(jù)完整性是分布式無紙化交互系統(tǒng)的關(guān)鍵特性之一。在分布式無紙化交互系統(tǒng)中，數(shù)據(jù)的傳輸、存儲和處理都需要得到保障，以確保數(shù)據(jù)的完整性和準確性。 ? 首先，分布式無紙化交互

2024-01-15 14:28:00

101

分布式節(jié)點服務(wù)器是什么?

部署在不同的服務(wù)器上進行處理和存儲，以實現(xiàn)負載均衡和容錯處理。這種架構(gòu)模式旨在提高系統(tǒng)的可擴展性、可靠性和性能表現(xiàn)，以滿足大規(guī)模數(shù)據(jù)處理、復雜任務(wù)處理等需求。 分布式節(jié)點服務(wù)器的實現(xiàn)方式有多種，其中最常用的

2024-01-12 15:04:02

283

【Vsan數(shù)據(jù)恢復】Vsan分布式存儲虛擬磁盤文件丟失的數(shù)據(jù)恢復案例

一套vsan分布式存儲架構(gòu)有數(shù)臺服務(wù)器節(jié)點，該vsan分布式存儲架構(gòu)配置了固態(tài)硬盤和機械硬盤，固態(tài)硬盤作為緩存盤使用，機械硬盤作為容量盤使用。機房供電異常導致服務(wù)器異常關(guān)機，工作人員重啟服務(wù)器后發(fā)現(xiàn)vsan分布式存儲邏輯架構(gòu)出現(xiàn)故障，虛擬磁盤文件丟失，虛擬機組件異常。

2024-01-03 16:39:02

236

分布式IO工業(yè)自動化數(shù)據(jù)采集與分析的核心

工業(yè)自動化生產(chǎn)的效率。在傳統(tǒng)的工業(yè)自動化生產(chǎn)中，設(shè)備的控制和監(jiān)測通常采用集中式控制方式，這種方式存在著設(shè)備連接復雜、數(shù)據(jù)傳輸速度慢、故障率高和擴展性差等問題。而分布式IO采用分布式控制方式，將設(shè)備按照

2023-12-28 14:47:02

擴展模塊驅(qū)動分布式I/O在新能源鋰電池自動化生產(chǎn)中的發(fā)展

材料進行切邊、折邊、點膠等操作，使其對接部分更加嚴密,不會造成鋰電池內(nèi)部液體的泄露。 分布式I/O模塊可以采集磁性開關(guān)及光電信號并通過輸出模塊控制電磁閥從而控制氣缸動作，來完成電池的雙折邊成型工藝

2023-12-28 11:20:31

分布式鎖的三種實現(xiàn)方式

鎖，下面將分別介紹三種常見的實現(xiàn)方式。一、基于數(shù)據(jù)庫實現(xiàn)的分布式鎖在分布式系統(tǒng)中，數(shù)據(jù)庫是最常用的共享資源之一。因此，可以通過數(shù)據(jù)庫的特性來實現(xiàn)分布式鎖。常見的方式是創(chuàng)建一個專門用于鎖定的數(shù)據(jù)表，并在這個表

2023-12-28 10:01:24

255

一圖讀懂《分布式融合存儲研究報告（2023）》

轉(zhuǎn)自：存儲產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟 2023年11月30日，存儲產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟、中國電子技術(shù)標準化研究院聯(lián)合發(fā)布《分布式融合存儲研究報告（2023）》，詳細闡釋分布式融合存儲概念和技術(shù)要求

2023-12-21 18:05:01

270

鴻蒙原生應(yīng)用開發(fā)——分布式數(shù)據(jù)對象

01、什么是分布式數(shù)據(jù)對象在可信組網(wǎng)環(huán)境下，多個相互組網(wǎng)認證的設(shè)備將各自創(chuàng)建的對象加入同一個 sessionId，使得加入的多個數(shù)據(jù)對象之間可以同步數(shù)據(jù)，也就是說，當某一數(shù)據(jù)對象屬性發(fā)生

2023-12-08 10:01:21

分布式系統(tǒng)硬件資源池原理和接入實踐

的使用習慣；手機導航接續(xù)到車機后，車機的 GPS 信號可以共享給手機，結(jié)合手機 GPS 信號提供更高精度的定位數(shù)據(jù)；可以看到，在智慧出行場景中，可以通過分布式硬件資源池結(jié)合手機和車機的優(yōu)勢硬件，為用戶

2023-12-06 10:02:45

如何實現(xiàn)Redis分布式鎖

Redis是一個開源的內(nèi)存數(shù)據(jù)存儲系統(tǒng)，可用于高速讀寫操作。在分布式系統(tǒng)中，為了保證數(shù)據(jù)的一致性和避免競態(tài)條件，常常需要使用分布式鎖來對共享資源進行加鎖操作。Redis提供了一種簡單而強大的分布式

2023-12-04 11:24:12

327

redis分布式鎖三個方法

Redis是一種高性能的分布式緩存和鍵值存儲系統(tǒng)，它提供了一種可靠的分布式鎖解決方案。在分布式系統(tǒng)中，由于多個節(jié)點之間的并發(fā)訪問，需要使用分布式鎖來保證數(shù)據(jù)的一致性和避免沖突。本文將介紹Redis

2023-12-04 11:22:43

428

redis分布式鎖的應(yīng)用場景有哪些

Redis分布式鎖是一種基于Redis實現(xiàn)的分布式鎖機制，可以在分布式環(huán)境下確保資源的獨占性，避免并發(fā)訪問時的數(shù)據(jù)爭用問題。下面將詳細介紹Redis分布式鎖的應(yīng)用場景。 分布式系統(tǒng)并發(fā)控制在分布式

2023-12-04 11:21:25

382

zookeeper分布式原理

Zookeeper是一個開源的分布式協(xié)調(diào)服務(wù)，可以用于構(gòu)建高可用、高性能的分布式系統(tǒng)。它提供了一個簡單且高效的層次命名空間，可以用來存儲配置信息、狀態(tài)信息、命名服務(wù)等。Zookeeper的設(shè)計目標

2023-12-03 16:33:23

346

星辰天合發(fā)布全新一代全閃分布式存儲，英特爾? QAT及英特爾? DSA助其提供非凡性能

）”及全閃統(tǒng)一存儲“星飛 XINFINI 9000”。英特爾與星辰天合聯(lián)合創(chuàng)新，將第四代英特爾至強可擴展處理器與星辰天合全新一代星飛全閃分布式存儲系統(tǒng)強強整合，為用戶提供了非凡的性能。 XSKY 星辰天合 CEO 胥昕表示，隨著AI、大數(shù)據(jù)等各種應(yīng)用的全面爆發(fā)，業(yè)界對

2023-11-24 20:00:03

377

分布式數(shù)據(jù)恢復-hbase+hive分布式存儲誤刪除文件的數(shù)據(jù)恢復方案

hbase+hive分布式存儲數(shù)據(jù)恢復環(huán)境： 16臺某品牌R730XD服務(wù)器節(jié)點，每臺物理服務(wù)器節(jié)點上有數(shù)臺虛擬機，虛擬機上配置的分布式，上層部署hbase數(shù)據(jù)庫+hive數(shù)據(jù)

2023-11-24 15:55:19

185

#分布式電源助力慶陽打造“西部數(shù)谷”#明德源能 #分布式電源DPS

分布式電源

jf_64111305發(fā)布于 2023-11-17 17:28:27

HarmonyOS分布式文件系統(tǒng)開發(fā)指導

監(jiān)聽、通過軟總線建立鏈路，并根據(jù)分布式的設(shè)備安全等級執(zhí)行不同的數(shù)據(jù)流轉(zhuǎn)策略。 ● hmdfs：實現(xiàn)在內(nèi)核的網(wǎng)絡(luò)文件系統(tǒng)，包括緩存管理、文件訪問、元數(shù)據(jù)管理和沖突管理等。 ○ 緩存管理 ■ 設(shè)備分布式組網(wǎng)

2023-11-14 17:14:57

面對設(shè)備制造商打造的分布式設(shè)備數(shù)據(jù)處理中心有什么功能

。數(shù)之能打造的分布式設(shè)備數(shù)據(jù)處理中心（物聯(lián)網(wǎng)數(shù)據(jù)中臺），支持數(shù)據(jù)匯聚、數(shù)據(jù)解析、數(shù)據(jù)分析、處理及存儲、業(yè)務(wù)分發(fā)，以及提供各種豐富的物聯(lián)網(wǎng)中間件，為客戶快速管理設(shè)

2023-11-09 14:00:27

《分布式融合存儲研究報告（2023）》即將發(fā)布 | 釋放數(shù)據(jù)潛能，筑基數(shù)字經(jīng)濟

隨著云計算、大數(shù)據(jù)、人工智能、高性能和多模計算等技術(shù)的發(fā)展，以文本、圖片和視頻為代表的非結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn)出爆發(fā)式增長。分布式融合存儲以其強大的橫向擴展能力、近線性的性能增長能力、多種協(xié)議的兼容能力以及

2023-11-03 18:35:01

306

tldb提供分布式鎖使用方法

前言：分布式鎖是分布式系統(tǒng)中一個極為重要的工具。目前有多種分布式鎖的設(shè)計方案，比如借助 redis，mq，數(shù)據(jù)庫，zookeeper 等第三方服務(wù)系統(tǒng)來設(shè)計分布式鎖。tldb 提供的分布式鎖，主要是要簡化這個設(shè)計的過程，提供一個簡潔可靠，類似使用程序中對象鎖的方式來獲取分布式鎖。

2023-11-02 14:44:47

388

什么是分布式鎖 Redis的五種分布式鎖方案

本地加鎖的方式在分布式的場景下不適用，所以本文我們來探討下如何引入分布式鎖解決本地鎖的問題。本篇所有代碼和業(yè)務(wù)基于我的開源項目 PassJava。

2023-10-23 11:35:46

196

分布式文件系統(tǒng)的設(shè)計原理是什么？

什么是分布式文件系統(tǒng)？分布式文件系統(tǒng)(DFS)是一種計算機文件系統(tǒng)，使用戶能夠從多個分布式位置存儲和訪問數(shù)據(jù)。它是在分布式環(huán)境中的不同計算機之間共享信息的一種方式。通過使用分布式文件系統(tǒng)，用戶可以

2023-10-17 17:35:02

378

高效管理海量數(shù)據(jù)！憶聯(lián) SSD 為分布式塊存儲提供極致性能

近年來，為滿足大規(guī)模的存儲應(yīng)用需求，分布式存儲成為云環(huán)境下存儲底座構(gòu)建的重要選擇，相較于傳統(tǒng)集中式存儲方案的可靠性、安全性以及數(shù)據(jù)利用率較低，分布式存儲具有易擴展、高性能、高性價比、支持分級存儲

2023-10-13 15:55:01

301

數(shù)據(jù)庫如何實現(xiàn)分布式鎖

1. 前言 分布式應(yīng)用中，有時我們需要一個方法在同一時間只能被一個線程執(zhí)行。此時我們有可能會使用到分布式鎖。 分布式鎖需要具備以下特征：互斥性同一時刻鎖只能被一個線程持有。超時釋放超時釋放

2023-10-08 16:12:52

383

深入理解redis分布式鎖

系統(tǒng)不同進程共同訪問共享資源的一種鎖的實現(xiàn)。如果不同的系統(tǒng)或同一個系統(tǒng)的不同主機之間共享了某個臨界資源，往往需要互斥來防止彼此干擾，以保證一致性。業(yè)界流行的分布式鎖實現(xiàn)，一般有這3種方式：基于數(shù)據(jù)庫實現(xiàn)的分布式鎖基于Redis實現(xiàn)的分布式

2023-10-08 14:13:27

488

基于ZigBee的分布式井蓋監(jiān)控系統(tǒng)

隨著我國現(xiàn)代經(jīng)濟發(fā)展水平的不斷提高，城市井蓋數(shù)目逐漸增加。由于較多井蓋被盜，致使路面形成陷阱，危害到過往車輛和行人安全。本文提出了一種基于ＺｉｇＢｅｅ無線網(wǎng)絡(luò)的智能安全監(jiān)控系統(tǒng)，解決分布式布控困難

2023-09-18 08:46:50

輸電線路分布式故障診斷裝置

LMS12000分布式故障診斷系統(tǒng)的體系結(jié)構(gòu)不同于傳統(tǒng)行波定位系統(tǒng)，其核心部件——故障監(jiān)測終端安裝于輸電線路導線上，可以近距離地捕捉故障瞬間的行波信號。本產(chǎn)品采用了分布式行波測量技術(shù)，使故障定位

2023-09-14 15:11:33

分布式無紙化交互系統(tǒng)的實現(xiàn)原理

維訊維分布式無紙化交互系統(tǒng)的實現(xiàn)原理主要是基于IP分布式網(wǎng)絡(luò)，將分布式系統(tǒng)、無紙化系統(tǒng)、會議智慧屏、顯示大屏幕等有機融合，實現(xiàn)數(shù)據(jù)的分布式傳輸和交互操作。具體實現(xiàn)過程如下：系統(tǒng)基于IP分布式網(wǎng)絡(luò)

2023-09-04 16:11:39

320

什么是訊維分布式輸入節(jié)點和分布式輸出節(jié)點

訊維分布式輸入節(jié)點和分布式輸出節(jié)點是訊維分布式節(jié)點系統(tǒng)中的兩種重要組件。 分布式輸入節(jié)點是訊維分布式節(jié)點系統(tǒng)中的一部分，主要負責采集音視頻數(shù)據(jù)。它可以從不同的音視頻源中采集數(shù)據(jù)，如攝像機、麥克風

2023-08-28 11:47:42

1907

什么是分布式節(jié)點

，如客戶端和服務(wù)器?？蛻舳送ǔＸ撠煱l(fā)送請求和接收響應(yīng)，而服務(wù)器則負責處理請求并返回響應(yīng)。節(jié)點之間還可以進行對等通信，以實現(xiàn)更高級別的協(xié)同工作。訊維分布式節(jié)點在許多領(lǐng)域中都有應(yīng)用，如云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)、區(qū)塊

2023-08-28 11:39:06

2153

華為宣布CANTIAN引擎開源并發(fā)布分布式存儲全閃新品

了2022年TOP N問題的改進成果，并深入探討AI存儲、分布式數(shù)據(jù)庫、容器等話題。第三屆華為數(shù)據(jù)存儲用戶精英論壇成功召開回顧華為數(shù)據(jù)存儲的發(fā)展歷程，華為數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰誠摯感謝全球客戶對華為一如既往的支持和幫助：“中國數(shù)據(jù)存儲產(chǎn)業(yè)面

2023-08-25 18:45:07

431

OpenHarmony 分布式硬件關(guān)鍵技術(shù)

本文轉(zhuǎn)載自 OpenHarmony TSC 官方《峰會回顧第8期 | OpenHarmony 分布式硬件關(guān)鍵技術(shù)》演講嘉賓 | 李剛回顧整理 | 廖濤排版校對 | 李萍萍嘉賓簡介李剛

2023-08-24 17:25:23

8K無損壓縮分布式系統(tǒng)，開創(chuàng)分布式新時代！

近年來，分布式產(chǎn)品可謂遍地開花，很多廠商絡(luò)繹不絕的在AV over IP化下足功夫，行業(yè)各類分布式產(chǎn)品層出不窮，當大家還以4K產(chǎn)品引以為傲的時候，近日訊維率先推出最新一代分布式產(chǎn)品：8K無損壓縮

2023-08-24 10:28:07

430

分布式系統(tǒng)及大數(shù)據(jù)分析系統(tǒng)成功用于臨沂城市管理局指揮中心

，訊維全新DISTR?4K分布式可視化系統(tǒng)及DAT?大數(shù)據(jù)可視化分析系統(tǒng)作為此次數(shù)字城管系統(tǒng)升級的核心部分。本次應(yīng)用標志著訊維分布式系列產(chǎn)品及大數(shù)據(jù)可視化產(chǎn)品在智慧城市建設(shè)與升級方面，發(fā)揮了重要作用。數(shù)字化城市管理信息系統(tǒng)，是利用計算

2023-08-24 10:22:52

285

分布式節(jié)點的性能優(yōu)勢

隨著大數(shù)據(jù)、云計算和人工智能等技術(shù)的快速發(fā)展，分布式節(jié)點在處理海量數(shù)據(jù)和復雜任務(wù)方面具有顯著優(yōu)勢。訊維分布式節(jié)點作為一種新興的技術(shù)架構(gòu)，以其高性能、高可用性和低能耗等特性，成為了許多企業(yè)和機構(gòu)的首選

2023-08-23 15:32:19

1003

分布式電站數(shù)據(jù)采集：實時監(jiān)控、優(yōu)化運行與智能管理

采集與監(jiān)控至關(guān)重要，如何實現(xiàn)數(shù)據(jù)采集與運行優(yōu)化，成為企業(yè)的新需求。 分布式電站通常指規(guī)模較小、地理位置分散、可獨立運行的發(fā)電系統(tǒng)，如太陽風、風能等，通過多種設(shè)備的數(shù)據(jù)采集與監(jiān)控，包括傳感器、水電表、PLC等，用于監(jiān)測電

2023-08-14 15:39:48

352

分布式系統(tǒng)及大數(shù)據(jù)分析系統(tǒng)成功應(yīng)用于臨沂某城市管理局指揮中心！

，訊維全新DISTR?4K分布式可視化系統(tǒng)及DAT?大數(shù)據(jù)可視化分析系統(tǒng)作為此次數(shù)字城管系統(tǒng)升級的核心部分。本次應(yīng)用標志著訊維分布式系列產(chǎn)品及大數(shù)據(jù)可視化產(chǎn)品在智慧城市建設(shè)與升級方面，發(fā)揮了重要作用。 ? 數(shù)字化城市管理信息系統(tǒng)，是利用計

2023-08-07 10:12:31

352

訊維分布式可視化控制系統(tǒng)維的發(fā)展趨勢

的自動化程度和智能化水平。 2.大數(shù)據(jù)應(yīng)用：隨著數(shù)據(jù)量的不斷增長，分布式可視化控制系統(tǒng)將越來越重視大數(shù)據(jù)的應(yīng)用，可以對海量的數(shù)據(jù)進行實時處理和分析，提供更加準確、全面的信息支持。 3.云端化：隨著云計算技術(shù)的發(fā)展，分布式可

2023-07-31 09:42:03

262

訊維分布式可視化控制系統(tǒng)的發(fā)展趨勢

2023-07-28 10:09:57

287

分布式存儲的7個特征

什么是分布式存儲呢？如果一個存儲系統(tǒng)，不管是對象、塊、文件、kv、log、olap、oltp，只要對所管理的數(shù)據(jù)做了Partitioning&Replication，不管姿勢對不對，其實

2023-07-18 14:17:26

566

分布式數(shù)據(jù)庫|數(shù)據(jù)庫數(shù)據(jù)類型

分布式數(shù)據(jù)庫是一種存儲在不同物理位置的數(shù)據(jù)庫。與單個數(shù)據(jù)庫系統(tǒng)的并行系統(tǒng)不同，分布式數(shù)據(jù)庫系統(tǒng)由不共享物理組件的松耦合站組成。分布式數(shù)據(jù)庫具有可擴展性好、容錯性強等優(yōu)點，廣泛應(yīng)用于大型互聯(lián)網(wǎng)企業(yè)

2023-07-17 13:33:09

328

Hadoop的優(yōu)化與發(fā)展(3)#大數(shù)據(jù)分析

大數(shù)據(jù)分析

學習硬聲知識發(fā)布于 2023-07-11 14:40:41

Hadoop的優(yōu)化與發(fā)展(2)#大數(shù)據(jù)分析

大數(shù)據(jù)分析

學習硬聲知識發(fā)布于 2023-07-11 14:40:14

Hadoop的優(yōu)化與發(fā)展(1)#大數(shù)據(jù)分析

大數(shù)據(jù)分析

學習硬聲知識發(fā)布于 2023-07-11 14:39:49

大規(guī)模分布式存儲的挑戰(zhàn)(2)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:23:45

大規(guī)模分布式存儲的挑戰(zhàn)(1)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:23:24

初步認識大數(shù)據(jù)對分布式存儲系統(tǒng)的需求(2)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:16:27

初步認識大數(shù)據(jù)對分布式存儲系統(tǒng)的需求(1)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:16:04

分布式存儲系統(tǒng)重要功能設(shè)計要點剖析(2)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:09:24

分布式存儲系統(tǒng)重要功能設(shè)計要點剖析(1)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:09:03

分布式存儲系統(tǒng)舉例(2)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:08:42

分布式存儲系統(tǒng)舉例(1)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:07:59

分布式事務(wù) (2)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:06:16

分布式事務(wù) (1)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:05:41

具體說明大數(shù)據(jù)對分布式存儲系統(tǒng)的需求(2)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:02:47

具體說明大數(shù)據(jù)對分布式存儲系統(tǒng)的需求(1)#大數(shù)據(jù)處理

大數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-05 11:02:18

分布式存儲架構(gòu)面臨的挑戰(zhàn)

? 從云和互聯(lián)網(wǎng)的業(yè)務(wù)場景來看，其存儲域主要采用基于服務(wù)器部署分布式存儲服務(wù)的融合方式，它面臨如下挑戰(zhàn) ： 1．數(shù)據(jù)保存周期與服務(wù)器更新周期不匹配。大數(shù)據(jù)、人工智能等新興業(yè)務(wù)催生出海量數(shù)據(jù)，大量數(shù)據(jù)

2023-07-05 10:44:08

849

通用表表達式(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 23:02:05

通用表表達式(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 23:01:32

過程語言(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 23:00:52

過程語言(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 23:00:11

課程介紹(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:59:24

課程介紹(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:58:59

#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:58:32

聚合函數(shù)(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:57:57

窗口函數(shù)(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:57:17

窗口函數(shù)(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:55:17

流數(shù)據(jù)的基本概念(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:54:29

流數(shù)據(jù)的基本概念(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:54:07

數(shù)據(jù)聯(lián)邦介紹(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:53:46

數(shù)據(jù)聯(lián)邦介紹(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:53:01

數(shù)據(jù)安全概述(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:52:28

數(shù)據(jù)安全概述(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:52:05

數(shù)據(jù)處理新技術(shù)與展望(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:51:38

數(shù)據(jù)處理新技術(shù)與展望(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:50:47

嵌套查詢(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:50:06

嵌套查詢(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:49:29

多維數(shù)據(jù)分析(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:48:46

多維數(shù)據(jù)分析(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:48:11

Kafka和Greenplum的集成 - 本章小結(jié)(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:47:36

Kafka和Greenplum的集成 - 本章小結(jié)(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:47:13

Greenplum數(shù)據(jù)庫權(quán)限控制(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:46:50

Greenplum數(shù)據(jù)庫權(quán)限控制(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:46:25

Apache Kafka簡介(2)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:45:56

Apache Kafka簡介(1)#分布式數(shù)據(jù)

分布式數(shù)據(jù)

未來加油dz發(fā)布于 2023-07-03 22:45:31

分布式存儲的分類和典型應(yīng)用場景

分布式對象存儲：指各存儲節(jié)點由標識符、數(shù)據(jù)和元數(shù)據(jù)的對象數(shù)據(jù)構(gòu)成。其中標識符在該存儲系統(tǒng)中唯一，用于區(qū)分不同存儲區(qū)域；元數(shù)據(jù)將提取數(shù)據(jù)特征，便于快速檢索。

2023-06-12 14:38:13

2591

如何使用分布式存儲系統(tǒng)促進AI模型訓練

這凸顯了分布式存儲在人工智能（AI）領(lǐng)域的重要性。JuiceFS 是一個開源、高性能的分布式文件系統(tǒng)，為這個問題提供了解決方案。

2023-06-12 09:28:38

312

融合互通，浪潮分布式融合存儲AS13000加速海量數(shù)據(jù)處理

智慧時代，數(shù)據(jù)量激增且非結(jié)構(gòu)化數(shù)據(jù)的占比逐漸增大，數(shù)據(jù)類型愈發(fā)復雜，處理數(shù)據(jù)的方式更加多樣化，傳統(tǒng)單一存儲難以滿足市場需求。基于此，浪潮推出了非結(jié)構(gòu)化數(shù)據(jù)融合互通新平臺分布式融合存儲AS13000。

2023-06-07 10:57:56

359

分布式故障定位裝置——FH-900F武漢風河智能科技

分布式故障定位裝置——FH-900F武漢風河智能科技電力輸電線路經(jīng)常面臨各種自然因素導致的跳閘事故，而這些事故不僅損害設(shè)施，更重要的是給電力系統(tǒng)帶來了安全隱患。解決這一問題，快速準確的定位故障點

2023-06-06 13:59:10

如何使用Jmeter進行分布式測試；檢索日志？

使用 Jmeter 進行分布式測試；檢索日志

2023-05-10 13:00:46

大數(shù)據(jù)的基本處理流程大數(shù)據(jù)的作用和意義

大數(shù)據(jù)的基本處理流程通常包括以下幾個步驟：　　1. 數(shù)據(jù)采集：從各種數(shù)據(jù)源采集數(shù)據(jù)，可能包括傳感器數(shù)據(jù)、日志數(shù)據(jù)、電子郵件、社交媒體數(shù)據(jù)等。　　2. 數(shù)據(jù)存儲：將采集到的數(shù)據(jù)存儲到分布式文件系統(tǒng)或數(shù)據(jù)倉庫中，可能需要根據(jù)不同的數(shù)據(jù)類型和存儲需求進行不同的數(shù)據(jù)格式轉(zhuǎn)換和存儲方案選擇。

2023-04-16 16:21:18

6269

大數(shù)據(jù)平臺有哪些大數(shù)據(jù)技術(shù)應(yīng)用有哪些

是其中一些類型的大數(shù)據(jù)平臺：　　1. 分布式計算平臺：Apache Hadoop、Apache Spark、Apache Flink等，提供分布式存儲和計算能力，支持海量數(shù)據(jù)處理和分析

2023-04-16 16:14:00

9835

大數(shù)據(jù)的4v特征有哪些大數(shù)據(jù)技術(shù)包括哪些技術(shù)

的增長速度非?？?，而且數(shù)據(jù)的來源和種類也更加多樣化。　　2. Velocity（處理速度）：大數(shù)據(jù)通常需要快速處理和分析，這就需要使用高效的分布式系統(tǒng)和并行算法來快速處理數(shù)據(jù)。如Hadoop、Spark等分布式處理框架可以有效地解決大數(shù)據(jù)的處理速度問題。

2023-04-16 16:08:38

13294

含分布式發(fā)電的微電網(wǎng)中儲能裝置容量優(yōu)化配置

負荷削峰填谷的作用。提出了應(yīng)用上下限約束法以及加權(quán)移動平均控制法，以滿足微電網(wǎng)的接入要求為前提，以最小儲能配置容量為目標，對混合儲能裝置進行容量優(yōu)化配置的方法。仿真結(jié)果表明，所提方法不僅能夠使分布式發(fā)電出力滿足

2023-04-14 10:23:10

常見的分布式供電技術(shù)有哪些？

電源供電，同時也是小型分布式電源向更小型負荷供電的過程，數(shù)據(jù)體量小、接口標準清晰。分布式供電技術(shù)主要有以下優(yōu)點：　　1. 提高電力供應(yīng)的可靠性：分布式電源設(shè)備距離用電設(shè)備較近，電力傳輸損失減小，可以

2023-04-10 16:28:30

已全部加載完成

搜索歷史

基于Hadoop的產(chǎn)品大數(shù)據(jù)分布式存儲優(yōu)化

評論