現代IM系統中消息推送和存儲架構的實現

即時通訊（Instant Messaging，簡稱IM）是一個實時通信系統，允許兩人或多人使用網絡實時的傳遞文字消息、文件、語音與視頻交流。實現方式有兩種。第一種基于Server轉發的，Client雙方通信會經過Server轉發來完成消息傳遞。例如QQ、微信。

第二種是基于P2P（點對點）的。P2P的實現依賴于客戶端之間的互聯，但由于NAT與防火墻的存在，客戶端無法直接互聯，需要coturn服務器用來穿越NAT網絡。

架構設計

本章主要會介紹基于TableStore的現代IM消息系統的架構設計，在詳細介紹架構設計之前，會先介紹一種Timeline邏輯模型，來抽象和簡化對IM消息同步和存儲模型的理解。理解了Timeline模型后，會介紹如何基于此模型對消息的同步以及存儲進行建模。基于Timeline模型，在實現消息同步和存儲時還會有各方面的技術權衡，例如如何對消息同步常見的讀擴散和寫擴散兩種模型進行對比和選擇，以及針對Timeline模型的特征如何來選擇底層數據庫。

傳統架構 vs 現代架構

現代IM系統中消息推送和存儲架構的實現

上圖是消息系統傳統架構與現代架構的簡單對比。

傳統架構下，消息是先同步后存儲。對于在線的用戶，消息會直接實時同步到在線的接收方，消息同步成功后，并不會進行持久化。而對于離線的用戶或者消息無法實時同步成功時，消息會持久化到離線庫，當接收方重新連接后，會從離線庫拉取所有未讀消息。當離線庫中的消息成功同步到接收方后，消息會從離線庫中刪除。傳統的消息系統，服務端的主要工作是維護發送方和接收方的連接狀態，并提供在線消息同步和離線消息緩存的能力，保證消息一定能夠從發送方傳遞到接收方。服務端不會對消息進行持久化，所以也無法支持消息漫游。

現代架構下，消息是先存儲后同步。先存儲后同步的好處是，如果接收方確認接收到了消息，那這條消息一定是已經在云端保存了。并且消息會有兩個庫來保存，一個是消息存儲庫，用于全量保存所有會話的消息，主要用于支持消息漫游。另一個是消息同步庫，主要用于接收方的多端同步。消息從發送方發出后，經過服務端轉發，服務端會先將消息保存到消息存儲庫，后保存到消息同步庫。完成消息的持久化保存后，對于在線的接收方，會直接選擇在線推送。但在線推送并不是一個必須路徑，只是一個更優的消息傳遞路徑。對于在線推送失敗或者離線的接收方，會有另外一個統一的消息同步方式。接收方會主動的向服務端拉取所有未同步消息，但接收方何時來同步以及會在哪些端來同步消息對服務端來說是未知的，所以要求服務端必須保存所有需要同步到接收方的消息，這是消息同步庫的主要作用。對于新的同步設備，會有消息漫游的需求，這是消息存儲庫的主要作用，在消息存儲庫中，可以拉取任意會話的全量歷史消息。

以上是傳統架構和現代架構的一個簡單的對比，現代架構上整個消息的同步和存儲流程，并沒有變復雜太多，但是其能實現多端同步以及消息漫游。現代架構中最核心的就是兩個消息庫『消息同步庫』和『消息存儲庫』，是消息同步和存儲最核心的基礎。而本篇文章接下來的部分，都是圍繞這兩個庫的設計和實現來展開。

Timeline模型

在分析『消息同步庫』和『消息存儲庫』的設計和實現之前，在本章會先介紹一個邏輯模型-Timeline。Timeline模型會幫助我們簡化對消息同步和存儲模型的理解，而消息庫的設計和實現也是圍繞Timeline的特性和需求來展開。

現代IM系統中消息推送和存儲架構的實現

如圖是Timeline模型的一個抽象表述，Timeline可以簡單理解為是一個消息隊列，但這個消息隊列有如下特性：

每個消息擁有一個順序ID（SeqId），在隊列后面的消息的SeqId一定比前面的消息的SeqId大，也就是保證SeqId一定是增長的，但是不要求嚴格遞增。

新的消息永遠在尾部添加，保證新的消息的SeqId永遠比已經存在隊列中的消息都大。

可根據SeqId隨機定位到具體的某條消息進行讀取，也可以任意讀取某個給定范圍內的所有消息。

有了這些特性后，消息的同步可以拿Timeline來很簡單的實現。圖中的例子中，消息發送方是A，消息接收方是B，同時B存在多個接收端，分別是B1、B2和B3。A向B發送消息，消息需要同步到B的多個端，待同步的消息通過一個Timeline來進行交換。A向B發送的所有消息，都會保存在這個Timeline中，B的每個接收端都是獨立的從這個Timeline中拉取消息。每個接收端同步完畢后，都會在本地記錄下最新同步到的消息的SeqId，即最新的一個位點，作為下次消息同步的起始位點。服務端不會保存各個端的同步狀態，各個端均可以在任意時間從任意點開始拉取消息。

消息漫游也是基于Timeline，和消息同步唯一的區別是，消息漫游要求服務端能夠對Timeline內的所有數據進行持久化。

基于Timeline，從邏輯模型上能夠很簡單的理解在服務端如何去實現消息同步和存儲，并支持多端同步和消息漫游這些高級功能。落地到實現的難點主要在如何將邏輯模型映射到物理模型，Timeline的實現對數據庫會有哪些要求？我們應該選擇何種數據庫去實現？這些是接下來會討論到的問題。

消息存儲模型

現代IM系統中消息推送和存儲架構的實現

如圖是基于Timeline的消息存儲模型，消息存儲要求每個會話都對應一個獨立的Timeline。如圖例子所示，A與B/C/D/E/F均發生了會話，每個會話對應一個獨立的Timeline，每個Timeline內存有這個會話中的所有消息，服務端會對每個Timeline進行持久化。服務端能夠對所有會話Timeline中的全量消息進行持久化，也就擁有了消息漫游的能力。

消息同步模型

消息同步模型會比消息存儲模型稍復雜一些，消息的同步一般有讀擴散和寫擴散兩種不同的方式，分別對應不同的Timeline物理模型。

現代IM系統中消息推送和存儲架構的實現

如圖是讀擴散和寫擴散兩種不同同步模式下對應的不同的Timeline模型，按圖中的示例，A作為消息接收者，其與B/C/D/E/F發生了會話，每個會話中的新的消息都需要同步到A的某個端，看下讀擴散和寫擴散兩種模式下消息如何做同步。

讀擴散：消息存儲模型中，每個會話的Timeline中保存了這個會話的全量消息。讀擴散的消息同步模式下，每個會話中產生的新的消息，只需要寫一次到其用于存儲的Timeline中，接收端從這個Timeline中拉取新的消息。優點是消息只需要寫一次，相比寫擴散的模式，能夠大大降低消息寫入次數，特別是在群消息這種場景下。但其缺點也比較明顯，接收端去同步消息的邏輯會相對復雜和低效。接收端需要對每個會話都拉取一次才能獲取全部消息，讀被大大的放大，并且會產生很多無效的讀，因為并不是每個會話都會有新消息產生。

寫擴散：寫擴散的消息同步模式，需要有一個額外的Timeline來專門用于消息同步，通常是每個接收端都會擁有一個獨立的同步Timeline，用于存放需要向這個接收端同步的所有消息。每個會話中的消息，會產生多次寫，除了寫入用于消息存儲的會話Timeline，還需要寫入需要同步到的接收端的同步Timeline。在個人與個人的會話中，消息會被額外寫兩次，除了寫入這個會話的存儲Timeline，還需要寫入參與這個會話的兩個接收者的同步Timeline。而在群這個場景下，寫入會被更加的放大，如果這個群擁有N個參與者，那每條消息都需要額外的寫N次。寫擴散同步模式的優點是，在接收端消息同步邏輯會非常簡單，只需要從其同步Timeline中讀取一次即可，大大降低了消息同步所需的讀的壓力。其缺點就是消息寫入會被放大，特別是針對群這種場景。

在IM這種應用場景下，通常會選擇寫擴散這種消息同步模式。IM場景下，一條消息只會產生一次，但是會被讀取多次，是典型的讀多寫少的場景，消息的讀寫比例大概是10:1。若使用讀擴散同步模式，整個系統的讀寫比例會被放大到100:1。一個優化的好的系統，必須從設計上去平衡這種讀寫壓力，避免讀或寫任意一維觸碰到天花板。所以IM系統這類場景下，通常會應用寫擴散這種同步模式，來平衡讀和寫，將100:1的讀寫比例平衡到30:30。當然寫擴散這種同步模式，還需要處理一些極端場景，例如萬人大群。針對這種極端寫擴散的場景，會退化到使用讀擴散。一個簡單的IM系統，通常會在產品層面限制這種大群的存在，而對于一個高級的IM系統，會采用讀寫擴散混合的同步模式，來滿足這類產品的需求。

閱讀全文

12 3 下一頁全文

本文導航

第 1 頁：現代IM系統中消息推送和存儲架構的實現
第 2 頁：消息庫設計
第 3 頁：架構實現

通訊(34151) 通訊(34151)

全臺網存儲架構的選擇分析

【作者】：王敏建;【來源】：《電視技術》2010年02期【摘要】：介紹了FCSAN和IPSAN兩種存儲架構在全臺網環境下構建存儲局域網所能發揮的不同優勢和特性,結合未來技術的發展方向,提出選擇存儲

2010-04-23 11:22:24

聊聊消息推送架構設計

類似的，文件存儲、數據存儲、推送服務、身份驗證服務等功能，都會沉淀為原子服務，業務開發人員，在原子服務基礎上，進行編排、配置、組合，可以快速構建業務應用。

2023-09-04 15:52:34

241

存儲網絡在數據中心現代化中的作用

電子發燒友網站提供《存儲網絡在數據中心現代化中的作用.pdf》資料免費下載

2023-09-01 14:43:32

存儲體系結構的現代化

電子發燒友網站提供《存儲體系結構的現代化.pdf》資料免費下載

2023-08-30 16:58:28

無懼百萬級并發，GaussDB(for?Cassandra) 讓華為 Push 推送服務更快觸達

利器。華為云 GaussDB(for?Cassandra)?是一款基于計算存儲分離架構的分布式數據庫，致力于提供穩定可靠、超高并發，兼容 Cassandra 生態、彈性伸縮、一鍵部署、快速恢復、監控告警的分布式數據庫服務，在 Push 業務的高效架構建設中，起到了關鍵

2023-06-29 16:48:31

148

【節能學院】基于物聯網云平臺的分布式光伏監控系統的設計與實現

，開發基于云平臺的光伏發電遠程監控系統。在平臺部署過程中，通過合理設計SQLServer數據庫，結合本地數據庫和云端數據庫，實現數據的云端存儲、計算和調用。最終通

2023-05-11 10:29:23

176

現代商用FPGA架構的不同關鍵組件的演變

架構的設計涉及許多不同的設計選擇，從高級架構參數到晶體管級實現細節，目標是制造高度可編程的器件，同時最小化可重新配置的面積和性能成本。隨著應用需求和工藝技術能力的不斷發展，FPGA架構也必須適應。在這篇文章中，我們回顧了現代商用FPGA架構的不同關鍵組件的演變，并闡明了它們的主要設計原則和實現挑戰。

2023-01-31 15:32:01

288

LCR HIOKI IM3536

LCR HIOKI IM3536HIOKI這次發售了LCR測試儀IM3536。IM3536具備4Hz~8MHz寬頻率范圍，實現高速、高精度測量。滿足電子元件的研發和生產等多種領域的要求。LCR測試儀

2022-12-05 10:47:09

一種AUTOSAR軟件架構中RTE的實現方法

介紹了一種AUTOSAR軟件架構中RTE的實現方法。

2022-07-13 16:02:52

分布式云存儲基礎架構借助x86架構取得進步

　　從昂貴的單片存儲陣列到商品服務器，傳統存儲系統會給云存儲基礎架構增加顯著的成本、管理復雜性和功耗，同時帶來大量以備份和恢復為中心的挑戰。

2022-06-14 10:27:59

911

zy-im基于Netty的IM服務

./oschina_soft/gitee-zy-im.zip

2022-05-26 14:35:08

智能硬件APP如何更好更快的實現消息推送

在很多種場景下，應用消息推送提醒是很實用的功能。運營人員可以通過APP推送熱門內容，系統可以根據用戶訂閱推送相關資訊，就連我們平時用的微信消息也都屬于APP消息推送行列。

2022-05-21 11:39:34

1456

淺談數據系統架構核心組件及存儲組件選型

Lambda架構的核心思想是將不可變的數據以追加的方式并行寫到批和流處理系統內，隨后將相同的計算邏輯分別在流和批系統中實現，并且在查詢階段合并流和批的計算視圖并展示給用戶。

2022-05-13 15:53:37

2443

OrioleDB：構建現代云原生存儲引擎

它以擴展的形式組成，建立在新的表訪問方法框架以及其他表中PG擴展接口之上。通過擴展和增強當前的表訪問方法，OrioleDB為未來更強大的存儲模型打開了大門，這些模型對云和現代硬件架構進行了優化。目前是標準的PG許可。

2022-04-13 15:45:13

2655

《現代操作系統》03章存儲管理（二）

《現代操作系統》03章存儲管理（二）0 前文3 虛擬內存3.1 簡介3.2 分頁3.2.1 page & page frame3.2.2 MMU的工作機制3.3 頁表3.4 加速分頁過程

2021-12-29 19:46:14

go語言實現的簡單im即時通信系統解析

【導讀】本文介紹了一個 go 語言實現的簡單 im 即時通信系統。簡介純go實現的im即時通訊系統，各層可單獨部署，之間通過rpc通訊，支持集群，github地址 https

2021-10-26 09:22:17

3491

go語言實現的簡單im即時通信系統

? 本文介紹了一個 go 語言實現的簡單 im 即時通信系統。簡介純go實現的im即時通訊系統，各層可單獨部署，之間通過rpc通訊，支持集群，github地址 https

2021-10-20 16:02:22

2809

西部數據：創新存儲架構領航開放計算

機會被存儲下來，現代企業級存儲架構正面臨著許多挑戰。首先，存儲性能亟需大幅提升，以實現更低的延遲、更高的IO性能和更大的帶寬；其次，對于企業來說，成本永遠是最重要的，也就是要求存儲系統的總體擁有成本（TCO）要盡可能的低；最后在

2021-08-13 11:28:24

1143

鴻蒙推送時間華為鴻蒙推送時間

自從華為6月正式發布推送鴻蒙系統2.0，許多用戶都對鴻蒙系統感興趣也想下載，然而不怎么清楚鴻蒙系統詳細的推送時間，這篇文將分享鴻蒙系統推送時間的詳細信息。

2021-07-08 11:23:48

7191

鴻蒙系統什么時候正式推送

鴻蒙系統即將正式開始進行大規模推送，鴻蒙操作系統開始面向包括手機在內的“1+8+N”全場景規模化推送。

2021-06-02 21:10:20

9385

存儲器和總線架構分析：stm32F429-系統架構

1. 存儲器和總線架構 1.1 系統架構 I總線：此總線用于將 Cortex?-M4F 內核的指令總線連接到總線矩陣。內核通過此總線獲取指令。此總線訪問的對象是包含代碼的存儲器（內部 Flash

2021-02-15 06:16:00

3158

云存儲的架構及系統組成

不知不覺中，我們每天都在接觸存儲，由此可見存儲的重要性。隨著時代的改變，存儲方式也在隨之變化。目前，云存儲是十分火熱的存儲方式之一。為增進大家對云存儲的了解，本文將對云存儲架構以及云存儲系統的組成加以介紹。

2021-02-02 10:39:03

5049

云存儲架構和云存儲系統的組成詳細說明

不知不覺中，我們每天都在接觸存儲，由此可見存儲的重要性。隨著時代的改變，存儲方式也在隨之變化。目前，云存儲是十分火熱的存儲方式之一。為增進大家對云存儲的了解，本文將對云存儲架構以及云存儲系統的組成加以介紹。如果你對存儲具有興趣，不妨繼續往下閱讀哦。

2021-01-03 13:53:00

1387

云存儲的架構/系統組成

2020-12-30 15:58:18

2278

存儲虛擬化的存儲資源架構解析

存儲虛擬化是將存儲設備抽象為數據存儲，虛擬機在數據存儲中作為一組文件存儲在自己的目錄中。數據存儲是邏輯容器，類似于文件系統，它將各個存儲設備的特性隱藏起來，并提供一個統一的模型來存儲虛擬機文件。存儲

2020-07-31 14:42:37

2561

存儲架構分類的快速區分方法

在linux運維（網絡安全運維基礎入門）中，存儲提供了數據的基本保障，在整個架構中是非常重要的環節。學好存儲的前提是先認識存儲和存儲架構的分類。

2020-05-05 22:28:00

1921

云存儲實現前提_云存儲架構

本文首先介紹了云存儲實現前提，其次闡述了云存儲的優勢，最后介紹了云存儲架構。

2020-04-30 15:09:56

982

微軟Windows 10新現代流暢設計圖標推送了

早在去年12月，微軟就宣布Windows 10設備的新現代流暢設計圖標。新圖標包括用于郵件和日歷，計算器，照片等的圖標設計。上周，微軟向Windows Insiders用戶推送系統級別的流暢設計新圖標。

2020-03-01 15:19:11

1458

存儲優先架構的未來是什么樣的

存儲架構包括數據層、計算層和控制層組成，它們以存儲調度為核心邏輯形成一套計算架構，數據在存儲之間的遷移過程中同時完成計算，計算就那么自然而然隨著數據轉移同時進行了。

2019-12-05 10:26:41

771

單片機MQTT如何實現推送的簡單使用

本文檔的主要內容詳細介紹的是單片機MQTT如何實現推送的簡單使用。

2019-07-19 17:37:00

分布式存儲的系統架構

對一個大規模集群的存儲系統而言，服務器宕機、交換機失效是常態，架構師必須為這些故障發生時，保證系統依然可用而進行系統設計。

2019-07-12 16:31:53

1813

云計算基礎架構是如何實現的

傳統網絡基礎架構向云的遷移是大勢所趨，云計算基礎架構要實現的是按需分配、自動化、以使用情況付費的模式，這些目標的實現依賴于數據中心、服務器、存儲、虛擬化和操作系統等組成部分云化過程中的智能調度和分配。

2019-06-20 16:18:51

1026

如何快速搭建一套區塊鏈社交IM系統開發IM社交系統費用

的區塊鏈技術研發公司深圳源中瑞科技有限公司在2018年4月份區塊鏈社交直播聊天IM系統已經成熟測試完畢后也沒多大問題，至今為止源中瑞研發的社交IM系統已經是5.0版本，也就是升級了5個版本，更趨向于國際化

2019-01-15 13:39:49

468

如何快速搭建一套區塊鏈社交IM系統開發IM社交系統費用

2019-01-15 13:35:53

511

區塊鏈IM即時通訊直播平臺系統開發

區塊鏈IM直播系統開發、多幣種錢包開發服務商歡迎咨詢周顧問：ruiec997（微）。通訊其實在我們的生活中是一種在不斷完善以及創新的溝通方式，傳統的通訊通常是網絡、電話、寫信等等。經過這些眼花繚亂

2018-10-30 17:12:52

729

區塊鏈IM即時通訊系統區塊鏈社交軟件實現原理

區塊鏈IM即時通訊系統區塊鏈社交軟件實現原理即時通訊（Instant Messenger，簡稱IM）軟件多是基于TCP/IP和UDP進行通訊的，TCP/IP和UDP都是建立在更低層的IP協議上的兩種

2018-10-09 14:20:29

351

IBM存儲前景展望

BM存儲未來如何發展？借著IBM AI架構和高端全閃存 FlashSystem 9100的發布會，IBM讓我們看到一個可以幫助客戶在未來的3-5迎接挑戰的現代基礎架構和現代存儲架構。我們也了解到IBM存儲的最新動態，能清晰的看到，存儲在IBM業務中的分量會越來越重。

2018-09-23 16:32:00

3979

Modern架構之開放互聯打造現代化主機

的基礎資源。這要求企業構建一個現代化的數據存儲平臺，以保證數據在多云環境中被實時調取、共享及無縫遷移；同時塑造一個面向大數據高效存儲、處理的架構，打造綠色的IT系統沿革路徑。

2018-06-09 10:45:57

3483

arm架構的芯片memory及智能機存儲部件簡述

簡單對ARM架構和基于ARM架構處理器系統中可能包含多種類型的存儲部件，如Flash、SRAM、SDRAM、ROM以及用于提高系統性能的Cache等等。

2018-06-09 00:32:00

5511

java實現IM即時通訊聊天功能代碼

從實際工程應用角度出發，以計算機網絡原理為指導，結合當前網絡中的一些常用技術，編程實現基于C/S架構的網絡聊天工具是切實可行的。本文為大家介紹java Smack整合Openfire服務器實現IM即時通訊聊天功能代碼。

2018-01-24 16:10:28

26497

容器實現持久存儲的3個基礎類型：塊存儲、對象存儲和文件系統

決定如何為容器實現持久存儲的第一步是確定您將使用的存儲系統的基礎類型。在這方面, 通常有三種主要選項：文件系統存儲、塊存儲和對象存儲。

2018-01-24 10:58:23

6083

結合云存儲的博客系統架構

為解決新一代博客系統海量信息的存儲問題，結合云存儲技術，提出了一種新的博客系統架構BlogCloud。該架構以分布式存儲技術為核心，避免了集中式存儲的性能瓶頸問題，可擴展性高；采用半分布式P2P網絡

2018-01-04 16:51:30

基于位置信息的流式引動應用推送系統

目前與位置相關的移動應用越來越多，傳統應用分發模式中，用戶需要手動對應用進行搜索、下載、安裝以及卸載，不利于提升用戶使用應用服務的體驗。設計并實現了基于位置信息的流式移動應用推送系統，該系統中服

2017-12-05 16:55:37

基于存儲過程的SQL自動評判系統實現

針對數據庫能力測評，提出了一種基于存儲過程的soL自動評判系統實現方案。該方案以SQL Server中的存儲過程為核心，使用基本的soL語句與黑盒測試，實現了數據查詢、增加、更新以及刪除的自動評判

2017-11-02 16:47:41

淺談存儲架構之組合式存儲

組合式存儲是第三種存儲架構。它充分利用了縱向擴展架構和橫向擴展存儲的優點。就像縱向擴展架構一樣，組合式存儲系統可以從單個節點開始。可以在IO性能和容量方面充分利用該節點。但是，與縱向擴展

2017-11-02 11:01:36

1166

3319

Nand+Flash存儲管理在DSP系統中的實現

Nand+Flash存儲管理在DSP系統中的實現　　Nand Flash作為一種安全、快速的存儲體，因其具有體積小、容量大、成本低、掉電數據不丟失等一系列優點，已

2010-04-12 13:42:17

1091

已全部加載完成

搜索歷史

現代IM系統中消息推送和存儲架構的實現

架構設計

傳統架構 vs 現代架構

Timeline模型

消息存儲模型

消息同步模型

本文導航

評論