衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

C++內存管理問題

科技綠洲 ? 來源:Linux開發架構之路 ? 作者:Linux開發架構之路 ? 2023-11-13 11:13 ? 次閱讀

寫服務端的,內存是一個繞不過的問題,而用C++寫的,這個問題就顯得更嚴重。進程的內存持續上漲,有可能是正常的內存占用,也有可能是內存碎片,而C++寫的,還有可能是內存泄漏,那就需要一些方法來檢測到底是哪些問題引起的

1. 內存占用

首先從top這個指令說起

Tasks:  80 total,   1 running,  79 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.3 us,  0.7 sy,  0.0 ni, 92.7 id,  6.3 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  2052544 total,  1453600 free,   162408 used,   436536 buff/cache
KiB Swap:   782332 total,   782332 free,        0 used.  1708652 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND      
  179 root      20   0       0      0      0 S  0.3  0.0   0:00.27 [jbd2/dm-0-+ 
  493 mongodb   20   0 1102144  78548  36688 S  0.3  3.8   0:26.07 /usr/bin/mo+ 
  636 mysql     20   0  653808  75932  15548 S  0.3  3.7   0:03.55 /usr/sbin/m+

與進程內存相關的兩個指標:VIRT Virtual Memory,虛擬內存、RES Resident Memory,常駐內存,通常叫物理內存。虛擬內存,是指整個進程申請的內存,包括程序本身的占內存、new或者malloc分配的內存等等。物理內存,就是這個進程在主板上內存條那里占用了多少內存。那為什么會有虛擬內存這個東西,C++不是可以操作硬件么,為什么不直接使用物理內存?這得簡單了解一下操作系統的內存管理。

現代的計算機都會同時運行N個程序,有N多個進程,這些進程都是獨立在運行。如果直接使用物理內存,那就會產生一個問題,進程A申請了內存,進程B也要申請一塊內存,但進程B并不知道進程A的存在,就沒法保證進程B使用的內存進程A沒在用。因此linux下使用內核來管理這些資源,所有進程都只是向內核申請,由內核管理物理內存。而一個進程,可能多次申請、釋放內存,或者程序直接當掉沒有釋放內存,內核為了解決這些復雜的問題,用一個列表維護了進程分配的內存,這就叫虛擬內存,然后把虛擬內存映射到物理內存,這就完成了整個內存的管理。而且,內核對內存的映射做了優化,用到時才映射,如下面的圖中,進程A的new2這塊內存分配了以后,一直沒使用,也就不會映射到物理內存。有很多程序,利用了這個特性。例如,在socket收發時,我們可以分配很大的一塊內存(比如16M),避免頻繁分配緩沖區,但實際這個socket可能收到的數據塊最大只有16k,那內核是不會直接映射16M物理內存的,這樣既方便了我們寫程序,但又沒浪費物理內存。

圖片

下面寫個程序來驗證這個問題

#include < cstring >
#include < iostream >

int main()
{
#define PAUSE(msg) std::cout < < msg < < std::endl; std::cin > > p

        char p;

        size_t size = 1024 * 1024 *100;
        char *l = new char[size];

        PAUSE("new");

        memset(l, 1, size / 2);
        PAUSE("using half large");

        memset(l, 1, size);
        PAUSE("using whole large");

        delete []l;
        PAUSE("del");

        return 0;
}

在每次暫停時,top的輸出結果(RES 1588 54328 105600 3348),說明memset的時候,內核才會映射物理內存。

new
 進程號 USER      PR  NI    VIRT    RES    SHR    %CPU  %MEM     TIME+ COMMAND  
  25295 root     20   0  108280   1588   1436 S   0.0   0.0   0:00.00 ./a.out


using half large
  25295 root     20   0  108280  54328   3096 S   0.0   0.7   0:00.05 ./a.out


using whole large
  25295 root     20   0  108280 105600   3156 S   0.0   1.4   0:00.12 ./a.out


del
  25295 root     20   0    5876   3348   3156 S   0.0   0.0   0:00.13 ./a.out

所以,通過top查看進程內存時,如果發現VIRT占用很大,說明這個程序用new或者malloc等分配了很多內存,但如果RES不是很大,那就不要慌,可能這只是程序的一個緩存優化(當然也有可能是寫這個程序的人用new分配內存時很不合理,分配的值遠大于使用值),實際程序運行占用的物理內存并不大。但如果RES也很高,那可能就有點慌了。

2. 內存泄漏

內存泄漏是導致進程內存持續上漲最常見的原因,而這是C++中常見但不好處理的問題,一個維護多年的大項目,代碼不知道由多少個人寫的,想找出哪個指針的內存沒釋放,談何容易。解決這個問題沒有什么通用快捷的辦法,只能根據實際業務處理。

第一,從業務上,能不能重現內存泄漏。例如我們做游戲的,假如玩家不停地登錄,就會導致內存不斷上漲,那說明問題就在登錄流程,把整個流程拆分,一個個屏蔽測試,最終找出問題。

第二,從部署上,能不能定位內存泄漏。例如,最近更新了一個版本,發現內存占用變得很高,那就可以確定,是這個版本的修改出了問題。一個版本的代碼量終究是有限的,查找起來也比較容易。

第三,使用valgrind memcheck。如果能夠復現內存泄漏,但無法定位是哪個邏輯,那可以用valgrind memcheck。復現內存泄漏,這個通常比較難實現,一般是線下測試無法復現,線上用戶量大,運行久了才會復現,而valgrind會導致程序運行很慢,無法支撐線上測試,因此這個選項通常不太適用于線上。

第四,使用Visual Leak Detector。valgrind是linux下的,如果程序可以跨平臺,或者只在win下,那么可以試試這個,這個和valgrind一樣,需要復現泄漏才能得到堆棧,因此也是用于線下調試比較多。

第五,重載new、delete。像我之前的博客里寫的,可以簡單地加個計數,用于平時預防泄漏,也可更深入一些,記錄內存的分配,得到內存漏泄的堆棧,但是這個是否能支撐線上debug,我持懷疑態度。

第六,使用自己的內存分配函數,每一個內存分配,都使用自己的函數,每一個STL的容器,都傳入自己的分配器,然后分別記錄這些內存分配的大小。這個方法看起來很不現實,但我確實見過在實際的項目中使用,對內存統計、查找有很大的幫助,而且支持在線上debug。查找內存,只需要打印下每個分配器分配的內存大小基本上可以得到結論是哪個分配器出問題。唯一的問題是它增加了開發難度,而且不能像valgrind那樣不需要修改原程序即可使用。

第七,使用valgrind massif。valgrind memcheck需要復現內存泄漏,所以不容易找出問題。它會定時記錄分配內存的各個堆棧以及分配內存的量,當出現內存泄漏時,根據分配內存的量檢查下各個堆棧,應該是可以找到問題的。massif也會導致程序運行慢,但比memcheck要快,能不能在線上debug,這個依然得看具體情況

第八,使用第三方內存分配器,如jemalloc。并不是說使用第三方內存分配器就解決問題了,而是jemalloc自帶了一大堆工具,其中jeprof可以得到內存的大小以及堆棧等信息,對查找內存泄漏有很大幫助。不過開啟prof后,效率如何,能不能在線上使用,我倒是沒測試過。

3. 內存碎片

假如找不到內存泄漏,也許本來就沒有內存泄漏,這時不妨考慮下內存碎片的問題。這里以linux下的ptmalloc為例(其他的分配器我就不懂了),說下內存分配。假如一個進程,依次分配了內存塊m1(1k)、m2(10b)、

圖片

m3(1k),然后釋放了m2,那整個內存看起來是這樣子的:

我們可以看到,m1、m2、m3是按順序分配的,當m2被釋放時,那中間就空了一塊了。那空的這一塊怎么辦,是把它還給系統了嗎?這個問題就很復雜了,涉及到ptmalloc的整個分配機制,這里不打算詳細說,建議看華庭(莊明強) - ptmalloc2源代碼分析。簡單來講,就是ptmalloc會暫把釋放的內存按大小用鏈表存起來,比如10b的,放到fast bin那個鏈表,大一點的,放small bin的第一個鏈表,再大一點,放small bin的第二個鏈表,... 放進去的內存,直到第再次用到時取出。

隨著程序運行,放進鏈表的內存可能會越來越多,但是卻很少取出(可能是程序釋放后沒有再申請,也可能是申請的大小和鏈表里的大小不合適,比如鏈表里有個10b的,但是程序申請了1k),那這些小內存就會越來越多,進程占用的內存也會越來越多,但實際使用的內存不多。那如何檢測這種情況呢?

方法一,使用

malloc_stats。malloc_stats是一個glibc的函數,因此可以在gdb調用

gdb -p 16021
call malloc_stats()

Arena 0:
system bytes     =    1359872
in use bytes     =     954224
Arena 1:
system bytes     =     135168
in use bytes     =       3488
Arena 2:
system bytes     =     135168
in use bytes     =      20784
Arena 3:
system bytes     =     139264
in use bytes     =     120080
Total (incl. mmap):
system bytes     =    1769472
in use bytes     =    1098576
max mmap regions =          0
max mmap bytes   =          0
  1. Arena N表示多個分配域,一般一個線程一個
  2. system bytes 當前申請的內存總數
  3. in use bytes 當前使用的內存總數
  4. max mmap regions 使用mmap分配了多少塊內存(大內存用mmap分配,大于128K,可由M_MMAP_THRESHOLD選項調節)
  5. max mmap bytes 使用mmap分配了多少內存

這里,system bytes減去in use bytes就可以得到當前進程緩存了多少內存。不過malloc_stats是一個很老的接口了,里面的變量都是用的int,如果你的程序占用內存比較大,這里可能會溢出。

方法二,使用使用malloc_info

gdb -p 16021
call malloc_info(0, stdout)

< malloc version="1" >
< heap nr="0" >
< sizes >
< size from="17" to="32" total="3104" count="97"/ >
< size from="33" to="48" total="11136" count="232"/ >
< size from="49" to="64" total="12288" count="192"/ >
< size from="65" to="80" total="14640" count="183"/ >
< size from="81" to="96" total="4896" count="51"/ >
< size from="97" to="112" total="1232" count="11"/ >
< size from="113" to="128" total="7296" count="57"/ >
< size from="33" to="33" total="13299" count="403"/ >
< size from="97" to="97" total="97" count="1"/ >
< size from="7281" to="7281" total="7281" count="1"/ >
< size from="32833" to="32833" total="32833" count="1"/ >
< unsorted from="145" to="8753" total="166107" count="155"/ >
< /sizes >
< total type="fast" count="823" size="54592"/ >
< total type="rest" count="561" size="219617"/ >
< system type="current" size="1359872"/ >
< system type="max" size="1376256"/ >
< aspace type="total" size="1359872"/ >
< aspace type="mprotect" size="1359872"/ >
< /heap >
< heap nr="1" >
< sizes >
< size from="33" to="48" total="48" count="1"/ >
< unsorted from="4673" to="4705" total="9378" count="2"/ >
< /sizes >
< total type="fast" count="1" size="48"/ >
< total type="rest" count="2" size="9378"/ >
< system type="current" size="135168"/ >
< system type="max" size="135168"/ >
< aspace type="total" size="135168"/ >
< aspace type="mprotect" size="135168"/ >
< /heap >
< heap nr="2" >
< sizes >
< size from="33" to="48" total="48" count="1"/ >
< size from="113" to="128" total="128" count="1"/ >
< size from="65" to="65" total="65" count="1"/ >
< unsorted from="81" to="3233" total="10054" count="6"/ >
< /sizes >
< total type="fast" count="2" size="176"/ >
< total type="rest" count="7" size="10119"/ >
< system type="current" size="135168"/ >
< system type="max" size="135168"/ >
< aspace type="total" size="135168"/ >
< aspace type="mprotect" size="135168"/ >
< /heap >
< heap nr="3" >
< sizes >
< size from="65" to="80" total="80" count="1"/ >
< /sizes >
< total type="fast" count="1" size="80"/ >
< total type="rest" count="0" size="0"/ >
< system type="current" size="139264"/ >
< system type="max" size="139264"/ >
< aspace type="total" size="139264"/ >
< aspace type="mprotect" size="139264"/ >
< /heap >
< total type="fast" count="827" size="54896"/ >
< total type="rest" count="570" size="239114"/ >
< total type="mmap" count="0" size="0"/ >
< system type="current" size="1769472"/ >
< system type="max" size="1785856"/ >
< aspace type="total" size="1769472"/ >
< aspace type="mprotect" size="1769472"/ >
< /malloc >
  1. nr即arena,通常一個線程一個
  2. 上面說了,大小在一定范圍內的內存,會放到一個鏈表里,這就是其中一個鏈表。from是內存下限,to是上限,上面的意思是內存分配在 [17,32]范圍內的空閑內存總共有97個,占3104字節內存。在這個區間內的內存申請都會被對齊為32,故total = to * count
  3. 即fastbin這鏈表當前有2個空閑內存塊,大小為176

除fastbin以外,所有鏈表空閑的內存數量,以及內存大小。因此fast和rest加起來,應該和當前arena里所有的size一致,如

< heap nr="2" >
< sizes >
< size from="33" to="48" total="48" count="1"/ >
< size from="113" to="128" total="128" count="1"/ >
< size from="65" to="65" total="65" count="1"/ >
< unsorted from="81" to="3233" total="10054" count="6"/ >
< /sizes >
< total type="fast" count="2" size="176"/ >
< total type="rest" count="7" size="10119"/ >

前兩個to大小為48和128為fast bin,數量為2,剩下的都為rest,與下面的fast和reset對應。

  1. 使用mmap分配的當前在使用塊數(count)和當前在用的內存大小(size)(低版本glibc無此字段,如centos6上的glibc 2.12)
  2. 當前已經申請的內存大小
  3. 歷史上申請的內存大?。òㄒ呀洑w還給操作系統的)
  4. total和mprotect看源碼沒看出是什么東西

到這里可以看到,假如一個進程fast和reset里的數量很多,那么說明這個進程其實緩存了很多內存。另外這里都是直接用gdb attach到一個進程直接調用函數,打印到stdout。如果需要查看的程序被關掉了stdout或者重定向了stdout(很多服務器進程都這么做),那可能看不見了,或者信息不是打印到當前終端。

4. 內存利用率

如果一個進程占用的內存遠高于預期,但沒有持續上漲,還需要考慮下是不是內存使用率的問題。當使用new分配一塊內存時,系統需要為這次分配記錄大小、地址,分配的內存也需要對齊,假如分配的內存很小(比如說1b),那系統最終需要消耗的內存是遠大于1b的。比如

#include < cstring >
#include < iostream >

int main()
{
#define PAUSE(msg) std::cout < < msg < < std::endl; std::cin > > p

    char p = NULL;

    size_t total = 0;
    while (total < 1024 * 1024 * 1024)
    {
        size_t size = rand() % 16;

        total += size;
        char *p = new char[size];
    }

    PAUSE("pause");

這個程序每次分配小于16字節的內存,直到總分配量到1G,然而,在我的系統里(ubuntu 20.04),這個程序跑起來占用的內存就多得多

進程號 USER      PR  NI    VIRT    RES    SHR    %CPU  %MEM     TIME+ COMMAND  
   4174 root      20   0 4479488   4.3g   1616 S   0.0  59.0   0:15.97 ./a.out

已經達到了4.3G,顯然內存利用率只有1/4不到。你也許會說這種分配小內存的情況不多,但其實不是的。舉個例子,做關鍵字搜索時,會用到二叉搜索樹,每一個樹的節點對應一個字符,比如"abcd“就需要分配4個節點,但是每個節點其實很小。假如關鍵字很多(上百萬還是很常見的),那這個問題就比較嚴重。這時候就應該使用valgrind massif來看下,到底是哪個地方分配的內存,然后根據邏輯優化即可。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 程序
    +關注

    關注

    117

    文章

    3795

    瀏覽量

    81405
  • C++
    C++
    +關注

    關注

    22

    文章

    2114

    瀏覽量

    73854
  • 內存管理
    +關注

    關注

    0

    文章

    168

    瀏覽量

    14188
  • 進程
    +關注

    關注

    0

    文章

    204

    瀏覽量

    13995
收藏 人收藏

    評論

    相關推薦

    Linux C++程序內存管理的理論基礎

    在互聯網的服務中,C++常用于搭建高性能、高并發、大流量、低延時的后端服務。如何合理的分配內存滿足系統高性能需求是一個高頻且重要的話題,而且因為內存自身的特點和實際問題的復雜,組合出了諸多難題。
    發表于 10-13 14:27 ?489次閱讀

    一文詳解Linux C++內存管理

    在互聯網的服務中,C++常用于搭建高性能、高并發、大流量、低延時的后端服務。如何合理的分配內存滿足系統高性能需求是一個高頻且重要的話題,而且因為內存自身的特點和實際問題的復雜,組合出了諸多難題。
    發表于 10-25 12:02 ?815次閱讀

    深入C++內存管理

    說到 C++內存管理,我們可能會想到??臻g的本地變量、堆上通過 new 動態分配的變量以及全局命名空間的變量等,這些變量的分配位置都是由系統來控制管理的,而調用者只需要考慮變量的生
    發表于 11-12 09:29 ?644次閱讀

    Visual C++ 6.0程序設計--內存管理

    Visual C++ 6.0程序設計--內存管理共享內存頁,內存映射文件,虛擬內存 
    發表于 10-15 11:46

    C++內存泄漏

    C++內存分配與釋放均由用戶代碼自行控制,靈活的機制有如潘多拉之盒,即讓程序員有了更廣的發揮空間,也產生了代代相傳的內存泄漏問題。對于新手來說,最常
    發表于 09-15 17:39 ?16次下載

    C++設計高校學籍管理設計與實驗

    C++設計高校學籍管理設計與實驗
    發表于 12-30 15:04 ?2次下載

    C++內存泄漏分析方法

    C++是一種非常流行的計算機編程語言,在使用的過程中容易出現內存泄漏問題,而該問題往往難以識別。給出了一種對C++內存泄漏問題進行分析的方法,該方法得到
    發表于 11-23 11:19 ?5次下載
    <b class='flag-5'>C++</b><b class='flag-5'>內存</b>泄漏分析方法

    干貨 | 嵌入式C語言的內存管理

    很多工程師都知道,C/C++語言與其他語言不同,它需要開發者自己管理內存資源,動態內存使用不當,容易造成段錯誤或者
    的頭像 發表于 07-23 14:32 ?4968次閱讀

    C++內存管理技術的詳細資料說明

    內存管理C++最令人切齒痛恨的問題,也是C++最有爭議的問題,C++高手從中獲得了更好的性能,更大的自由,
    發表于 03-14 08:00 ?4次下載

    C++內存管理的詳細資料講解

    程序員們經常編寫內存管理程序,往往提心吊膽。如果不想觸雷,唯一的解決辦法就是發現所有潛伏的地雷并且排除它們,躲是躲不了的。本文的內容比一般教科書的要深入得多,讀者需細心閱讀,做到真正地通曉內存
    發表于 03-17 16:59 ?6次下載

    C++內存管理詳細介紹

    引言 說到 C++內存管理,我們可能會想到??臻g的本地變量、堆上通過 new 動態分配的變量以及全局命名空間的變量等,這些變量的分配位置都是由系統來控制管理的,而調用者只需要考慮
    的頭像 發表于 01-11 10:31 ?2787次閱讀

    C++內存管理全景指南

    C++的高抽象層次,又兼具高性能,是其他語言所無法替代的,C++標準保持穩定發展,更加現代化,更加強大,更加易用,熟練的 C++ 工程師自然也獲得了“高水平、高薪資”的名聲,但在各種活躍編程語言中,
    的頭像 發表于 03-03 15:05 ?3421次閱讀
    <b class='flag-5'>C++</b><b class='flag-5'>內存</b><b class='flag-5'>管理</b>全景指南

    百度工程師帶你探秘C++內存管理

    查看該線程的私有變量中是否已經存在一個分配區并對其進行加鎖操作,如果加鎖成功,則使用該分配區分配內存;如果未找到該分區或加鎖失敗,遍歷環形鏈表中獲取一個未加鎖的分配區
    的頭像 發表于 12-20 09:32 ?630次閱讀

    C++內存管理operator new和placement new

    最近在看一些C++資料的過程中,說到在初始化列表中使用關鍵字new來分配新內存不是異常安全的,應該使用運算符new。
    的頭像 發表于 07-22 09:58 ?874次閱讀
    <b class='flag-5'>C++</b><b class='flag-5'>內存</b><b class='flag-5'>管理</b>operator new和placement new

    嵌入式C++內存管理的應用程序

    說到 C++內存管理,我們可能會想到??臻g的本地變量、堆上通過 new 動態分配的變量以及全局命名空間的變量等,這些變量的分配位置都是由系統來控制管理的,而調用者只需要考慮變量的生
    發表于 10-12 10:37 ?416次閱讀
    嵌入式<b class='flag-5'>C++</b><b class='flag-5'>內存</b><b class='flag-5'>管理</b>的應用程序
    百家乐真钱斗地主| 现场百家乐牌路分析| 真人百家乐官网国际第一品牌| 百家乐官网怎么下注能赢| 台前县| 大发888在线登陆| 英皇国际娱乐| 百家乐官网案件讯问| 百家乐官网棋牌公式| 百家乐官网游戏论坛| 金城百家乐官网玩法平台| 百家乐官网扑克多少张| 百家乐官网一般多大码| 万龙百家乐官网的玩法技巧和规则 | 百家乐群详解包杀| 大发888娱乐捕鱼游戏| 网上棋牌游戏赚钱| 百家乐官网分析资料| 百家乐官网出千赌具| 百家乐官网菲律宾| 百家乐投注法则| 百家乐娱乐优惠| 新世百家乐的玩法技巧和规则| 水果机万能遥控器| 百家乐玩法| 百家乐官网庄闲的比例| 百家乐官网是娱乐场| 百家乐筹码套装| 大发888国际娱乐城lm0| 至尊娱乐| 怎么看百家乐官网路单| 百家乐注册送彩金平台| 百家乐纯技巧打| 大发888老虎机官方| 霍林郭勒市| 兰桂坊百家乐官网的玩法技巧和规则 | 木星百家乐官网的玩法技巧和规则| 百家乐有哪些注| 百家乐平注法到656| 新利国际娱乐网| 南宁百家乐官网赌机|