<tbody id="2ptay"><noframes id="2ptay">

一次解決Linux內核內存泄漏實戰(zhàn)全過程

2021/02/21 作者：Linux閱碼場

236

加入交流群

掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

什么是內存泄漏：

程序向系統(tǒng)申請內存，使用完不需要之后,不釋放內存還給系統(tǒng)回收，造成申請的內存被浪費.

發(fā)現(xiàn)系統(tǒng)中內存使用量隨著時間的流逝，消耗的越來越多，例如下圖所示：

接下來的排查思路是:

1.監(jiān)控系統(tǒng)中每個用戶進程消耗的PSS (使用pmap工具(pmap pid)).

PSS:按比例報告的物理內存，比如進程A占用20M物理內存，進程B和進程A共享5M物理內存，那么進程A的PSS就是(20 - 5) + 5/2 = 17.5M

2.監(jiān)控/proc/meminfo輸出,重點觀察Slab使用量和slab對應的/proc/slabinfo信息

3.參考/proc/meminfo輸出，計算系統(tǒng)中未被統(tǒng)計的內存變化，比如內核驅動代碼

直接調用alloc_page()從buddy中拿走的內存不會被單獨統(tǒng)計

以上排查思路分別對應下圖中的1,2,3 :

在排查的過程中發(fā)現(xiàn)系統(tǒng)非?？臻e，都沒有跑任何用戶業(yè)務進程。

其中在使用slabtop監(jiān)控slab的使用情況時發(fā)現(xiàn)size-4096 不停增長

通過監(jiān)控/proc/slabinfo也發(fā)現(xiàn)SReclaimable 的使用量不停增長

while true; do sleep 1 ; cat /proc/slabinfo >> /tmp/slabinfo.txt ; echo "===" >> /tmp/slabinfo.txt ; done

由此判斷很可能是內核空間在使用size-4096 時發(fā)生了內存泄漏.

接下來使用trace event(tracepoint)功能來監(jiān)控size-4096的使用和釋放過程，

主要用來跟蹤kmalloc()和kfree()函數(shù)對應的trace event, 因為他們的trace event被觸發(fā)之后會打印kmalloc()和kfree()所申請和釋放的內存地址,然后進一步只過濾申請4096字節(jié)的情況。

#trace-cmd record -e kmalloc -f 'bytes_alloc==4096' -e kfree -T

(-T 打印堆棧)

等待幾分鐘之后…

#ctrl ^c 中斷trace-cmd

#trace-cmd report

以上步驟相當于：

等待幾分鐘之后…

#cp /sys/kernel/debug/tracing/trace_pipe  /tmp/kmalloc-trace

從trace-cmd report的輸出結果來看，很多kmalloc 對應的ptr值都沒有kfree與之對應的ptr值

這就說明了cat進程在內核空間使用size-4096之后并沒有釋放，造成了內存泄漏。

為了進一步精確定位到是使用哪個內核函數(shù)造成的問題，此時手動觸發(fā)vmcore

#echo c > /proc/sysrq-trigger

然后使用crash工具分析vmcore：

#crash ./vmcore ./vmlinux.debug

讀出上面kmalloc申請的ptr內存信息

(讀取0xffff880423744000內存開始的4096個字節(jié)，并以字符形式顯示)

發(fā)現(xiàn)從上面幾個ptr內存中讀出的內容都是非常相似，仔細看一下發(fā)現(xiàn)都是/proc/schedstat 的輸出內容。

通過閱讀相關代碼發(fā)現(xiàn)，當讀出/proc/schedstat內容之后，確實沒有釋放內存

然后發(fā)現(xiàn)kernel上游已經有patch解決了這個問題：

commit: 8e0bcc722289

fix a leak in /proc/schedstats

人工客服
（售后/吐槽/合作/交友）

相關推薦

IMX8X_0N99Z掩碼 0N99Z 的掩碼集勘誤表
資料恩智浦
2580
01/16 10:01
基于瑞薩官方EK-RA6M3開發(fā)板的減震座艙，汽車儀表盤設計與百度云語音識別系統(tǒng)
方案與非網
1517
2024/05/15
從單片機到linux，需要怎么學習
課程凡億教育
2365
04/21 09:36
虹科分享 | 2023Gartner?終端安全發(fā)展規(guī)律周期：AMTD引領未來
方案虹科技術
2415
2023/10/23
5G4G工業(yè)智能網關分布式光伏發(fā)電儲能應用
方案計訊物聯(lián)
1908
2023/09/15
動態(tài)管控數(shù)采儀數(shù)據采集傳輸儀在線監(jiān)測視頻監(jiān)控
方案計訊物聯(lián)
2018
2023/09/15
4G安卓工控機在智能電子屏幕和廣告系統(tǒng)的解決方案
方案鋇錸技術物聯(lián)網關
2791
2023/09/13

登錄即可解鎖

海量技術文章
設計資源下載
產業(yè)鏈客戶資源
寫文章/發(fā)需求

立即登錄

創(chuàng)作中心去發(fā)布

Linux閱碼場

專業(yè)的Linux技術社區(qū)和Linux操作系統(tǒng)學習平臺，內容涉及Linux內核,Linux內存管理,Linux進程管理,Linux文件系統(tǒng)和IO,Linux性能調優(yōu),Linux設備驅動以及Linux虛擬化和云計算等各方各面.

TA的熱門作品

感谢您访问我们的网站，您可能还对以下资源感兴趣：

国产精品综合日本欧美

欧美日韩色国产日韩久久影院电影一区二区三区在线视频观看日本高清视频WWWW色