cpinfo & 健康檢查¶
開 TAC case 時,原廠第一句常是「請提供 cpinfo」。cpinfo 是一份把系統設定、版本、狀態全打包起來的診斷檔。會收這份資料,是跟原廠往來的基本功。
cpinfo 是什麼¶
cpinfo 收集一台設備的完整診斷快照:版本與 JHF、設定、路由、介面、程序狀態、部分 Log 等,打包成一個檔給 TAC 分析。
# 產生完整 cpinfo(expert),輸出成檔
cpinfo -z -o /var/log/cpinfo_$(hostname).txt
# -z 壓縮、-o 指定輸出檔
# 只快速看版本與 JHF(不產檔)
cpinfo -y all
檔案放哪、怎麼給 TAC
產出的 cpinfo 檔通常上傳到 case。檔案可能不小,從 Gateway 用 SCP 拉回管理端再上傳。Management 與 Gateway 各收一份,TAC 才有完整環境資訊。
日常健康檢查指令¶
開 case 前,先自己跑一輪,常常當場就找到問題:
# 版本 / JHF
cpinfo -y all
fw ver
# 程序看門狗:所有 CP 程序是否正常(E=running)
cpwd_admin list
# 策略狀態
fw stat
# 即時效能(CPU / 記憶體 / 連線 / 吞吐)
cpview
# 加速狀態
fwaccel stat
# 連線數 / 連線表
fw tab -t connections -s # 連線表大小
# 叢集狀態(ClusterXL)
cphaprob stat
cphaprob -l list # 看 pnote / 哪個 device 讓它 down
# 磁碟 / 記憶體
df -h
free -m
收 case 前的自我檢查清單¶
| 檢查 | 指令 | 看什麼 |
|---|---|---|
| 版本一致 | cpinfo -y all |
叢集 / Maestro 各成員版本 + JHF 是否相同 |
| 程序正常 | cpwd_admin list |
有沒有程序一直重啟(T 欄位次數) |
| 策略已裝 | fw stat |
策略名稱與時間是否正確 |
| 資源 | cpview / df -h / free -m |
CPU、記憶體、磁碟有沒有爆 |
| 叢集 | cphaprob stat |
角色(Active/Standby)與健康 |
磁碟滿是隱形殺手
/var/log 滿了會引發各種詭異問題(Log 寫不進、服務異常)。df -h 先看,滿的話清舊 Log / 舊 CPUSE 套件(見 CPUSE / JHF)。
版本提醒
cpinfo、cpview、cpwd_admin、cphaprob 等診斷指令在 R81.10 ~ R82.10 一致。Maestro 環境另有 asg 系列指令做整組健檢(見 asg 指令與監看)。建議用較新版本的 cpinfo(會自動更新收集範圍)。
小結¶
cpinfo是開 TAC case 必備的完整診斷快照,Management 與 Gateway 各收一份。- 開 case 前先自跑健康檢查:
cpwd_admin list、fw stat、cpview、cphaprob stat、df -h。 - 磁碟 / 記憶體 / 版本一致性是最常見的根因,先排除。