跳轉到

cpinfo & 健康檢查

開 TAC case 時,原廠第一句常是「請提供 cpinfo」。cpinfo 是一份把系統設定、版本、狀態全打包起來的診斷檔。會收這份資料,是跟原廠往來的基本功。

cpinfo 是什麼

cpinfo 收集一台設備的完整診斷快照:版本與 JHF、設定、路由、介面、程序狀態、部分 Log 等,打包成一個檔給 TAC 分析。

# 產生完整 cpinfo(expert),輸出成檔
cpinfo -z -o /var/log/cpinfo_$(hostname).txt
#   -z 壓縮、-o 指定輸出檔

# 只快速看版本與 JHF(不產檔)
cpinfo -y all

檔案放哪、怎麼給 TAC

產出的 cpinfo 檔通常上傳到 case。檔案可能不小,從 Gateway 用 SCP 拉回管理端再上傳。Management 與 Gateway 各收一份,TAC 才有完整環境資訊。

日常健康檢查指令

開 case 前,先自己跑一輪,常常當場就找到問題:

# 版本 / JHF
cpinfo -y all
fw ver

# 程序看門狗:所有 CP 程序是否正常(E=running)
cpwd_admin list

# 策略狀態
fw stat

# 即時效能(CPU / 記憶體 / 連線 / 吞吐)
cpview

# 加速狀態
fwaccel stat

# 連線數 / 連線表
fw tab -t connections -s        # 連線表大小

# 叢集狀態(ClusterXL)
cphaprob stat
cphaprob -l list                # 看 pnote / 哪個 device 讓它 down

# 磁碟 / 記憶體
df -h
free -m

收 case 前的自我檢查清單

檢查 指令 看什麼
版本一致 cpinfo -y all 叢集 / Maestro 各成員版本 + JHF 是否相同
程序正常 cpwd_admin list 有沒有程序一直重啟(T 欄位次數)
策略已裝 fw stat 策略名稱與時間是否正確
資源 cpview / df -h / free -m CPU、記憶體、磁碟有沒有爆
叢集 cphaprob stat 角色(Active/Standby)與健康

磁碟滿是隱形殺手

/var/log 滿了會引發各種詭異問題(Log 寫不進、服務異常)。df -h 先看,滿的話清舊 Log / 舊 CPUSE 套件(見 CPUSE / JHF)。

版本提醒

cpinfocpviewcpwd_admincphaprob 等診斷指令在 R81.10 ~ R82.10 一致。Maestro 環境另有 asg 系列指令做整組健檢(見 asg 指令與監看)。建議用較新版本的 cpinfo(會自動更新收集範圍)。

小結

  • cpinfo 是開 TAC case 必備的完整診斷快照,Management 與 Gateway 各收一份。
  • 開 case 前先自跑健康檢查:cpwd_admin listfw statcpviewcphaprob statdf -h
  • 磁碟 / 記憶體 / 版本一致性是最常見的根因,先排除。