哪吒面板警告规则

配置tgbot
哪吒面板,顶部导航栏,点报警,添加通知方式

https://api.telegram.org/botXXXXXX/sendMessage?chat_id=YYYYYY&text=#NEZHA#
参数获取说明:botXXXXXX 中的 XXXXXX 是在 telegram 中关注官方 @Botfather ,输入/newbot ,创建新的机器人(bot)时,会提供的 token(在提示 Use this token to access the HTTP API:后面一行)这里 ‘bot’ 三个字母不可少。创建 bot 后,需要先在 telegram 中与 BOT 进行对话(随便发个消息),然后才可用 API 发送消息。YYYYYY 是 telegram 用户的数字 ID。与机器人@userinfobot 对话可获得。

然后添加,报警规则,以下表示小鸡离线10s后就会报警通知到tgbot

[{“Type”:”offline”,”Duration”:10}]
详细的报警规则设置见下方
报警规则说明
基本规则
type:可选取一个或多个类型,如在一个规则中选择了多个类型,需要同时满足所有选择的类型才会触发通知(可参考后面的示例)
cpu、memory、swap、disk
net_in_speed 入站网速、net_out_speed 出站网速、net_all_speed 双向网速、transfer_in 入站流量、transfer_out 出站流量、transfer_all 双向流量
offline 离线监控
load1、load5、load15 负载
process_count 进程数 目前取线程数占用资源太多,暂时不支持
tcp_conn_count、udp_conn_count 连接数
duration:持续数秒,数秒内采样记录 30% 以上触发阈值才会报警(防数据插针)
min 或 max:
流量、网速类数值 为字节(1KB=1024B,1MB = 1024*1024B)
内存、硬盘、CPU 以占用百分比计数
离线监控无需设置此项
cover:
0 监控所有,通过 ignore 忽略特定服务器
1 忽略所有,通过 ignore 监控特定服务器
报警规则分享

会给出具体解释,大家可以根据自己需求自行修改。
名称:离线报警 规则:[{“Type”:”offline”,”Duration”:10}] 解释:每10s坚持一次,如果离线会发通知。(10s感觉太短,我改成600,也就是10分钟感觉比较合适)

名称:CPU过高警告 规则:[{“type”:”cpu”,”max”:90,”duration”:300}] 解释:CPU超过90%发通知警告。300s一周期。(90和300自行修改为自己合适)

名称:内存过高警告 规则:[{“type”:”memory”,”max”:90,”duration”:300}] 解释:内存占用超过90%发通知警告,300s一周期。(90和300自行修改为自己合适)

名称:硬盘即将爆满 规则:[{“type”:”disk”,”max”:80,”duration”:43200}] 解释:硬盘占用超过80%发通知警告,12小时一周期。(80和43200自行修改为自己合适)

名称:TCP链接过多异常 规则:[{“type”:”tcp_conn_count”,”max”:20,”duration”:300}] 解释:TCP链接数超过20个发通知报警,300s为周期。

名称:出站网速过快警告 规则:[{“type”:”net_out_speed”,”max”:524288000,”duration”:300}] 解释:出站网速超过500M警告发通知,周期为300s。(524288000和300自行修改为自己合适)

名称:周期内流量警告

规则:

[{“type”:”transfer_out_cycle”,”max”:1099511627776,”cycle_start”:”2022-01-01T00:00:00+08:00”,”cycle_interval”:1,”cycle_unit”:”month”,”cover”:1,”ignore”:{“3”:true,”4”:true}}]

解释:ID 为 3 和 4 的服务器(ignore 里面定义),以每月 1 号为统计周期,周期内统计的出站月流量达到 1TB 时报警

type之中transfer_out_cycle表示周期内的入站流量。大家可以修改为transfer_out_cycle 周期内的出站流量、 transfer_all_cycle 周期内双向流量和
max之后的1099511627776为1TB流量,这里使用的单位应该是B,大家可以自行修改。如:200GB为214748364800
cycle_start: 是统计周期开始日期(可以是你机器计费周期的开始日期),时间格式为RFC3339,例如北京时间为2022-01-11T08:00:00.00+08:00
cycle_interval:每隔多少个周期单位(例如,周期单位为天,该值为 7,则代表每隔 7 天统计一次)
cycle_unit 统计周期单位,默认hour,可选(hour, day, week, month, year)
cover参考基本规则 【0 监控所有,通过 ignore 忽略特定服务器 、1 忽略所有,通过 ignore 监控特定服务器】
ignore内定义要监控的VPS 的ID。