1. 监控AGENT版本说明
版本2:
解决进程采集太耗CPU的问题。
版本3:
进程监控匹配方式改成“包含”字符。
修改了进程启动时间的获取方式。
进程监控指标node_process_time改成node_process_etime。
端口监控状态区分端口是否是开放的。
版本4:
没有监控项时跳过进程和端口监控。
版本5:
没有安装sar或者ss命令时,返回采集状态3。
版本6:
进程监控和端口监控添加app字段。
版本7:
处理HTTP协议,确保大的携带数据能正确匹配,避免过早关闭连接。
版本8:
兼容只安装普罗米修斯node exporter的情况,本程序只作为代理。
版本9:
端口和进程监控,名称支持下划线和减号。
版本10:
添加文件、目录、软链接监控功能。
版本11:
sar 监控去掉下面两个指标,有的机器没有gnice指标。
node_cpu_gnice_percent_summary
node_cpu_gnice_percent
版本12:
url 监控支持指定Host头
版本13:
执行命令时,通过AnyEvent从管道中实时获取数据,避免堵塞导致插件超时。
版本14:
修复上一个版本已入的bug,不要提前退出。
版本15:
磁盘监控命令df添加-P参数,增强可移植性。
有的情况下df的输出为了展示美观进行了换行,这样会导致匹配内容错误,添加-P参数后避免该情况。
版本16:
磁盘监控,去掉-l参数,网络盘也进行监控【如:nfs盘】
版本17:
debug时显示后端url信息。
版本18:
修复13版本引入的异常,导致CPU使用率高。【13-17版本的要升级到该版本】。
版本19:
NodeExporter 在作为代理的时候,扩展了nodeext(外部数据)采集,代理需要更新才能识别外部数据采集的URL。
否则可能返回的是代理节点的metrics数据(外部采集的uri刚好包含 /metrics的情况下)。或者采集不到数据。
版本20:
进程监控添加了debug日志,方便定位在报进程重启时无法找到当时匹配到的进程。
版本21:
进程监控支持字符":", 有的进程名会包含有冒号,如: "nginx: master process nginx"
版本22:
主机如果已经安装了node_exporter,并且监听在一个具体的ip上,监控agent会尝试找到这个ip。
避免已经安装了node_exporter的情况下采集不到原生的node_exporter数据。
版本23:
采集agent中的公钥列表,用于后续公钥定期替换。
版本24:
HTTP监控,post请求,支持配置简单的数据post到接口中.
HTTP监控返回内容匹配,匹配的内容可能有特殊的字符,支持通过base64进行编码
版本25:
为了兼容普罗米修斯的格式,把通过push上来的数据指标名中的“.”和“-“字符修改成下划线.
通过Content-Length字段来判定http数据完整,有的push请求,一次push上来很多数据,一次读取不完,需要等待Content-Length长度,
否则因为数据不全时把数据转换成json失败,导致push失败,最终数据没有上传到普罗米修斯中。
版本26:
采集FalconMigrate(falcon兼容程序)的状态数据,包括版本、错误数量等。
处理Http插件body为空时日志中的警告。
版本27:
bootstrap中没有falcon_migrate的启动文件的情况下,不请求1988端口采集数据,直接返回-1。避免无效的http请求。
版本28:
添加统计指标,统计通过push方式上传的数据数量和错误数量。
版本29:
支持通过/opt/mydan/dan/agent.mon/exttag.yml文件,给通过push上传的数据追加额外的标签。
版本30:
支持通过/opt/mydan/dan/agent.mon/exttag_by_endpoint/**.yml文件,给通过push上传的数据,针对endpoint数据追加标签。
其中/opt/mydan/dan/agent.mon/exttag_by_endpoint/下面的文件名是endpoint的名字。
版本31:
携带数据,让falcon兼容程序,识别ecs的时候,实例id中允许有减号。
版本32:
处理通过push上来的数据中的step标记。
有的数据5分钟push一次,step为300。如果不处理step,会导致因为数据不是1分钟push异常会被判定为过期数据而删除掉。
版本33:
添加linux的ss命令的监控采集。
版本34:
添加ping监控的功能。
版本35:
监控进程时,进程名字不在限制字符,要限制字符的逻辑在c3主服务进行控制即可。
版本36:
添加物理磁盘使用率指标的采集。这个区别于磁盘使用率,统计的是物理盘。
版本37:
物理磁盘统计,不再统计别名。
版本38:
通过push方式上传的数据,如果tag名字中包含"."或者"-", 自动替换成下划线
版本39:
通过push方式上传的数据,允许字符“/”,有的标签写的是文件路径
版本40:
通过push方式上传的数据,允许字符“:”, endpoint可能是“ip:端口”的格式
版本41:
通过push方式上传的数据,metric中如果有空格,替换成下划线。
版本42:
采集开启了端口的进程信息,用于服务发现。
版本43:
通过文件标志控制释放开启端口进程的数据采集。有的环境可能不需要采集这部分数据。
版本44:
添加服务发现模块,发现主机上的java和nginx服务.
node_collector_error 错误码
-2: 无监控项,采集跳过
-1: 启动中
0: 正常
1: 错误
2: 超时
3: 依赖工具缺失
监控agent的版本指标: node_exporter_version