版本说明
本文为您介绍监控代理(UBoltAgent)的版本发布信息。
1.3.4
| 分类 | 说明 |
|---|---|
| 2026-5-20 | |
| 1. 修复进程监控空列表状态更新问题 2.修复裸金属GPU监控指标:解码器使用率(cloudwatch_uphost_gpu_utilization_decoder)、编码器使用率(cloudwatch_uphost_gpu_utilization_encoder)采集异常问题 |
1.3.3
| 分类 | 说明 |
|---|---|
| 发布时间 | 2026-4-9 |
| 问题修复 | 1.修复在GPU驱动异常时,可能因异常处理不充分导致程序崩溃的问题 |
1.3.2
| 分类 | 说明 |
|---|---|
| 2026-4-2 | |
| 新特性: 1. 支持A800 GPU云主机采集RDMA网卡流量数据(需更改配置启动采集) • cloudwatch_rdma_port_xmit_rate(RDMA端口出速率) • cloudwatch_rdma_port_rcv_rate(RDMA端口入速率) • cloudwatch_rdma_port_xmit_packets(RDMA端口出包量) • cloudwatch_rdma_port_rcv_packets(RDMA端口入包量) | |
| 修复linux安装脚本在某些环境下因grep查询异常导致的无法安装问题 |
1.3.0
| 分类 | 说明 |
|---|---|
| 2025-12-5 | |
| 1. 云主机新增指标: CPU 类指标: • cloudwatch_cpu_usage_usr(用户空间 CPU 占比) • cloudwatch_cpu_usage_sys(内核空间 CPU 占比) • cloudwatch_cpu_usage_idle(CPU 空闲时间占比) • cloudwatch_cpu_usage_iowait(I/O 等待时间占比) • cloudwatch_cpu_usage_irq(硬件中断时间占比) • cloudwatch_cpu_usage_softirq(软中断时间占比) • cloudwatch_cpu_usage_steal(CPU 抢占时间占比) 内存类指标: • cloudwatch_memory_system_usage(系统内存使用率) 进程类指标: • cloudwatch_process_cpu_usage(进程 CPU 使用率) • cloudwatch_process_mem_usage(进程内存使用率) • cloudwatch_process_open_files(进程打开文件数) • cloudwatch_process_match_count(匹配到的进程数) 2.裸金属云主机新增指标: CPU 类指标: • cloudwatch_uphost_cpu_usage_usr(用户空间 CPU 占比) • cloudwatch_uphost_cpu_usage_sys(内核空间 CPU 占比) • cloudwatch_uphost_cpu_usage_idle(CPU 空闲时间占比) • cloudwatch_uphost_cpu_usage_iowait(I/O 等待时间占比) • cloudwatch_uphost_cpu_usage_irq(硬件中断时间占比) • cloudwatch_uphost_cpu_usage_softirq(软中断时间占比) • cloudwatch_uphost_cpu_usage_steal(CPU 抢占时间占比) 内存类指标: • cloudwatch_uphost_memory_system_usage(系统内存使用率) 进程类指标: • cloudwatch_uphost_process_cpu_usage(进程 CPU 使用率) • cloudwatch_uphost_process_mem_usage(进程内存使用率) • cloudwatch_uphost_process_open_files(进程打开文件数) • cloudwatch_uphost_process_match_count(匹配到的进程数) | |
| 修复 Linux 内核 3.14 及以上版本中内存使用率计算异常的问题。 |
1.0.2
| 分类 | 说明 |
|---|---|
| 2025-11-6 | |
| 1. 增加对内存ECC错误数指标的监控 a. cloudwatch_uphost_memory_ecc_errors(内存ECC错误数) b. cloudwatch_uphost_memory_noinfo_ecc_errors(无法定位的内存ECC错误) | |
| 1. 解决gpu掉卡时,可能导致UBoltAgent崩溃的问题 2. 修复部分TCP状态指标采集异常问题,包括: a. cloudwatch_uphost_tcp_closed_count(TCP_CLOSED_状态数) b. cloudwatch_uphost_tcp_syn_recv_count(TCP_SYN_RECEIVED_状态数) c. cloudwatch_uphost_tcp_fin_wait1_count(TCP_FIN_WAIT1_状态数) d. cloudwatch_uphost_tcp_fin_wait2_count(TCP_FIN_WAIT2_状态数) |