- 简介
- 目录大纲
- 最新文档
- 文集下载
用VictoriaMetrics替换Prometheus扛住百万级采集
在云原生体系全面普及的当下,监控系统已成为稳定性工程(SRE)与可观测性(Observability)的基础设施。随着企业规模不断扩大,业务组件、微服务实例、Kubernetes 集群节点以及各种基础设施设备的数量呈指数级增长,指标采集层的性能瓶颈逐渐成为可观测性领域的新挑战。 Prometheus 作为事实上的监控标准,生态成熟、部署简单、查询能力强。然而,它在架构设计上的一些“天然限制”也逐步……
Nathan - 2025年12月8日 18:05
PromQL查询函数参考
一、概述 Prometheus 查询语言(PromQL)提供了一系列内置函数,用于对时序数据进行数学运算、统计分析、标签处理及预测分析等操作。 这些函数可接受不同类型的输入参数(如瞬时向量 instant-vector、区间向量 range-vector、标量 scalar 等),并返回相应类型的计算结果。 本文档对 PromQL 中常用的函数进行系统整理与说明,涵盖函数的语法定义、参数类型、功能……
Nathan - 2025年11月13日 13:48
Prometheus 联邦机制中的 out-of-order samples与 up 指标波动问题
引言 在 Prometheus 监控系统中,联邦机制(Federation) 是一种常见的架构设计,用于跨层级聚合监控数据。 然而,在实际使用中,可能会遇到一些问题: 联邦抓取时出现 out-of-order samples 错误日志 部分一级节点下的 up 指标出现异常波动(间歇性下线) 仅某个特定一级节点存在问题,其他节点数据正常 本文将从 问题现象、根本原因、排查方法、解决方案 等多个维……
Nathan - 2025年11月13日 13:43