monitoring

网络延时参考值

网络延时给人的体验:

延时 体验
 1~30ms 极快,几乎察觉不出有延迟;
 31~50ms 良好,没有明显的延迟情况;
 51~100ms 普通,稍有停顿
 100ms 差,丢包并掉线现象

国内网络延时参考值

跨度 延时
北京-上海 30ms左右
北京-深圳 40ms左右
上海-香港 60ms以内
上海-洛杉矶 180-210之ms间
上海-纽约 230-250ms之间
上海-欧洲 220-330ms之间
查看详细

Prometheus VS InfluxDB

前言

除了传统的监控系统如 Nagios,Zabbix,Sensu 以外,基于时间序列数据库的监控系统随着微服务的兴起越来越受欢迎,比如 Prometheus,比如 InfluxDB。gtt 也尝试了一下这两个系统,希望能找到两者的差别,为以后选型提供一些帮助。

首先,说道时间序列数据库不得不说老牌的 rrdtools 和 graphite,这些经典老系统工作的非常好,除了有人嫌弃它们在巨大规模情景下不 scale,嫌弃它们部署不方便外。于是有了… 查看详细

netdata – Linux 实时监控工具

简介

之前介绍过数据中心基础设施数据库: netbox ,今天介绍的是 linux 的实时监控工具 netdata,亮点是可视化(全部都是图表)和实时,页面刷新间隔是 1s,非常迅速。[点击文章可以查看截图]。

安装

起码在 gtt 写博客的时候,仍然需要从源码安装,安装步骤非常简单,基本按照 github 上的 wiki 来做即可

gtt 使用的是 centos 所以执行这些命令:

$ yum install zlib-devel libuuid-devel libmnl-devel gcc make git autoconf autoconf-archive
查看详细
OpenStack Monitoring

OpenStack Monitoring

OpenStack 是开源 IaaS 解决方案,组件众多,架构复杂,并且技术栈长。随着系统规模不断扩大, 如何快速发现,定位故障,最终处理故障成了一个急需解决的问题。OpenStack 的监控分为三方面:监控、报警;诊断、追踪;故障处理;其中监控和报警是发现问题的第一步,解决的主要问题是在大规模部署 OpenStack 的情况下,如何准确、详尽地报告系统目前情况,及早发现并提示故障发生。… 查看详细