Prometheus VS InfluxDB

前言

除了传统的监控系统如 Nagios,Zabbix,Sensu 以外,基于时间序列数据库的监控系统随着微服务的兴起越来越受欢迎,比如 Prometheus,比如 InfluxDB。gtt 也尝试了一下这两个系统,希望能找到两者的差别,为以后选型提供一些帮助。

首先,说道时间序列数据库不得不说老牌的 rrdtools 和 graphite,这些经典老系统工作的非常好,除了有人嫌弃它们在巨大规模情景下不 scale,嫌弃它们部署不方便外。于是有了… 查看详细

netdata – Linux 实时监控工具

简介

之前介绍过数据中心基础设施数据库: netbox ,今天介绍的是 linux 的实时监控工具 netdata,亮点是可视化(全部都是图表)和实时,页面刷新间隔是 1s,非常迅速。[点击文章可以查看截图]。

安装

起码在 gtt 写博客的时候,仍然需要从源码安装,安装步骤非常简单,基本按照 github 上的 wiki 来做即可

gtt 使用的是 centos 所以执行这些命令:

$ yum install zlib-devel libuuid-devel libmnl-devel gcc make git autoconf autoconf-archive
查看详细

Linux 到底怎么看内存使用量

前言

说到内存使用率,直觉上似乎内存就像冰箱,塞了东西的地方是已用的,剩下就是空余的。但是在 Linux 中没有这么简单。

Free

查看内存使用情况一般用 free 命令,输出结果大多是这样的:

             total       used       free     shared    buffers     cached
Mem:         16066      15390        676          0        305       4208
-/+ buffers/cache:      10878       5190
Swap:         4095        108       3987

这和冰箱完全不一样。除了total used free 外,shared,buffers,cached 的含义都让新手十分困惑。

先看第一行的 6 个数字:

Total 很好理解,内存总量,如下图所示。… 查看详细

解决 ‘blocked for more than 120 seconds’

问题概要

内核版本: 2.6.32-573.el6.x86_64
发行版:centos-release-6-4.el6

在日志文件 /var/log/message 中发现:

Sep 26 13:01:57 localhost kernel: [<ffffffff811b1ba2>] ? alloc_fd+0x92/0x160
Sep 26 13:01:57 localhost kernel: [<ffffffff8118e867>] do_sys_open+0x67/0x130
Sep 26 13:01:57 localhost kernel: [<ffffffff8118e970>] sys_open+0x20/0x30
Sep 26 13:01:57 localhost kernel: [<ffffffff8100b0d2>] system_call_fastpath+0x16/0x1b
Sep 26 13:01:57 localhost kernel: INFO: task xxxxxx:22455 blocked for more than
查看详细

Linux 的多线程下载工具 Axel

Axel [‘æksl]

中文意思:(花样滑冰)前外一周半跳。
Axel jump

一个多线程,支持断点续传的下载工具,如果你嫌 wget 下载慢,可以试试它。

安装

ubuntu/debian

sudo apt-get install axel

centos/redhat,默认源里没有:

wget -c http://pkgs.repoforge.org/axel/axel-2.4-1.el6.rf.x86_64.rpm
rpm -ivh axel-2.4-1.el6.rf.x86_64.rpm

使用

axel  http://s.gaott.info/go1.7.1.linux-amd64.tar.gz
axel -n 2 http://s.gaott.info/go1.7.1.linux-amd64.tar.gz # 最多2个连接同时下载
查看详细