找回密码
 注册
广告投放 虚位以待【阿里云】2核2G云新老同享 99元/年,续费同价做网站就用糖果主机-sugarhosts.comJtti.com-新加坡服务器,美国服务器,香港服务器
查看: 565|回复: 0

实现对网络和系统的监控

[复制链接]
发表于 2010 年 10 月 2 日 18:26:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×

1、为什么要实现监控

更好的提供服务,让用户得到更好的体验,例如通过监控的趋势分析发现服务器性能上的瓶颈,通过有效提报警机制在用户之前发现服务不可用之前,我们发现并解决故障

通过事件追溯等,我们可以对某种服务质量做出评估,这一点可以体现在商业价值上

2、监控的分类

通实业务需求来分类的话可分为可用性监控和性能监控

  • 可用性监控: 包括硬件的可用和软件及一套应用的可用,其方法主要有
  • 硬件装态 例如raid 的状态,可以确定硬盘的故障,一般有BMC芯片的机器如DELL 可通过Openipmi来实现
  • 检查其进程是否正常运行,linux  进程正常都会有一个状态,能过监控这个进程是否存活等
  • 模拟客户端 例如模拟浏览器的行为来监控WEB服务的可用
  • 性能监控: 性能监控一般用于趋势分析,一般如应用程序的性能,系统的性能和网络的性能,例如WEB服务器的性能衡量参数之一的吞吐率,和用户请求等待时间和请求处理时间等参数。系统性能包括CPU 等资源的使用状况,网络性能例如当前的带宽使用,响应时间及抖动等,当然这个还可以分为实时监控(相对)和非实时监控,如建立baseline 和性能调优,排错等一般会用到实时监控。

3、 基本实现思想

  • 监控域的确定及监控功能的实现
  • 报警机制的实现
  • 事件处理流程, 事前(趋势分析),事中(应急响应),事后(原因追溯,故障记录,故障外报)
  • 事件的审计 历史记录查看 故障记录 故障外报

4、 确定需要监控的项目

  • 系统
  • CPU:user%, system%, iowait&, nice%, idle%
  • MEM:swap, memused, memfree
  • Interface:traffic in, traffic out  Total in/out
  • Disk:used, free, total
  • User:current users
  • Process: current process
  • I/O:read, write
  • Loadavage:1m, 5m, 15m
  • 交换机网络设备
  • Interface:traffic in, traffic out. Total in/out
  • Mem:used, free, total
  • CPU:current use
  • 应用服务
  • Apache:···
  • Jboss:······
  • DNS:····
  • Mysql····
  • Oracle····

5、 用到的工具

Cacti,  这些工具可以实现对网络流量,响应时间,系统资源使用,What’s up, shell,scripts :可实现业务及服务可用性的监控



Jgwy.Com - Free Web Hosting Guide & Directory In China since 2001! Jgwy.Net-Jglt.Net
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|金光论坛

GMT+8, 2025 年 2 月 3 日 13:10 , Processed in 0.025476 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表