问一下,有没有设备管理是做什么的控和IT运维产品?

2016-10-17更新:跳槽出来做一款运维工具产品了,所以来更新一个广告。运维人员最大的难题就是故障在哪、故障为啥、故障怎么修。而根据微博故障管理的统计,将近百分之八十的故障排查其实只要找到变更时间线就好办了。至于容量规划、性能调优等等等等,最终都可以归类到一类数据上:时间序列机器数据。一个优秀的运维,应该熟练运用自己手头的各种时序数据,包括但不限于:系统日志、性能指标、业务日志等,来解决工作中的各种难题。从2013年开始,ELK的出现给这个领域打开了一扇窗户。但是ELK的二次开发、权限管理、尤其是资源控制等问题也同样明显,我在微博两年的经验,团队先花了一年多的时间,才整出来一个算是能辅助dev和ops都还算好用的数据分析系统。所以,我到了 http://www.rizhiyi.com 转型做PM,做一个最好用的日志分析产品,给广大运维。欢迎大家试用~------------补充陈湛翀 的:
nagios的绘图插件pnp4nagios蛮好用的,我觉得跟学习cacti自制模板来说,pnp的学习成本也很小~
关于monitor client的问题,我有点不同意见,ganglia也需要在每台上部署gmond程序;这跟nrpe和snmpd的区别应该是在监控模式是主动还是被动。事实上nagios也有nsca的模式啊。

我要回帖

更多关于 设备管理是做什么的 的文章

 

随机推荐