| Twitter | Del.icio.us | Comments (11) | | Edit

Comments Powered by Disqus

留言评论 | Comments (11)

Fenng终于结束流水账了...
成本与可用性之间也请做到良好的平衡,盲目追求高可用性是不可取的。
这句很赞同,尤其是对于还没有盈利的互联网公司

更期待《监控与报警》带来的头脑风暴,现在的思路基本局限于Nagios了

言之有理~~~用系统原理来说就是“强调个体效能的发挥,并不是要求系统中每个子系统都必须具有最优的性能。”(避免浪费精力)

@suchasplus

其实我更愿意写流水帐

过两天, 找到 亚马逊 DBA 写的宕机原文, 拿来娱乐兼反省一下.

几年不会有down机了,老美没有那么多消费需求了

配置带外管理网络
是指什么?

带外管理就是OUT-BAND,相对于带内管理(IN-BAND)一词,是一个范畴,比如通过远程网卡统一管理server,storage等,即使server掉电,也能remote power on。带内管理举个例子比如通过KVM直接连接server

@dragonlady
晕, 原来服务器加一块远程管理卡就是所谓带外管理了

好文,收藏至20ju.com

关于可用性 有些问题希望和楼主讨论
比如 我费了半天劲 作了 网络冗余 机器冗余
各种备份回复策略
甚至菜油发电机等等
然后比照idc提供给我的sla 我可以向老板保证 我们网站的sla了
结果 . 某天 我们的search的页面. 不小被几个人同时访问了
结果 数据库挂了.结果 首页
但80还开着. 老板暴跳如雷. 你们都是吃屎的?
这种情况下的sla该如何计算? 我永远不知道 我所保证的服务器上跑的应用都有什么潜在的危险.这种情况下该如何保证.
或者极端的说.就算你提供的是一个apache的index自己的首页.
其他啥应用都没有. 你怎么保证你的机器不被ddos攻击. 或者忽然apapche出了个大bug好几天没有更新. 这种情况下 该如何计算可用性.???
所以我一直以为 可用性 分为可计算 和不可计算的. 而我们基本是无法分清什么是可计算什么是不可计算的. 一段有不可以计算部分 我们中国人基本都充分利用不可计算的混沌优势. 比如某次我某个应用挂了.正好电信出了点小问题.得. 这下好 全算电信头上吧.

@beta

你说的几种情况其实也是可用性范围内的事情。search 页面设计的时候要考虑容量,同时运维人员也应该从旧有的数据中发现系统比较脆弱的点,这是责无旁贷的事情。

至于被 DDos 攻击、软件 Bug , 也同样如此。被DDos 攻击在极端的时候可能抵挡不了,但应该有个预防措施和解决方案吧?软件Bug,平时要多注意以一些,发现问题解决问题,而不是等问题出现的时候你才发现有个 Bug。

运维就是个平衡的事情,不能绝对,但需要渐进改进;也需要提高意识。