November 2008 Archives

网站运维之道 之流程规范

接上一篇《容量规划》,谈一下流程规范这个话题。

流程规范

对于相对正规的网站维护工作,所有网站的所有变更必须能做到有记录,可回溯。如果是单枪匹马作战,那么要实现这个目标并不是很难,只需要把好习惯培养起来就成了,可如果要面对一个团队,那么就必须要依赖流程规范来进行约束。

所谓"流程规范",在初期也可以拆开来对待:流程 + 规范(废话!)。

关于流程(Process),直白的说就是"把大象放入冰箱需要几步?"的问题。比如上线一台服务器,那么可能要经过至少前期的选型规划、基准测试、压力测试......等等诸多步骤。如果跳过某个环节(比如缺少基准测试)而直接上线,遇到问题的时候几乎就会因为缺乏对比数据而走弯路。

关于规范(Norm),在运维的过程中是个范围比较大的话题,因为 Web 站点环境因为各种原因而不可复制,在另一个公司可用的规范照搬到另外一家公司未必管用。如果能够意识到并且尽早抽象出来标准化组件,并着手推进,那么规范必然会逐渐丰富起来并完善。比如 Web 服务器配置规范、Linux 主机配置规范、SAN 存储系统测试规范,都是可以尽早抽象出来并且可具体化的东西。

流程规范建立容易,但是如何确保执行却是一个很有挑战性的问题。从这一点来说,对于运维团队的领导的要求还是比较高的。如果要成功管理一个运维团队,起码要有足够的技术经验(当然,也容易看到外行领导内行的运维团队),而且要有足够强的执行力。

在流程规范的建立过程中,往往容易陷入为了规范而规范的误区,或是生搬硬套 ITIL(Information Technology Infrastructure Library,"信息技术基础架构库") 那一套大而无当的东西进来(这里不是说 ITIL 不好,但最合适自己的才是最好的),必须明确,规范的最终目的是为了运维团队更快而不是变成束缚,所以,千万要避免技术人员对规范的抵触。

在运维团队发展的某个阶段,推行"流程规范"所引入的 ITIL 等事物是一把双刃剑,运用得当会很好的促进团队成长,运用不好则会阻碍一部分激进成员的积极性,这一点需要注意。

补充一点,对于流程规范,不是死的东西,必须具备不断反馈、改进、进化的能力,运维团队也应该定期修正流程规范的有关内容。有一句耳熟能详的话是:遵守流程而不拘泥于流程,这里的"不拘泥"切不可变成钻空子的借口,要知道我们生活中很多无形成本就是钻空子引起的。

未完待续,下一部分谈一下关于《知识管理与知识积累》等方面的内容。

--EOF--

强烈推荐一篇相关文章 运维的工序流程. Hutuworm 的大作。

网站运维之道 之容量规划

接上一篇《网站运维之道 监控与报警机制》,谈谈关于容量规划。

容量规划

有效的监控能够避免绝大多数问题的扩大化,但是还是做不到防患于未然。监控告警机制完善后,就需要着手考虑容量规划(Capacity Planning)的问题。

所谓的容量规划,也就是一个公司为了满足商业目标的需求而决定生产能力的过程。俗语说,"人无远虑,必有近忧",容量规划,需要的是"远虑"。对应到运维的工作上来,一方面是商业目标带来的容量需求,一方面是针对相关历史数据的分析带来的预测。这里的历史数据,是需要运维团队采集、整理的。(从这个角度上说),容量规划是一个长期的过程。

相关的数据保存和图表生成,基本上都会采用 RRDtool (http://oss.oetiker.ch/rrdtool/)来做。 RRDtool 也已经是业界的事实上的标准,但毕竟 RRDtool 只能算是一套引擎。而规模化的数据管理工作则需要求助其它工具,则不能不提 Cacti (http://www.cacti.net/)这是现在相当通用的做法。老牌的 MRTG 已经很少有人用了。

利用 Cacti,很容易得到一段时间内某项数据指标的变化趋势(比如网络流量的增长趋势、服务器负载的趋势等)。这是运维过程中最主要的参考数据之一,缺乏此类数据而做决策是不可想象的。

Cacti_Graph.png

如上图,可以发现被监控的服务器上进程数量半年内的增长趋势,在 2 月份间的进程数并不高(春节期间),随后的几个月突破 4000 个进程,对于普通的服务器来说,这是比较危险的。尽管当前系统运行可能比较平稳,但运维技术人员绝对有必要考虑中期解决方案。

容量规划中的另外一个重要参考维度是 Web 访问日志的趋势图。对于中小网站来说,Awstats 足以胜任,更大一点的规模或是对统计要求更高的站点或许只能自己写统计工具了,还没听说有什么针对大型网站而且性价比好的商业工具。这里笔者要强调一下的是,商业站点尽量不要用第三方的流量统计工具,这样很容易泄漏比较关键的商业信息。

补充后记

容量规划其实远远不止这些,比如应用服务器容量规划方面、数据库容量规划,主机容量规划、存储容量规划等等,把整个架构拆成各个组件,每个组件的容量规划都是值得大书特书的一块内容。

另外一个关键点是团队的"容量规划",团队成长这一方面如果跟不上也很容易成为瓶颈。

未完待续,下一篇谈一下关于《流程规范》的事儿。


推荐阅读:The Art of Capacity Planning. 可以迅速帮助形成容量规划的概念。

网站运维之道 监控与报警机制

| 17 Comments

接上一篇的《关于可用性》,再谈一下监控与报警机制。

监控机制

定义了网站可用性指标,如何获取网站的可用值? 监控工具该粉墨登场了。

多数网站都会倾向于利用开源软件自行搭建监控平台。笔者一向认为,即使网站有一台服务器,也应该搭建监控工具,这是保障网站能持续改进的基石。常见的开源监控工具有Nagios(www.nagios.org)、monit(www.tildeslash.com/monit)等。Nagios也可能是当前国内最被广泛采用的监控软件了,根据官方描述,Nagios 是开源的主机、网络、服务监控程序,从这个描述能看出,Nagios 的设计目标是很庞大的。依赖其强大的扩展性,通过分布式监控模式,管理上千台甚至更多的服务器也不在话下。而对于大型集群环境,Ganglia (http://ganglia.info/) 是个不错的选择。

另外商业化运作的比较好的开源监控工具或框架还有 Zenoss (http://www.zenoss.com/)、Zabbix (http://www.zabbix.com/)、Hyperic (http://www.hyperic.com/)、 OpenNMS(http://opennms.org/) 等。这几个的定位都是"企业级"监控平台。当然,功能的确不比 Nagios 差,也有的弥补了 Nagios 的一些不足之处(比如 Zenoss 增强了对 Windows 服务器的监控能力)。但出于种种原因,在国内的流行程度并不广泛。

Nagios_distributed.png

(图2: Nagios 分布监控示意图
图片来源: http://nagios.sourceforge.net/docs/3_0/images/distributed.png)

如果要满足日趋灵活的 Web 监控需要就不得不提 Nagios 灵活的插件机制,最简单只需要几行 Shell 代码就能实现基本的插件功能。多数情况下,脚本捕获系统日志中的特定事件,通过 NSCA Client 发送给中心监控服务器即可。灵活性是衡量监控软件的一个重要标准,从这一点说,多数传统的商业网管软件怕是都不如 Nagios 这样胜任现在日趋复杂的网站环境。

提到网管监控,必然要谈到 SNMP。跨平台或者针对专有设备的监控离不开SNMP,但有的时候 SNMP 的安全性也的确会带来严重问题。这就需要运维团队中的安全专家对监控系统机制的安全性做整体评估,或是提升运维团队的安全意识以避免在监控过程中引入更多的安全问题。

有些公司的运维团队喜欢自己写监控工具而不是利用已有的第三方开源工具。这种重复发明轮子的做法笔者认为是不可取的。这样做最明显的一个缺点是软件本身的维护成本可能会更高,而且团队人员变动的时候后续代码维护也是个潜在的问题。至于商业工具的选择,这里不作评价。

报警机制

光有监控而报警机制跟不上,不能及时把紧急情况下的信息传递给运维技术人员,那么监控形同虚设。现在报警信息发送途径主要有邮件、IM、SMS 三种(过去书籍中提到的传呼方式已是明日黄花)。

这几个途径中,邮件告警可能是最简单的,实现起来容易,一行命令即可做到,但因为邮件本身的异步属性和邮件服务器的延时问题,很难让运维人员及时得知信息。所以,如果比较严重的告警信息必须考虑其它实时性比较高的方法。至于发送到 IM,如果 IM 是支持 Jabber 的,实现起来并不难,可靠性也会有一定保障,而如果 IM 比较封闭,那么可行性就不大了,除非 IM 公司对你开放 API ,否则任何取巧的技巧来发送消息的方法其可信赖性都不强、SMS 是大家都比较倾向的一种方式,只是有很多人不知道具体如何实现,说白了也就是一层窗户纸。如果有电信服务提供商(SP)能够提供基于 Web 的调用接口给你,那么直接利用 Wget 或是 cURL 工具模拟浏览器处理表单信息即可,几行命令即可搞定。如果不具备这样的条件,不妨考虑一下短信 Modem,现在市场上这样的短信 Modem 很多,价格不贵,大多都提供二次开发的功能,简单的写点脚本即可实现目的。至于网上有人推荐的免费短信服务,因为实时性比较差,笔者是不推荐的。天下没有免费的午餐,这样的服务往往信息发送优先级很低,而且,短信到达率很难保障。

值得一提的是,报警服务器本身也需要监控的。建议定期发送测试邮件、测试短信来验证告警功能处于正常状态。尤其是在节假日来临前更要反复确保该功能是正常可用的。

未完待续,下一篇谈一下《容量规划》

网站运维之道 关于可用性

| 11 Comments
这是前一段时间投稿给《程序员》的一篇文章。标题中的"道"有些大了,您可以理解为"门道"的"道"。一家之言,妄自言道,诚可笑也。

什么是网站运维(Web operations) ?运维,绝不是某些人眼中安装系统、做几根网线那么简单? 除去应用开发和业务运营之外的保障网站能运转的事儿都可能是运维工作的职责范围。运维的工作包括(但不限于) 软硬件部署、网络管理、应用程序维护、安全、容量规划、故障修复等等。

运维,有别于"运营"。在中文的语境中,运营更多和业务结合在一起的。而运维,则是偏向技术层面。

任何一个成功的站点都离不开一只优秀的运维团队,尽管他们更多时候隐身在网站背后不为人知。

网站可用性

所谓网站可用性(availability)也即网站正常运行时间的百分比,这是每个运营团队最主要的 KPI (Key Performance Indicators ,关键业绩指标)。对于 Web 站点来说,传统的那个 24x7 的说法已经不是很适用了,现在业界更倾向用 N 个9 来量化可用性, 最常说的就是类似 "4个9(也就是99.99%)" 的可用性。看一下表 1 能更为直观一些。

描述 通俗叫法 可用性级别 年度停机时间
基本可用性 2个9 99% 87.6小时
较高可用性 3个9 99.9% 8.8小时
具有故障自动恢复能力的可用性 4个9 99.99% 53分钟
极高可用性 5个9 99.999% 5分钟

根据墨菲定理的推论,世界上没有 100% 可靠的 Web站点(除非不运行)。业界网站的可用性都是多少?引人注目的 Web 新贵 Twitter (http://twitter.com), 2008 年前四个月的可用性只有 98.72%,有 37小时 16分钟不能提供服务,连2个9 都达不到,甚至还没达到"基本可用"状态。电子商务巨头 eBay 2007 年的可用性是 99.94%,考虑到 eBay 站点的规模与应用的复杂程度,这是个很不错可用性指标了。Web 应用类型决定了不同的站点对可用性的依赖性是不同的。 要知道 4 个 9 的可用性实际上是很难实现的目标。至于 5 个9 的 Web 站点,一半靠内功,另一半恐怕是要靠点运气。

wikimedia_db2.png
(图1 维基百科网站的一台数据库服务器的可用情况报告, 由Nagios的监控得到的)

多数情况下,网站可用性会是 SLA (Service Level Agreement, 服务水平协议) 中的一个重要度量指标,也是运维团队向自己的客户(更多是公司老板)的正式承诺。可用性是能够持续改进的东西,KPI 制定者切不可狮子大开口,企图一步登天,拍拍脑袋提一些不太切实的指标。运维团队对可用性的承诺也不能开些空头支票,到头来两头难看。值得强调的是,如果是做第三方托管,更需要明确 SLA,明了第三方的服务能力,否则,费尽了九牛二虎之力终于保证了软硬件网络等环节都没问题了,IDC 却频繁断电或者IDC 出口网络不可用,这也绝对做不到预期的高可用性。

提高可用性的一些常规策略有消除单点,部署冗余设备(或集群),配置带外管理网络等,对可用性要求不高的网站这些可能足够了。如果要提供更高的可用性,比如 4 个 9 甚至 5 个9,就不是简单靠硬件就能做到的事情,还需要建立完善的流程制度、建立变更机制、提升事故响应速度等。正所谓是"没有最高可用,只有更高可用性"。

一般来说,所有的网站运维人员都在追求网站的更高级别的高可用性,但是必须注意,这是以额外的软硬件投入、更多的人力成本为代价的。成本与可用性之间也请做到良好的平衡,盲目追求高可用性是不可取的。

(补充:Twitter 的可用性现在已经有了很大提升,但是可以看到,可用性不佳并非一个网站的杀手,只要产品对用户足够友好,足够有粘度,足够不可或缺,那么可用性并非是第一要追求的运维目标。有些运维人员被 Amazon 的某年圣诞节期间宕机所造成的影响埋下心理阴影,其实没那么可怕,如果真的觉得可怕,那么你可能被一些厂商销售人员洗脑了。)

未完待续: 下一篇《监控与报警》

虾米的音乐梦想

| 15 Comments

xiami_logohover.gif去参加网志年会这几天中,虾米网发布了 Beta 版。

尽管众多人喊着互联网寒冬,这群虾小米们忙活的热火朝天。在广州参加 UED 书友会的时候,话题恰好是关于音乐网站。我推荐了虾米网。然后描述了一下我眼中的虾米网特点:

  • 0) 这是一帮热爱音乐人建立的网站,团队成员中有前摇滚乐队主唱,有民谣歌手;南瓜同学本人就是杭州很多音乐 Party 的组织者;
  • 1) 高品质音乐。如低于 192K bps 不让上传,我们生活在噪音的花园,不用再亏待自己的耳朵 ...
  • 2) 版权问题已经基本得到解决,商业模式很清晰,网站本身可以看作一个经济体;而高品质的音乐本身就足够值得用户掏钱,何况在现在电子支付手段已经成熟的情况下;
  • 3) 用户有足够高的参与程度。而我在上面找到了一首找了 7 年的 MP3(另一用户贡献的),当然,还是高音质的;
  • N) ...

祝愿虾米们达成音乐梦想!

--EOF--

网志年会 之第二天

| 1 Comment

第二天错过了和菜头的演讲,进入会场的时候刚好是平客在脱口秀,关于理性辩论的话题。听完了平客,到处乱窜了一会儿。

"做啥"的大屏幕上互动比昨天少了一些。门口的年会礼品开卖,支付宝赞助的 U 盘因为定价错误,异常畅销。算起来,我买了四顶帽子,买了一个 Fon 的无线路由器,后来还获赠了一个。收获颇丰。很朋友们聊聊天,时不时的发些消息到大屏幕上,不知不觉到中午了。

几个 Blogger 结伙去旁边的小饭店吃午饭(不过不如昨天的那家的饭好吃)。席间聊了一些关于支付宝的事情,另外让我感兴趣的是来自自然之友的熊彬用的环保筷子。网志年会总能遇到一些有趣的人和有趣的事儿。

下午没能参加冯琰的 Session,没来广州前白鸦就说这个 David Feng(和我英文名字重名) 会 N 国语言,见到真人也感觉小伙子很帅,除了国语不如我其他都比我强。值得强调一下他们的 CN Reviews 做的很敬业。

去参加在网易举办的 UCD 广州书友会,到了之后发现有的网友也是年会的参加者,现场的讨论效果很不错。晚饭的时候和网易的朋友聊,问了关于《百城记》和网易新闻上那个著名的"老衲"到底是咋回事。回来后想了想,应该多聊一下彭毅他们的 爱枣报

回到宾馆,本来要早点睡,在 Twitter 上看到有人说连岳在凹凸酒吧,睡觉什么时候都能补上,但遇到连岳可不是容易的事儿。和白鸦一拍即合,杀向酒吧,一大票人已经玩的很高兴啦,拜见偶像并且合影(其实他没照片上丑,哈),激动,问了几个我非常非常好奇的问题(问题保密)后,连岳不堪骚扰,跑外面喝粥去了。今天看了错过的连岳讲话(视频),避免存在传道焦虑,避免成为受迫害幻想狂。

多志兴邦

扎堆聊天,大家给年会提意见,憧憬明年年会,接着也去喝粥,接着聊,如何与 007 作斗争,不亦乐乎。是夜险些无眠。

和而不同,多志兴邦。曲终人散,明年再见!

--EOF--

网志年会 之第一天晚上

| 2 Comments

接着年会第一天白天的事儿继续说。

下午四点多的时候,实在感觉困得不得了,跑回宾馆休息,收了一下邮件,从 Twitter 上看到说晚上在学校的活动取消了,睡着,中间接到了潘海东和狂风说去吃饭的电话,又睡着,又接到白鸦电话说文心老白来了。晚上年会的活动也快开始了。于是我俩再杀向星坊 60 。

俯瞰晚上的会场

认出了不吃米饭的平客,他刚到广州。也看到了 P1.CN蔡望勤,我跟他开玩笑说 P1 上潮人真多。年会准备的晚餐,西餐、啤酒,吃喝都有。这会儿比白天安静多了,会场的人仍然很多,台上放着音乐,提示晚上的节目快开始了。开场是音乐学院的学生的即兴演出,但这个场地回响实在太大了,不过谁管那么多呢? 高兴就好。接着是台湾朋友们的 Punch Party China ,每人7分钟的分享时间,不许超时,否则被赶下台,哈,我看了工头坚凯洛Vista 前面几个的分享之后,和 WebLeOn 说,这才是今天最棒的环节。后来凯洛看到我,还说记得我的这句评价。 相对大陆 Blogger 的矜持,台湾同胞们其实更放得开。

工头在分享:
工头在分享

BTW:工头的 T-Shirt 很拉风,是老蒋的头像。

平客拍工头,我拍平客:
平客拍别人,我拍他

会场地上的"到台湾不带走一张发票"
到台湾不带走一张发票

然后去吃饭(其实我有点舍不得走)。文心、老白安顿好了之后我们去吃水东牛腩,老板是海东的朋友,我不记得他是否给过我名片了。不过菜真的很好吃,可惜白鸦老白因为吃多了鸡翅说吃饱了,导致我也不太好意思多吃,差点说打包给我好了。哈。

饭吃过之后,杀向了凹凸酒吧,老板就是北风。一大票年会参会者已经聚集在这里了,晃悠了一会儿,实在困了,回去睡觉。后来听说整整杀人游戏进行了一晚,狂人们...

台湾一票 Blogger 在酒吧

上图是 Punch Party 上的台湾一票 Blogger。

--EOF--

网志年会 之第一天

| 5 Comments

上午流水帐

早晨起来收拾一下和白鸦赶往会场。打了一辆车,结果实际没多远,单行线,下来走了几步,有感觉了,看到了路边的标记,和背着包的疑似 Blogger 的人。星坊 60 真的有点偏僻。

还好,我俩来得不算晚。大家都在排队注册呢。老朋友,新朋友,互相寒暄。第一个看到的是 Herock,我应该是第一次见到他。这次年会,因为赞助的事儿,中间反复沟通了几次。我在年会的 Panel 也是他的建议(不过效果...我自己认为一般,这是后话)。接着算是简单注册了一下,白鸦介绍认识了 WkCow,我们三个 T-Shirt 很是近似。还有互动百科的潘海东。当然,还有,isaac(现在要叫他毛主席),在会场比较忙,看到了 Zola ,介绍我认识了许志永律师,我表达了对他的敬意。

安替作主题演讲。回顾了他个人与 Blog (其实主要是互联网)之间的关系,从住在锅炉房的上面的宿舍,完全不知道未来,最后到哈佛大学的过程。我在几年前看过对安替的介绍,如果在国内要找被互联网改变的十个典型的人,他肯定是其中的一个。安替提到了王小波,以及王小波之死对他的影响以及他的转变(我自己也受王小波影响颇深,感慨)。安替的言论倒也不是很过激,讲到精彩处,观察了一下 isaac,惺惺相惜,十分激赏。安替演讲那会儿,基本上现场还算安静,到了第二位欧宁的时候,会场已经有点噪音了。说起欧宁,我自己在上学的时候就看过他与颜峻 、聂筝搞的《北京新声》 -- 互联网让这个世界变得多么小...接下来是我,演讲结束后,Livid 过来和我说了说了几句,可惜我还没仔细打量他(接下来一天半也没看到他)和几个做技术的朋友在门外聊了又一会儿。还真是有不朋友为听这个技术 Session 而来的,可惜,希望什么时候找个机会把这个内容补充一下吧。

来几张图吧,支付宝赞助了年会:

年会外面大门的宣传画

Zola 同学的"无墙电脑"

Zola  同学 "无墙电脑" 现场演示 Workshop

中午在会场旁边的小店吃饭,看到了更多来自杭州来的 Blogger。不用介绍就能认出来的有吊着绷带来参会的王佩、忍痒。

下午流水帐

下午,去"女性与 Blog" 的分会场认识了一下哪位是和菜头(在 Sina 上有一个" 和菜头参与讨论女性与Blog"的新闻,图中菜头有点囧,我看到这个标题,大笑):

"女性与Blog" 话题

因为场地的限制,B会场挺受主会场音响的干扰。听了一会儿跑到外面,和维基百科的几位朋友胡侃了一会儿,接着和菜头出来了,与安替几个人坐在外面,安替调侃了一下和菜头的"树洞",再一会儿,冯三七也过来了,期待着的"和菜头大战冯三七"的场面并没有出现,网上愤怒,到了线下,其实大家还是理性的。不算辩论的辩论中,和菜头自嘲他是"大男子主义的女性主义者"。这是个有趣的下午,许志永、老虎庙、北风、刘晓原都在现场出现了,后来有人说,连岳也出现了。

和菜头谈锋甚健:
许志永律师与和菜头

图片中间的那位是许志永先生。

北风和老虎庙:
北风与老虎庙


未完待续,回头接着写晚上的...

--EOF--

网志年会 之流水帐

| 7 Comments

补充一下周五。且说周五晚上因为一点偶然的事件,我和白鸦在 6:00 左右就能出发了(要不开会计划到晚上八点)。等了半个多小时,打到了出租车。

到了机场吃了点东西后,我俩就开玩笑,说能不能在机场碰见几个杭州去参见年会的 Blogger,留意了一路,没有像的人。直到上了飞机,坐下了之后才看见 chouti 夫妇二人上来。

到了广州,入住了酒店后,上网 Twitter 消息,"杭州代表团已经到了",Webleon 约我们出来吃东西,不知道他住的地方确切位置,打了几次电话之后白鸦确定了前面那个人就是 Webleon,大喊了一声"立正",我往路边的大门一看,乐死 --旁边是个军区,站岗的军人手里端着枪呢。

第一次见到 Webleon,真人比他的 Logo 胖一点嘛。聊到了三点多,广州的小吃真的很好吃,也可能是我饿了,结帐的时候口袋里不知道什么时候多出来一张假钱(第一次口袋里出现假钱),后来想了想,应该不是在广州出现的,不该无端怀疑人。回去睡觉。

广州治安这不挺好的嘛。

--EOF--

年会的演讲有点糟

| 16 Comments

是我自己的演讲有点糟,怎么个糟法? "演讲内容偏技术,现场观众茫然,自嘲快崩溃"(refer)。

开始幻灯片放映有问题,前面铺垫了几句,临时接上了我的笔记本,然后第一张 PPT 过后,整体的节奏完全乱了,而且台下的对这个话题感兴趣的人比较少。只好临时加了一些内容。总体表现比较差,HOho

网志年会

怪我了,应该早调整内容,如果话题是偏重于 Blog 对技术人、网络的影响阐述可能会好很多。

下午安替看到我说: 你应该继续讲下去,不应该妥协。我:我倒不是妥协,是对他们表示尊重。

所用的 PPT:

这份 PPT 的内容挑个技术型的会议再回炉一下吧。会场还有不少好玩的事儿,等空下来统一整理一下。

--EOF--

网志年会 之 预热

| 4 Comments

今天把年会上准备分享的 PPT 最后定稿。我这个话题好像和年会不太贴边(所以内容我重新调整了一下),不过说回来,现在网志(Blog)已经是我最重要的学习载体之一了,就当到现场和大家交流一下学习经验吧。之前支付宝赞助网志年会的事情也终于就绪,虽然波折挺多。

badge_hor_1.png

所以,如果没有其他意外,我和白鸦同学将于周五半夜抵达广州。看看最新议程,有几个话题我非常感兴趣。周六下午,可能抽空客串参加一下 UCD 广州书友会

Sina 这次做了一个网志年会的专题,我和同事开玩笑,"终于成功登陆了新浪"。好像也有媒体做预热报道,最离谱的是isaac 主席 Twitter 上说的这个

这个周末的广州,在星海音乐学院,将迎来一场自发的,即兴的中文网志(博客)2008年会。来自全球各地的博客书写者(涂鸦者),网络技术创新者(狂热分子),多媒体平台的实践者(混合者)...... 所有这些知名或者不知名人士,都要在那个时刻,汇聚成一片 ...

这个报道让不知道网志是什么的人摸不到北,但愿我这个路盲到广州能摸到北。

说起网志年会,我参加过 06 年在杭州的第二届,年会上认识的不少人后来真的成为不错的朋友,这次会会老朋友,结识新朋友,实在是人生一大乐事。

支付宝赞助的物品中,我看看能不能申请我来发一小部分,现场来点互动,话题和支付宝官方 Blog 相关的,如果有朋友之前在 Blog 上写过支付志又在会场的,有小礼物给你。

--EOF--

对 Web 测试人员的一些建议

| 21 Comments

偶然间想到的一个话题,顺便说说我的一些观点。太理论的东西书店一堆堆的,测试更多的时候需要实践和常识,而不是理论,还是说点实战中的建议吧。

必须接触 Unix 环境与文化

Unix 的一个重要设计思想 "不同工具灵活协同以完成任务",在 Windows 上捣鼓 LoadRunner 之类的玩意儿是不能成为成功的 Web 测试者的。只懂得 Windows 上的商业工具是没有出路的,而只懂得在 Windows 点击鼠标来测试更是丢人的。

学习 cURL

一个 Web 测试人员如果没听过、没用过 cURL ,是不可想像的,cURL 本身就是浏览器,学习浏览器行为,与浏览器对话,用 cURL 会让测试人员事半功倍。

如果作为测试人员又恰好懂点编程技能,那么研究一下 libcurl,这肯定不是浪费时间。至于为什么推荐 cURL 而不是其他的工具? 看一下这个比较表

使用 YSlow

现在,Yahoo! 公司最出名的产品可能就是这个 YSlow 了 :) 是的,必须用 Firefox 才能用 YSlow,问题是,你为什么不用 Firefox 呢? 尝试一下。再说,Firefox 上诸如 Tamper Data 之类的工具也会让你方便许多。

另外推荐 YSlow 的原因是通过这工具能快速学习优秀站点的 Web 设计,你了解的越多,测试中你会主动关注的点就会更多,你找出来的问题就越多,你的技能提升的就越快。

尝试关心一下 Web 日志

在测试的时候你不用关心其他什么 Web 分析的内容,但不妨关注一下 HTTP 404 错误之类的信息(如果团队里面没人关心的话)。

重新读一遍关于 HTTP 的图书

Web 的根本,HTTP,对这个东西,永远别说自己非常懂,比如 HTTP Performance,别说太懂,另一个原因是 HTTP 还在发展中...Web 也在发展中

对 HTTP 如果要有个更深刻的印象,HTTPWatch 也不错。

--EOF--

这不是一篇全面的指导,我也不是说 Windows 不好。只是如果你缺少这方面的技能的话,不妨尝试一下。我的确看过太多用人肉方法测试的测试人员,尽早的解放出来也不是坏事。

Note:Gusing Chen 同学对文此亦有贡献。

骆驼是委员会设计的马

| 6 Comments

A Camel is a Horse Designed by a Committee.

此中有真意,欲辩已忘言.

--EOF--

D2 前端技术论坛(上海)

D2.png友情帮推广一下这个 D2 技术论坛会议。会议也是以技术会友,门票是免费的,感兴趣的话就去参加一下吧,和前端技术高手面对面交流。前端技术我不懂,所以不去参加了,不过支付宝会有不少同事去参加。

关于D2

D2 前端技术论坛(Designer & Developer Frontend Technology Forum),简称 D2 ,为国内前端开发者和网站设计师提供一个交流的机会,一起分享技术的乐趣,探讨行业的发展,以技术会友。它是中国所有前端开发者的节日,包括前端设计师,前端开发工程师,和所有对前端技术感兴趣的人。D2 将努力营造一种轻松自由的交流氛围,没有任何商业色彩,以纯粹的技术交流为根本,共同推动国内前端技术的发展,促进国内行业标准跟国际的融合,发掘前端技术可以创造的更大价值。
D2 是由 淘宝网 发起,每届由不同公司轮流承办。

详细介绍:http://www.d2forum.org/about/

本届主题:"前沿技术和前端协作"
举办时间:2008年11月29日
举办地点:上海
举办单位:土豆网
协办单位:淘宝网、微软、Adobe、蓝色理想、ActionScript 3天地会

日程安排

时间:2008年11月29日(星期六)
地点:上海市徐家汇美罗大厦

上午:嘉宾演讲 9:30 - 12:00

09:30 - 10:40 《Flash Player 10》 马鉴(Adobe)
10:50 - 12:00 《Flash 协作开发之路》 史珉(Tudou)

下午:自由论坛 13:30 - 18:00

13:30 - 14:40 《IE8 as future platform》 待定(Mirosoft)
14:50 - 15:50 《前端敏捷开发-质量与效率的战争》 许湛(Alibaba)
16:00 - 17:00 《土豆网与淘宝网的前端团队组织结构剖析》 李戎(Tudou) & 怿飞(Taobao)
17:00 - 18:00 《自主议题讨论》

注意:以上安排可能会根据具体情况进行一些补充与修改。

关于嘉宾

马鉴 (Zerlot Ma, 七月)
Platform Technology Evangelist / Adobe
Blog: www.7yue.com

史珉 (Aspirin)
高级Flash工程师 / 土豆网

许湛 (Justin)
前端开发主管 / 阿里巴巴(国际站)
Blog: www.alldone.cn

李戎 (小麦)
资深前端开发工程师 / 土豆网
Blog: www.mikkolee.com

郑叶飞 (怿飞,圆心)
资深前端开发工程师 / 淘宝网
Blog:www.planabc.net

报名地址:http://www.d2forum.org/d2/3/sign_up.html

--EOF--

朱芳琼与五条人杭州专场

| 2 Comments

昨天晚上去旅行者酒吧看朱芳琼五条人的现场演出了。

10 年的记忆。1997 年,我刚上大学,长春本地的电台节目,第一次听到了朱芳琼。电台的那个节目叫做郭杨音乐杂志,主持人郭杨动不动懒洋洋的念一大段知音体的独白,开始我还以为是她自己写的,后来才知道不是。光是村上春树的《遇见百分百女孩》我就听过好几遍开头的部分,当然是后来才知道这小说的名字。扯远了,朱芳琼那时候其实也就是两首歌《土地》《火舞》。这几年才听到他的新歌,随着信息的发达,也找到他的更多信息。

第一次听《土地》,彻底惊了。这么简单的节奏怎么弄出来这么"复杂"的东西,相比那个时候乱七八糟的吉他、贝司、鼓搅合出来的摇滚,朱芳琼这两首歌绝对是独树一帜的。前一段时间豆瓣上看到他独立发行的《上西天》,新的音乐增加了一股狠劲儿,听得出来这家伙这么多年不如意。谁还敢和他提《土地》估计这家伙都得急。

当我走在金黄的稻田里
脚下踏的是沉默的土地
或许只有它是不变的东西
什么都会逝去 唯独土地

据说《上西天》这张专辑完全是DIY的,自己创作、制作、宣传、出版、发行。对了,朱芳琼的身份是"独立音乐家"。

废话说了这么多,说说我看到的现场。之前,我并不熟悉五条人,只是知道他们可能用闽南语唱歌。它们开唱后才知道,五条人其实现在只有两个人。第一首歌居然和彭湃有关(五条人用海丰话唱歌的),然后是一首《道山靓仔》(我还以为是《道上靓仔》),描绘的就是路边无所事事精力充沛的烂仔生活,有趣。阿茂唱歌时非常投入,唱完描述田间耕作的阿伯之后,貌似这家伙眼眶都湿润了。仁科的手风琴也非常出彩,兄弟俩的演出是一点不打折扣,肆无忌惮,非常卖力。

阿茂 五条人乐队

仁科 五条人乐队

朱芳琼上场,没了长头发,瘦。用他自制的乐器开玩,自制的两弦琴,不插电,看似非常随意,但这么貌似简单的乐器可不是一般人能玩起来的,歌也没什么歌词(朱有个有趣的小毛病,弹琴的时候嘴里不停的做着咀嚼动作,我还以为是吃口香糖呢),很难对他唱的东西做个分类,接着过渡到了《怪不得我》。

朱芳琼

这个时候酒吧内的噪音和几万只苍蝇在耳边一样响(在五条人唱到一半的时候我已混到舞台前面坐着了,还基本听得清楚)。接着朱说,今天嗓子也不太好,大家尽兴就好,(太吵了)要不打一段鼓吧。这段鼓我个人的评价虽然也挺牛B,其实不如前面的弹唱更好玩,但是把酒吧里的人震住了(可能也是声音够大),噪音总算小了一点,又唱了一首(旧版的《上西天》?)之后,朱还是说没感觉,要不和五条人一起合作吧。

朱芳琼击鼓

两大段即兴表演,配合的非常默契,终于把场内的气氛彻底调动起来,那些端着啤酒、不停嗡嗡的泡吧者估计总算认为这个才够味。阿茂的呼麦引发了南瓜同学的一句酷评:现在搞民谣的,呼麦是标配。哈。

朱芳琼

现场的观众抓拍:

朱芳琼、五条人专场 观众

小评:朱芳琼在音乐实验的道路上已经走得非常远了,只可惜不能为更多人所知也。五条人,继续保持创作活力,前途大好。

--EOF--

更多照片

周六晚,杭州旅行者酒吧,去看朱芳琼专场,如果你不知道他是谁,请忽略。

上周 51.Com 和盛大的朋友来集团进行技术交流,一天下来收获颇多。下个周末将去广州参加中文网志年会,并将在会上做一次技术演讲。话题定为"可扩展性网站架构",这题目弄得挺大的,不知道会场是否有人愿意听技术。

badge_hor_1.png

中文网志年会是非传统意义上的会议,是一年一度的博客们的大聚会,希望这能够成为中国互联网空间聚会交流的平台。中文网志年会是一个特殊的会议,会议本身就是一个新媒体的试验场。有人称它是"中国最连线的会议"(China's Most Wired Meetup);也有人称它是"理想主义者的聚会"。

然后考虑参加 Sun 的科技日,接着会组织同事参加 Oracle 开发者大会,12 月初,再去北京参加 CSDN 的 SD 2.0 (2008) 大会。可惜,因为一些客观原因,没能组织去成旧金山的 QCon 大会,其实我期待这个会议要超过 Oracle Open World。不过自己挺宅,一般避免无谓的出门。

附:上次 Sun 的 OpenSolaris 活动的在 InfoQ 上的视频(InfoQ 上还可看PPT)。那个视频有点卡,我另传了一份在国内视频站点上:

小道消息:一些关于 Geek 的思维片段和不着边际的杂念我会在豆瓣日记上更新。

--EOF--

我所欣赏的金庸小说里的团队

| 5 Comments

前一段时间在公司做了一次《金庸小说人物谱》的讲座。这次讲座效果我自认为比我其他技术演的效果好多了,毕竟金庸我看了大约 20 年了,做技术才有几年啊。这次讲座之后的另一个感慨是,公司还是有人懂武侠小说的,但还有很多人根本不接受这东西,"武侠文化",只在口头上和会议室的门上。

金庸小说人物谱

其中的一个话题说到了团队。金庸小说的团队其实不多,但不是没有。我最欣赏的团队其实是"明教五散人",我个人觉得这个团队要比"唐僧团队"更贴近技术人员。

明教五散人是这几个人(按照我欣赏的次序):

  • 冷面先生冷谦
  • 周颠
  • 铁冠道人张中
  • 彭和尚彭莹玉
  • 布袋和尚说不得

冷面先生其实也是我最欣赏的金庸小说人物之一,是武侠小说中少数可以用"妙人"来形容的人物。其人特点绝无废话,面寒心热。听到周颠要随教主远赴海外,破例连说了六个字"小心 怪鱼 吃你",让周颠都心头一热。我每每读到这里,也是心头一热。至于周颠,这家伙虽然脾气古怪,略有偏激,可也是个热心汉子,令我印象最深的情节是把自己宝刀送给张无忌来对抗灭绝师太,算不得什么豪举,但也挥洒自如;彭和尚救白龟寿,自是义举,在大敌之前,多方周旋,功不可没。五人被伏击后的哀叹更能透露出其志存高远;布袋和尚,被周颠误会打落牙齿吞进肚子,这样的容人之量几人能有? 铁冠道人,书中所表不多,字里行间看出,有谋略,应是五人中善做决断者。废话写到这里你可能发现这五人在团队中角色是不同的,分工也是明确。

明教五散人是个技术团队。五个人都是武功高手(仅在光明使者、四大法王之下),走专业路线,手下没有人可带(散人),在光明顶上,大敌在前,五人之间尽管先前有些许摩擦或争吵,但仍能兵和一处,一致对外,这是也好团队最重要的特质之一:关键时刻发挥集体之力,而非互相拆台。

这几个人亦正亦邪,但目标明确:忠于明教,光大明教。绝不容许任何有毁明教之事(换言之有极强的共同价值观,对公司文化认同)。周颠之所以瞧不起杨逍,也是因为这个光明左使(相当于现代公司高管)当年抢老婆的手段不太光彩,而类似事情五散人是不屑于做的。

金庸小说中能点出的团队本已不多,但有了"五散人"这么一个例子,足矣。公司化如此昌明的今天,这样的团队怕是已经绝迹。所以,我们在这里怀念这个虚构的团队。

--EOF--

奥巴马的胜利也是 Web 2.0 的胜利

| 7 Comments
这是最好的时代,这是最坏的时代;这是智慧的时代,这是愚蠢的时代;
这是信仰的时期,这是怀疑的时期;这是光明的季节,这是黑暗的季节;
--《双城记》

没出意料,奥巴马赢了,在这个 2008 年,什么都有可能发生。2008年初美国那边有份预测,说"互联网仍然没能帮助一名总统候选人获得成功",现在看起来,这个预测错了。

奥巴马的胜利几乎就是Intenet (尤其是互联网) 的胜利。这个有点偏瘦的黑人,不但建立了自己的网站,还用 Twitter , 用 Facebook、 Myspace (所以知道分子同学这样的 Geek 支持奥巴马), 在最后的时刻,还发邮件号召选民和他一起进行最后的冲锋。如果没有互联网,没有新媒体,奥巴马应该没什么胜算,正如肯尼迪当年借助电视登上总统宝座,奥巴马这次选择了互联网、选择了 Web 2.0 ,如愿以偿。

对于已经创造历史的奥巴马,无须再添加任何期待了。崔健说了,"放眼看看世界,快放松你的下巴"

--EOF--

很久没关注杭州 Web 2.0 的信息了。今天 Twitter 上,有朋友(wangchaoad)给我发消息介绍他们的这个网站: 问道(askform.cn)。他是这个问道的发起人之一,利用这个方便采访了一下。

DBA notes:能不能简要介绍一下你们的团队?
Askform: 发起人曾经开发过国内第一个物换物网站 -- 杭州换吧,以及cxSearch.com。主要技术(人员)以前是微软的工程师,管理团队主要有浙大的一个博士后,资深企业咨询师,还有以前做传统行业的项目经理。

DBA notes: 当初为什么要考虑设计 askform.cn ?
Askform: 当时设计askform.cn主要是因为看到国内这方面比较空白,另外就是在线软件是未来的发展方向,同时想构筑一个问卷创建、数据统计、问卷传播的平台。

DBA notes: 我观察到是使用 .net 技术开发的,你认为这是个好的选择么?
Askform: 关于.net,技术(人员)本身是搞 .net 的,并且在微软待过,对于微软的产品有很深的认识,开发起来比较顺手,并且能够在短时间内取得较快的进度。

DBA notes: 现在有多少用户,曾经有过哪些大型的调查呢?
Askform: 目前运营半年,用户 10000 多,为CCTV、第一财经、焦点房产等做过调查,其中CCTV是网站调查,第一财经是读者调查,焦点房产是房交会用户信息反馈。

DBA notes: 现在服务器规模大约怎样? 大约几台?最多在线用户呢?技术架构能简单描述一下么?

Askform: 服务器规模不大,服务器一台,最多的时候上千人在线,因为经过深入优化,目前能够满足需要。.net +SQL Server。

DBA notes: 现在面临最大的问题是什么? 寻求投资 ?

Askform: 现在正在开发新的问卷传播平台,最大的问题是新平台的开发以及少量的融资

DBA notes: 现在市场推广方面大约是怎么做的 ?

Askform: 推广时期主要针对的是博客,因为我们采用 Widget 模式,通过博客介绍+Widget 应用的传播。当前市场主要通过口碑传播,共有3个QQ 群,形成用户讨论机制以及传播点。

最后简单说一下我的看法:首先这个在线调查市场究竟有多大? Wangchaoad 说"CNNIC的统计,今年 20-30 亿(美元)",我个人感觉没这么大的。这是其一。其二,在线调查门槛不高,对技术要求实在太低了,真正有含量的地方在于对"调查内容"的把握,如果把潜在客户的需求吃透,这是个问题。举个例子,现在很多大中型公司偏向人力资源方面的调查还是需求很大的,但这部分市场基本被咨询公司把持。如何切入?

现在是互联网的核冬天,找投资不好找,祝愿"问道"好运!

--EOF--

BTW: 如果你也是创业中的 Web 2.0 网站,在不占用太多时间资源的情况下,我也可以进行远程采访。

RAIDb 简介

| 3 Comments

RAID(Redundant Array of Independent Disks),是现在 SAN 存储的非常核心的概念,可能很多朋友都熟悉的。这里介绍一个比较旧的新词:RAIDb 。所谓 RAIDb 也就是 Redundant Arrays of Inexpensive Databases (Db)。

RAIDb 其实是和 Sharding 技术概念有些地方是相通的。如果看概念上的验证还可以看 MySQL DRBD 的解决方案。 这个概念似乎较早见于 C-JDBC 的设计说明,不过近年来也被一些新的解决方案所引用。(比如sequoia)。

RAIDb-0

表级别. 类似数据库的分区,但 RAIDb-0 是不同表之间,RAIDb-0 不提供容错机制。RAIDb 控制器是整个 RAIDb 的核心。这一组件决定 RAIDb 的可靠性、可用性。

RAIDb-0.gif

RAIDb-1

DB 的镜像或者复制。也是至少需要两个后端 DB 节点。具备容错机制。和 RAID-1 类似,写操作会慢一点。因为是全复制或者镜像,所以对存储空间的需求是比较大的。

RAIDb-1.gif

RAIDb-2

部分复制,算是前两种方式的折衷。

RAIDb-2.gif

RAIDb-1-0

RAIDb-1-0.gif


RAIDb-0-1


RAIDb-0-1.gif

示意图乍看起来是一样的,RAIDb-1-0 与 RAIDb-0-1 的主要差异在控制器(controller)上。

RAIDb 概念把数据库水平切分的思想抽象出来一个很好的模型。旧瓶装新酒,只要调制合理。

--EOF--

关于这篇归档

This page is an archive of entries from November 2008 listed from newest to oldest.

October 2008 is the previous archive.

December 2008 is the next archive.

Find recent content on the main index or look in the archives to find all content.