November 2006 Archives

技术高手

| 33 Comments

这是昨天从 MyBlogLog 统计结果 得到的一则奇怪的信息。用 Google 搜索 "技术高手",得到的结果:

技术高手


排在第一位的搜索结果和搜索内容相比,看不到任何相关性。不得其解。

--EOF--

CNOUG Planet 改版

| 2 Comments

距离上一次维护 CNOUG Planet 好久了。这段期间,Planet 经常罢工,虽然这个 RSS 聚合工具在开源软件站点比较流行,可是功能实在受太局限了。分析了最近涌现的其他类似工具,发现都还不如 Lilina 好呢。

AnySQL 楼大侠强烈推荐他 Hack 过的 Lilina 程序(Lilina 源程序 Bug 太多,性能也不太好),并且亲自操刀进行安装定制。效果真的很令人满意。此外,他还修复了关于 Dreamhost 不能显示 Favicon.ico 文件的问题。(我以前回复一个网友的时候还说,这个 favicon.ico 的问题是 Lilina 程序的Bug,不是 Dreamhost 问题,现在为我的愚蠢道歉。)

我和 AnySQL 开玩笑,说他现在是 CNOUG.net 的 CTO 啦,并承诺永久给他的 AUL 工具做广告。

CNOUG Planet 接下来需要进行的修改:

*) 添加"阅读历史"的简单功能 (已经解决);
*) 解决输出的 RSS 文件中的乱码 Bug (已经解决);
*) 添加更多的中文 DBA Blog 信息 (添加中);
*) 更精细的 UI 改进 (基本上差不多了);

力争把这个 CNOUG Planet 变成一个对 DBA/开源爱好者的可靠信息源。

BTW: GreatNews 今天发布了一个新的版本。

--EOF--

安装 Office 2007 试用了几天,新版本用户体验倒的确不错,可就是在我的机器上不够稳定,经常"停止响应",无奈何,删掉 Microsoft Office 2007, 重新安装 Office 2003,启动 Outlook 2003 的时候遇到如下问题:

无法启动 Microsoft Office Outlook。MAPI32.DLL 损坏或版本不对。可能是由于安装其他邮件软件造成的。请重新安装 Outlook。

重新安装一遍,问题依旧,搜索到了微软一篇支持文档,当您尝试启动 Outlook 2003 错误信息: "MAPI 32.DLL 已损坏或版本不对",其说明的原因是:

如果安装 Microsoft Office Outlook 2007 ,然后卸载,再安装 Outlook 2003 就会发生此问题。(原因是)当卸载 Outlook 2007的时候,没有从计算机上除 Outlook 2007 版本的 MSMapi32.dll 文件,该文件位置: C:\ProgramFiles\Common Files Files\System\Msmapi\1033

(Office 删除的时候连自己的文件都弄不干净,唉。另外,微软页面上这段话是机器翻译的,2007 都翻译成 2007 年,我给擅自校订了一下)

这个 MSMapi32.dll 位置似乎是有问题的,我的机器上实际的位置在:

C:\Program Files\Common Files\System\MSMAPI\2052

把该文件重新命名后,再打开 Outlook 2003 就 OK 了.

--EOF--

eBay 的应用服务器规模

| 21 Comments

前面我在《eBay 的数据量》中介绍了一些道听途说来的关于互联网巨头 eBay 服务器架构的信息,不过还缺了一点关键数据。

在 Oracle 站点上的一篇题为 The eBay Global Platform and Oracle 10g JDBC 的白皮书,有能看到一些数据。

在 2004 年的时候,eBay 的应用服务器采用了 IBM WebSphere,部署在 WinNT 上,硬件是 Intel 双 CPU 奔腾服务器。服务器数量是 2400 台。在《eBay 的数据量》中我们知道,eBay 的是集中式处理 Log 的,每天会有 2T 的 Log 数据产生,现在只会更多。这些应用服务器分成不同的组,通过一个统一的 DAL(database access layer) 逻辑层访问 135 个数据库节点。

这篇白皮书已经发布了两年,相信在这两年的时间里,服务器规模又会扩大了许多。

eBay 的 SOA 架构 V3 示意图如下:

关于世界上的超大数据库

| 27 Comments

手边有一份 2005 Winter TopTen Award Winners的报告,包含了一些关于世界上排名前几位的 VLDB 的信息。VLDB,超大数据库,其实叫做"狂大数据库"倒是也很贴切。

如果不区分操作系统环境,Yahoo! 力拔数据仓库一项的头筹,单个数据库数据大小接近 100T 。采用的是 Oracle 数据库,部署在 Unix 上, 存储是 EMC 的设备。这是 2005年的数据,雅虎现在每日接近 40 亿 PV,这个数据仓库现在应该远超 100T 了吧。 电信巨头 AT&T 的数据仓库屈居亚军。Amazon 的两个数据仓库也不小,数据量多达 24773 GB,是用 Oracle RAC 实现的,部署在 Linux 操作系统上。

OLTP Top 10

我比较关心 OLTP 数据库的情况。下面这个图表是包括所有操作系统环境的 OLTP 数据库情况。前 10 名中只有两个采用了集群,而且都是集中式集群(Centralized/Cluster)。其余8个席位都采用了 SMP 架构,而且大多是集中式(Centralized)。分布式超大 OLTP 的成功案例看来并不多(只有 1 例,另外有一例是Federated)。让 Fenng 稍微有些惊讶的是 SQL Server 占了三个席位,数据量最大接近 8T 。整个表看来,数据库类别、所用的软件平台还真的比较平均。并非我想象的完全是 DB2/Oracle+Unix 的格局。

世界上 Top 10 OLTP 数据库

Unix 上 OLTP TOP 10


下表是使用 Unix 操作系统 OLTP TOP 10。好家伙,几乎清一色的 Oracle。DB2 不见踪影,只有 Sybase ASE 还算争气,占了一个席位。 9 个 Unix 平台上的 Oracle OLTP DB,只有两个使用了 RAC ,其他都是 Centralized/SMP。

到现在为止,都还没有看到互联网站点的身影。

本周言论 之 布什妙语

| 3 Comments

先来一个美国总统乔治-布什的经典言论专题。

  • 现在该是人类进入太阳系的时候了。
  • 如果我们不能取得成功,就将面临失败的危险。
  • 对于美国航空航天局(NASA)来说,太空依然是一个重要优先项目。
  • 我们进口商品中的绝大多数来源于国外。
  • 损害环境的不是污染,而是水和空气中的杂质。
  • 一个字基本上总结了所有州长应该担负的责任,这个字就是"做好准备"。
  • 我只是想要你们明白,当我们讨论战争之时,我们实际上是在讨论和平
  • 我赞成将堕胎问题留给妇女和她的医生。
  • 关于国际外交政策,我甚至没有最模糊的想法
  • 上帝要求我打击‘基地’组织,因此我就打击他们;然后上帝又指示我打击萨达姆,我也照办了;现在我决定要解决中东问题
  • 我们所面临的最重要任务是找到奥萨玛-本-拉登。这是我们的第一优先任务,找不到他我们就不休息。
  • 我不知道本-拉登在哪儿。我一无所知,但我真的一点也不在意。那并不重要,它并不是我们的优先任务。

在看了《美国总统布什的50则"精典"语录》后实在是忍不住要记录一下其中的一些有趣的话,真是大智若愚啊(也可能是大愚若智)。

其他言论
We must reduce our headcount by 15-20%。
--Yahoo Memo: The 'Peanut Butter Manifesto'

这是中国最早的 BBS
--马云形容长城上的"张三到此一游"

在网络领域,熬上几个通宵把产品做出来,马上就知道它到底有没有用。生化、医学和其他领域虽然也很有意思,但要等上若干年之后才出结果。
--Paypal 前首席技术官Max Levchin. 他也是 YouTube 成功的关键人物之一。

上帝说,要有工具条

| 4 Comments

上帝说,每个网站都要有个工具条,于是,我们看到了 Google Toolbar、Yahoo! Toolbar、Windows Live Toolbar、Alexa Toolbar ...... 谁知道当前互联网有多少个工具条产品? 如果工具条安装多了一点,浏览器"宽"屏就没有用啦,必须"高"屏才可以。要把这些工具条都安装上,那长度怕是要耷拉到脚面。

现在 Oracle 也来凑热闹,发布了一个 Oracle DBA Toolbar。通过这个工具条能够和 Oracle 官方站点做更好的内容交互,对于数据库工程师来说倒是不错的。DBA Toolbar 也有一个 RSS Manager 功能,并且订阅的 RSS 内容可以动态在工具条上显示(News Ticker 选项,可惜不支持中文)。当前只有针对 IE 版本的,Firefox 版本估计会在不久发布。

Oracle DBA Toolbar , Oracle 的工具条

通过查看该产品介绍得知,Oracle DBA Toolbar 是通过 Dynamic Toolbar 5 定制的。Dynamic Toolbar 这个产品很有意思,把工具条的生产变成了流水线作业,目前已经有不少站点是使用他们的服务,其中就包括 Yahoo! 。

这是一个工具条泛滥的年代。

--EOF--

我对中医的态度

| 23 Comments

被平生一笑同学点名,就中医简单说几句。我对现在的中医基本上持否定态度

这个老话题已经不知道掀起多少轮论战了。如果非要站队的话,我倒是每次都会站在方舟子的一边。尽管他比较激进。可是对付老中医,不激进一点恐怕还真的不行。

中医理论是伪科学

中医理论是不是伪科学? 支持中医的人似乎都认为中医是现代科学理论体系之外的东西,那就是不是科学了,不是科学说是伪科学似乎倒也不过分。"经验"对于中医是最重要的东西,看看现在每个城市仅存的那一两所中医院,有多少中医不是"伪医生"? 管用的经验丰富者怕是不多矣。多数中医大夫是靠着化验结果来做判断。中医理论(如果说有所谓的理论的话),阴阳五行,客观的说,可能包含一些哲学思想在里面,可是如果现在还抱着这个大腿不放,非要指望着这些玄乎的东西来救世,就有些愚昧的意味在里面了。

中医在过去历史上发挥的作用不容抹杀

在现代医学没有的时候,或是现代医学没有进入中国的时候,中医发挥了很大的作用。但这并不意味着中医那些所有的东西还适用于现代社会。反对中医,并不是否定过去,祖宗的东西好,当然要继承,如果不好,那么舍弃也未尝不可。

中医的一些宝贵经验应该保留

一有反对中医的声音出现,一些传统文化拥护者就坐立不安,跳起来反对。又说什么"韩国用中医申请世界遗产啦",日本针灸开始确定标准了之类的话。中医的一些治疗手段(比如针灸)以及中药,可以用现代的研究方法进行深入探究并纳入到现有现代医学体系中。

现在这个医疗环境,需要绝对谨慎对待那些号称无毒无副作用的中药,更要对那些号称"祖传秘方"之类的中药敬而远之。

不要把对传统文化的热爱劲头用到对伪科学的支持上面

中医对于我们中国人来说,文化感情上是难以割舍的。传统文化意味下的中医和现代医学对比下的中医根本是两回事。很多中医的拥护者完全是"关公战秦琼",甚至把什么"数典忘祖"之类的大帽子都扣在中医反对者的头上,完全是使错了力道。

最后引用一段王小波的话(看似和这个话题无关):

四书也好,《红楼梦》也罢,本来只是几本书,却硬要把整个大千世界都塞在其中。我相信世界不会因此得益,而是因此受害。

任何一门学问,即便内容有限而且已经不值得钻研,但你把它钻得极深极透,就可以挟之以自重,换言之,让大家都佩服你;此后假如再有一人想挟这门学问以自重,就必须钻得更深更透。此种学问被无数的人这样钻过,会成个什么样子,实在难以想象。那些钻进去的人会成个什么样子,更是难以想象。古宅闹鬼,树老成精,一门学问最后可能变成一种妖怪。就说国学吧,有人说它无所不包,到今天还能拯救世界,虽然我很乐意相信,但还是将信将疑。

不点名了,谁喜欢反驳,去自己的Blog上写自己的意见吧。

--EOF--


我多少也算生物专业的学生,专业课不咋地,常识还是有那么一点点的。

环西湖毅行

| 13 Comments

上个周六,也就是 11 月 18 日,参加了环西湖群山的毅行活动,坚持走完了据说将近 40 公里的全程,从上午 9:30 走到晚上 7:50 。

周五晚上公司团队活动,茶馆喝茶打牌,半夜才回家,忙活了一会儿都凌晨 1:30 了,7:30 收到短信起床。匆忙收拾了一点东西,就往浙大毛泽东像下面跑。到了一看,好家伙,驴友们装备都很标准啊,惭愧惭愧。

标准的组队形式是三男一女(后来上路了发现也有三女一男的)。主力是 又拍网(Yupoo) 的两位老大。队长是阿华(最早就是他邀请我,答应他后我又不好意思拒绝,打了好几次退堂鼓),组员分别是:

刘平阳 (他可不是一个人,带了他的Toby; 一路无比吸引眼球)
李姓 MM ;
我.

我们的队名很威风:爬行动物。可能是受了队名的影响,刘平阳迟到了,呵呵,我们倒数第一个出发。刚爬上老和山,我就有点晕菜,呼吸根本调不平。咬牙坚持,总算把第一个难关挺过去了。

一直到了第一个打卡点,石人岭,到这里已经追上了几个队,吃东西,补给,我带的东西最少,带的吃的也几乎是最少的,刘平阳背了一个 50L 的大包,还要牵着 Toby,居然还能一路走在前面,我只有敬佩的份儿。

现在开始感觉有点信心--似乎也不那么难走嘛,虽然前面怎么样也不知道,反正就是一步一步向前,煎熬,有一段路右边是军事禁区的铁丝网,走起来很费劲,过了这段路就是穿树林,眼睛都有点花了,下面这张照片应该就是穿出这段树林的时候拍的。

毅行活动照片
IMG_2465
gofeeling上传于Yupoo.

中间那个面目不清的是我。拍这张照片的时候,小雨已经下起来了。

第二个打卡点在云栖寺。之前的这段路多少还是比较温馨的,路边能听到大群的鸟叫声。

第三个打卡点在老玉皇宫,没到这个打卡点之前天已经黑下来。我们四个人谁也没有头灯,还好阿华有个手电筒。这段路可真的快要了命了,这时候腿早已经感觉不是自己的了,就是机械的挪,这段时间回想起来真是无比的漫长......我在无数次憧憬家里被窝的舒适温暖之后,终于看见了前面的灯光,谢天谢地。据说我们是第 8 个打卡的。现在还有 19 支队伍。也就是说,我们后面还有 11 支队伍在挣扎。虽然很累,但希望是一点点的多了起来,看来坚持走到终点不是不可能的。

剩下这一段路说是一个多小时就能走到。没走多远,就找不到先头部队画下的黄色路标了。凭感觉选择石板路,继续走,没走多远,又是一个 T 字路口,怎么找也找不到路标,我们谁也没有指南针,路书上的地图这个时候才看出来真正的简陋。打了电话,方向大约是正确的,继续走。周围都是雾气,树林里只有我们几个在走,很像鬼片里的场景,我又不好意思吓大家,只说像《金刚》里的情节。

又到了一个岔口,赫然看到地上的黄色箭头,大家真是一阵狂喜啊。心想总算没有走错。

过了万松书院,看见路边的路灯光别提多亲切了。在这里碰上了另外两个队伍,沿着盘山路走了一会儿,看到了城隍阁的灯光......

从城隍阁几乎一路小跑杀到了吴山广场。

终于走完了全程。我们一行四人加上一只可爱的 Toby ,以非专业的装备,专业的毅力,完成了这次毅行。第八队到达,如果按照相对时间,可能还要排在前面一些。


(回到家里 从晚上 9 点睡到了周日 12 点,到今天腿肚子还疼)

这样的行走有什么意义呢? 其实我就是想看看自己能不能有这点劲头走下来,仅此而已。

--EOF--

本周言论 之 躲避崇高

我写稿除了稿费没有第二个目的,没有什么崇高理想
--倪匡 (BTW: 看过卫斯理系列么?)

Donews 现在就是 Mop 的性奴隶
--网友评论

为什么我们的出版社总以"无私奉献的雷锋精神"去要求作译者,但实际上却将这种"别人无私奉献所获得的利益"收入自己的腰包?
--图书翻译者李建忠的感慨

如此明亮的大厅,如此典雅的场面,怎么就会将诺贝尔文学奖授予耶内利克,一个描写那么私性、那么变态的一个作家? 文学里面可否多一点和谐的美 ?
--曹文轩

这段古书后面隐藏着一个极大的秘密,对不起,仅靠北大这几百块钱薪水,我还不能讲,谁想知道,得另外请我吃馆子。
--成为旧文人狂狷符号的黄侃

技术资料过载

| 29 Comments

昨天和一位同事聊起网站架构的话题,我向他推荐 Building Scalable Web Sites 这本书,没想到他说:"这本书我就有。现在的问题不是没有资料,而是资料太多没时间看。" 看到 IM 上他的这句话,我差点笑出来,这恰恰也是我的体会。

互联网总会有一些盗火者,几乎每一本计算机图书都能在网上找到电子版。以前曾经蹲在一些论坛(比如雨声论坛),收集了特别多的电子书,0day 一有新的技术图书放出来,立马欣欣然下载之,收藏之。然后呢? 没有然后了--再就没看过。现在我的硬盘里还有不少电子资料,都快属于系统中访问次数最少的文件了。这两年来,我认真看过的电子图书肯定不超过 10 本。而能够从头到尾看完的不超过 5 本。以前费时费事下载下来的电子资料和电子垃圾没什么区别。唯一的好处可能是满足了我对于技术图书的贪婪。

纸质的图书我买的也不少,去年搬家来杭州还带来了不少,舍不得扔,但是有耐心拿起来翻看第二次的只有小说了。

你也有过和我类似的感受么?

--EOF--

有压力 未解决

| 10 Comments

香港巴士阿叔的这两句名言 "我有压力、你有压力"、"未解决" 道出了很多和我境地类似者的心声。

前几天参加一个第三方顾问公司的座谈,被问及"你的工作与生活是否平衡?"这个问题的时候,我几乎是脱口而出 "不平衡,工作压力很大!,但是找不到一个比较合适的缓解压力的办法"。和一些朋友聊天也总是莫明其妙的绕到这个问题上来,"累",几乎是所有人的感觉,无时无处不在的压力使得大家的生活状态总好像是被拉满了的弓。

洗手间里有人贴了"彼得原理"的小贴士:

彼得原理是美国学者劳斯·彼得在对组织中人员晋升的相关现象研究后,得出一个结论:在各种组织中,雇员总是趋向于晋升到其不称职的地位。彼得原理有时也被称为向上爬的原理。 这种现象在现实生活中无处不在...

用压力来套用似乎也很适合:一个员工逐渐能承受更多的压力(也就是所谓的进步、绩效提升喽),但最后总会被压力压垮。

今天看到英国《金融时报》斯特凡•斯特恩的一篇很有意思的文章《别让你的员工太郁闷》

心理健康和幸福并非无足轻重的小事。给予应有的关注甚至可能产生经济效益。毕竟,企业已尝试过其它各种方法来提升生产率:培训、质量、跨职能团队、重新规划。或许链条中真正缺失的一环是不良的健康状态,尤其是精神健康。

可惜,这样的话即使被老板看到也未必能引起重视。

有压力 未解决

--EOF--

与青春有关的日子

| 14 Comments

这几天在看《与青春有关的日子》,真是一部少见的非常有趣的电视剧。

集编剧、导演于一身的叶京真是一个不简单的人物,简直把人物语言尤其是北京话玩活了。我现在才看完第 16 集,每一集都有能让人捧腹的情节。

吴胖子每次出来都有笑料,在他们家发生的一些事情也搞笑。昨天看到他们放录像,有个叫小马蹄儿的(说是大马蹄儿的弟弟),死活要进来看,吴胖子说"你带女的了么? 带了女的就可以进来",小马蹄朝后一喊,"妈,快来...",吴胖子差点气死,"谁让你把你妈带来啦?"

片子放完了

吴胖子说:"演出到此结束。都退场吧?"
屋子里有人哀求,"再放一个吧?我还没看过瘾呢"
"真是的,再放一个吧,来的时候不说那里还有带色(Sai)儿的么?" 小马蹄儿他妈说
刘会元一回头,"唉,难道你刚才看的没色(Sai)? 色盲啊你?"
乔乔也奇怪,"就是的,我们刚才看的不就是彩色的?"
小马蹄儿他妈讲了一句让我喷饭的话: "你们这些年轻人还嫩了点"
冯裤子:"小马蹄儿,你怎么教育你妈的啊? 太没家教了啊"
小马蹄很无奈:"她不懂事,你甭理他,再给我放一个吧,我就冲那个来的"
冯裤子:"哪个呀? 哪个呀? 没那个了"
...
吴胖子:"我说怎么都不动弹啊?" 面向小马蹄他妈,"你这么大岁数了,能不能给我们这些晚辈人起点好的带头作用啊?
...
吴胖子,"这可是我家,你们要是再不走,我可就动用警察了"
小马蹄他妈: "动用警察? 你吓唬谁呀? 你以为我没见过雷子,是吧?"
冯裤子惊讶,"唉呦,小马蹄,你妈过呀? 为什么呀?" 折--那个时间北京黑话,进过监狱(局子)
小马蹄儿: "甭打听了,丢人!"

冯裤子(原型是冯小刚?)也浑身都是戏。佟大为在这部电视剧里扮演方言(王朔的原型),表演也非常自然。

也是好久没看电视剧了,这部《与青春有关的日子》真的值得一看,推荐,推荐!

--EOF--

虽然一些宣传都打着《血色浪漫》II 的旗号,导演叶京不同意这样的宣传口号,在不同场合说过这部《与青春有关的日子》与《血色浪漫》无关的话。而且,电视台播放的剪辑过的 32 集也应该不是导演叶京想要的。

看到最后几集的时候感觉有些蛇尾。略有遗憾。

(现在是广告时间)

如果你对海量数据有较强的分析处理能力,能够透过数据发现一些潜在的问题;
如果你有超强的逻辑推理能力,能够敏锐的寻找到支持你论据的特征值,还原案发现场
如果你对 SEO 或者点击器有一定的了解,做过这方面的探索研究或者是实践;
如果你曾经是一名站长,厌倦了江湖争斗,希望成为网络秩序的捍卫者...

那么你就是我们最合适的人选,我们诚邀你加盟我们(雅虎中国)的竞价防作弊Team,还我们的客户一个明亮纯洁的广告投放空间。

如果你不具备以上的条件,只要你有一颗正直的心,同时有希望成长为一个经验丰富的网络安全卫士的决心和勇气。当你具备以下技能后,你仍然可以加入我们的队伍。

1. 1 年以上工作经验。
2. 半年以上 Linux 使用经验。
3. 开发语言:Perl/PHP/Shell,熟练掌握其中至少1种。
4. 了解 HTML/JavaCcript 网站制作技术,具有网站制作、开发经验。
5. 有过海量(百万以上)数据统计、分析经验更佳。
6. 有一定的沟通能力,具有协同工作经验。

来吧!惩恶扬善,维护世界和平的重任就落在你的肩上了!

此时此刻,非你莫属!
感兴趣的朋友给我发电子邮件吧: [email protected]

--EOF--

豆瓣推出新功能: 我上

| 12 Comments

在网志年会上,阿北透露豆瓣将在最近有新的东西推出,不过当时没有刨根问底,只是问他会不会推出针对电子产品(比如数码相机,笔记本)这样的频道,得到的回答是否定的。今天看到新华网对阿北的访谈,阿北透露了豆瓣新功能"我上":

豆瓣网在推新的功能,以前有很多读书、电影、音乐,我看、我听,我们把它们合并起来,有空间能够放“我上”。

这个产品是"个人空间"还是"Digg"?

同时我们在做一些新东西,近期有一个栏目“我上”将推出,是博客推荐,从中你可以发现一些不是很知名,但很有意思的东西。

Blog 推荐,似乎是有点 Digg 的味道。目前国内还真没有一个很出色模仿 Digg 的站点,更容易切入。

图书、电影、音乐、旅游 + Blog,给每一个用户感兴趣的东西一个展示的机会 ?

豆瓣存在给每一个客体产生微内容的平台的可能。

Updated:
中午向朋友推荐的时候还不见这个功能,现在已经推出来了。见图:

豆瓣的新功能:我上

试用了一会儿,发现这个功能对于 Blog 拥有者来说,更有粘度

--EOF--

超级解霸, 远去的豪杰

| 23 Comments

今天升级 foobar2000 的时候,忽然想起来一个问题:在今天还有人用超级解霸的么? (一个音频工具,一个视频工具,我也不知道怎么就联系上了)

曾几何时,超级解霸就是媒体播放工具的代名词,梁肇新也是那个年代的 IT 传奇英雄。从一些媒介上能看出来,这个大脑袋的梁肇新是一个 Windows 编程高手,也是一个非常偏执的人,不过对于技术趋势并没有很好的感觉。我还记得他曾经说过的 "Linux 是假技术"论,搜了一下,当初梁肇新是这样说的:

从一开始,我就认定,Linux 不会走得太远,我认为它注定只是一种炒作,一种'假技术'。一种技术要有前途,必须满足下面的三个要素:兼容性、开放性和标准性。Linux 的致命缺陷在兼容性上面。所以,我断定,Linux 不会有什么前途。

现在把这段话再拿出来看,几乎和笑话一样。"兼容性、开放性和标准性",超级解霸是符合的么? 相反,几乎没有什么高精尖技术而仅仅是封装开源产品的暴风影音等同类产品倒是占据了更多的市场。看一下国外,和超级解霸几乎一个模式的 DivX 折腾折腾还上了市。

尽管这个产品拥有"消除毛刺、断点续播、数字音频、P2P播放、数字影院等数十项专利技术",从用户的角度上看,我倒认为,超级解霸最大的一个缺点就是糟糕的界面--一种华丽的土气(如果是 foobar2000 这样的朴素反而是另外一回事)。多少个版本延续花里胡哨的土界面,这种设计理念倒有点和梁肇新的偏执脾气类似。

前一段时间有传言:超级解霸将可能被收购。尽管会有什么"进军网络媒体"之类的豪言壮语,但要想恢复往日的荣光几乎是不可能的了。被收购几乎意味着一种放弃,很难看到有哪一个曾经风光的通用软件被收购后重放光彩,还是提前纪念一下这个曾经的传奇软件吧。

--EOF--

前几天看到业界猜测 "雅虎的困惑: 卖给微软还是收购AOL" 的时候,我倒是想雅虎为什么不收购 Six Apart 呢(后台技术架构也蛮符合的)? 当然,这不过是我一厢情愿的胡乱猜测,现在 Six Apart 活得滋润得很,而且,人家也胃口不小,在前一段时间流传的一份 Web 2.0 收购列表中,我们可以看到 Six Apart 也是和 Google / Yahoo 等巨头一起作为收购方出现的,Six Apart 收购有两笔,共 3000 万交易金额:

收购时间 被收购方 收购方 传闻价格
Jan-05 LiveJournal SixApart $20 million
Sep-06 Rojo SixApart $10 million

Six Apart 目前能够提供最为全面的 Blog 服务,从 Blog 这一点出发,可谓做足了功夫:

Movable Type: 企业级 Blog 内容发布平台,面向中小企业,对个人用户的版本免费,积累了很不错的口碑。
TypePad : 传统意义上的 BSP。面向传统 Blogger。
LiveJournal:面向 Geek 。
VOX: Blog 生活社区。 (超一流的用户体验,另,推荐 Flypig 的《Six Apart总裁访谈》一文)。

在这个外围,有最近收购的 Rojo, 提供在线 RSS Reader 服务。

或许是因为从 Movable Type 这样的工具起家的缘故,Six Apart 对所有产品 "打磨" 得都非常细致,功能可能未必是最全最强大,但是用户使用体验几乎都是一流的。我就是 Six Apart 的忠实用户--使用他们免费的产品 Movable Type 个人版快两年了。

相信 Six Apart 有机会成为 Web 2.0 时代的小巨人。从最初的夫妻店发展到现在,这本身也是一个不折不扣的传奇故事。

--EOF--

06 年 Oracle 杂志编辑选择奖

| 11 Comments

2006 年度 Oracle 杂志编辑选择奖已经出来了。

Steven Feuerstein 是 "年度PL/SQL 开发者"。这位 PL/SQL Guru 还在琢磨如何和布什见个面

Jonathan Lewis 是 "年度 Oracle 作者",他的 Cost-Based Oracle Fundamentals 一书的确很见功力。Thomas Kyte 也有实力竞争这个奖,但 Tom 毕竟是 Oracle 公司的,多少也要避嫌一下--我猜的。

Eddie Awad 获得"年度 Oracle 相关 Blogger" 奖,我觉得这个大胡子写的其实也一般,谁让咱们不会用英文写 Blog 呢? 05 年的获得者是 Mark Rittman ,Blog 质量的确不错。

Tim Hall 获得 "年度 Oracle ACE"奖。Tim Hall 是 Oracle-Base 站长。他发表在 Oracle-Base 上的文章有一定的参考价值。到现在 我也不知道 Oracle 的 ACE 这三个字母都代表什么,A 是 advocates ? 总之, ACE 就是那些在 Oracle 技术圈子比较活跃的人,有些 Guru 级的人入选,也有些技术功底并非那么深厚但是在社区非常活跃的人入选。中国大陆似乎还没有 ACE。

Regent Roberge 获得 "年度DBA 奖"。对他的事迹不了解。

另外 还有个 "年度开源开发者" 被 Internet Archive 公司的 Gordon Mohr 得到,Oracle 杂志编辑选择奖本来和开源八杆子打不着,看来是收购 Sleepycat 之后专门为拉拢 Berkeley DB 开发社群而建的。

其它的得奖名目还有什么"年度 CIO" 之类的,没准是 Oracle 的关系客户。

--EOF--

Craigslist 的数据库架构

| 10 Comments

(插播一则新闻:竞拍这本《Don’t Make Me Think》,我出价 RMB 85,留言的不算--不会有恶意竞拍的吧? 要 Ping 过去才可以,失败一次,再来)

Craigslist 绝对是互联网的一个传奇公司。根据以前的一则报道:

每月超过 1000 万人使用该站服务,月浏览量超过 30 亿次,(Craigslist每月新增的帖子近 10 亿条??)网站的网页数量在以每年近百倍的速度增长。Craigslist 至今却只有 18 名员工(现在可能会多一些了)。

Tim O'reilly 采访了 Craigslist 的 Eric Scheide ,于是通过这篇 Database War Stories #5: craigslist 我们能了解一下 Craigslist 的数据库架构以及数据量信息。

数据库软件使用 MySQL 。为充分发挥 MySQL 的能力,数据库都使用 64 位 Linux 服务器, 14 块 本地磁盘(72*14=1T ?), 16G 内存。

不同的服务使用不同方式的数据库集群。

论坛

1 主(master) 1 从(slave)。Slave 大多用于备份. myIsam 表. 索引达到 17G。最大的表接近 4200 万行。

分类信息

1 主 12 从。 Slave 各有个的用途. 当前数据包括索引有 114 G , 最大表有 5600 万行(该表数据会定期归档)。 使用 myIsam。分类信息量有多大? "Craigslist每月新增的帖子近 10 亿条",这句话似乎似乎有些夸张,Eric Scheide 说昨日就超过 330000 条数据,如果这样估计的话,每个月的新帖子信息大约在 1 亿多一些。

归档数据库

1 主 1 从. 放置所有超过 3 个月的帖子。与分类信息库结构相似但是更大, 数据有 238G, 最大表有 9600 万行。大量使用 Merge 表,便于管理。

搜索数据库

4 个 集群用了 16 台服务器。活动的帖子根据 地区/种类划分,并使用 myIsam 全文索引,每个只包含一个子集数据。该索引方案目前还能撑住,未来几年恐怕就不成了。

Authdb

1 主 1 从,很小。

目前 Craigslist 在 Alexa 上的排名是 30,上面的数据只是反映采访当时(April 28, 2006)的情况,毕竟,Craigslist 数据量还在每年 200% 的速度增长。

Craigslist 采用的数据解决方案从软硬件上来看还是低成本的。优秀的 MySQL 数据库管理员对于 Web 2.0 项目是一个关键因素。

--EOF--

本周言论 之 我死诸君思我狂

| 9 Comments

如果你愿意出200块的快递费,我给你找新丝路的模特儿给你送快递上门
--当当网李国庆

阿扁说当初提名我时忠心耿耿,现在不听话,我是对职务忠心耿耿,不是对你阿扁
--苏振平

我们的规模不是很大,没有很大的目标,我们希望通过服务的盈利模式在2008年底前实现盈利。
Ubuntu并不是非常有野心,我们不会成为微软这样的公司,我们是一个小公司
--Ubuntu 创始人 Mark Shuttleworth

博客实名制是势不可挡的
--方兴东

我死了以后,你们想我会发疯的,所谓'我死诸君思我狂'啊
--李敖. (这句话前半句方舟子说也可以,我支持方舟子)

这两天我在尝试选择一个 CMS 系统,看过了网上的不少文章,在 CMS Matrix 站点上做了 N 次的对比表之后,决定采用 Joomla!。安装的时候,着实费了一点时间。

Joomla! 的官方安装文档倒是图文并茂的,但是还有些简略。第二步的时候,需要输入数据库的信息,主机名字,用户名,密码,还有数据库名字,可是总无情的弹出一个窗口告诉我 "Password and username incorrect..."。在终端命令行下,通过这些信息是可以登陆的。

RHEL 3 自带的 MySQL 版本比较低(3.23.58),启动比较麻烦,干脆跑到 MySQL 官方站点下载了一个 5.0 的稳定版本来用。

难道是版本太高带来的问题么 ?

尝试搜索了一下,原来是老问题

A.2.3. Client does not support authentication protocol MySQL 4.1 and up uses an authentication protocol based on a password hashing algorithm that is incompatible with that used by older clients. If you upgrade the server to 4.1, attempts to connect to it with an older client may fail with the following message:

按照该帖子提示的用 OLD_PASSWORD() 重新设置了一下指定用户的密码,安装可以继续下去了。

登录到后台,测试了几篇帖子,发现 Joomla! 对中文的支持超出我的期待。

--EOF--

anothR -- 基于 Skype 的 RSS Reader

| 3 Comments

跟踪英文 Blogger 圈子对中文网志年会的报道,在 O'Reilly Radar 的一篇 Blog 上注意到了这个基于 Skype 的 RSS Reader: anothR

Skype 用户只需要把 anothR.com 机器人加到自己的联系人中。然后给这个联系人发一个 RSS 地址即可订阅这个 RSS Feed。机器人会详细提示使用方法。挺有创新性的 Web 2.0 应用。O'Reilly Radar 的那篇 Blog 说这个应用是在网志年会上启动的,我怎么一点都没有听说? 还是这个老外搞错了?

(BTW: 这个老外说"Skype was on >80% of the computers I used while I was in China", Skype 在中国有 80% 以上计算机都在使用? 他不是来中国只在易趣呆了几天吧?)

这个工具的界面:

eBay 的数据量

| 12 Comments

作为电子商务领头羊的 eBay 公司,数据量究竟有多大? 很多朋友可能都会对这个很感兴趣。在这一篇
Web 2.0: How High-Volume eBay Manages Its Storage(从+1 GB/1 min得到的线索) 报道中,eBay 的存储主管 Paul Strong 对数据量做了一些介绍,管中窥豹,这些数据也给我们一个参考。

站点处理能力

  • 平均每天的 PV 超过 10 亿 ;
  • 每秒钟交易大约 1700 美元的商品 ;
  • 每分钟卖出一辆车A ;
  • 每秒钟卖出一件汽车饰品或者配件 ;
  • 每两分钟卖出一件钻石首饰 ;
  • 6 亿商品,2 亿多注册用户; 超过 130 万人把在 eBay 上做生意看作是生活的一部分。

在这样高的压力下,可靠性达到了 99.94%,也就是说每年 5 个小时多一点的服务不可用。从业界消息来看,核心业务的可用性要比这个高。

数据存储工程组控制着 eBay 的 2PB (1Petabyte=1000Terabytes) 可用空间。这是一个什么概念,对比一下 Google 的存储就知道了。每周就要分配 10T 数据出去,稍微算一下,一分钟大约使用 1G 的数据空间。

计算能力

eBay 使用一套传统的网格计算系统。该系统的一些特征数据:
  • 170 台 Win2000/Win2003 服务器;
  • 170 台 Linux (RHES3) 服务器;
  • 三个 Solaris 服务器: 为 QA 构建与部署 eBay.com; 编译优化 Java / C++ 以及其他 Web 元素 ;
  • Build 整个站点的时间:过去是 10 个小时,现在是 30 分钟;
  • 在过去的2年半, 有 200 万次 Build,很可怕的数字。

存储硬件

每个供货商都必须通过严格的测试才有被选中的可能,这些厂家或产品如下:
  • 交换机: Brocade
  • 网管软件:IBM Tivoli
  • NAS: Netapp (占总数据量的 5%,2P*0.05, 大约 100 T)
  • 阵列存储:HDS (95%,这一份投资可不小,HDS 不便宜, EMC 在 eBay 是出局者) 负载均衡与 Failover: Resonate ;


搜索功能: Thunderstone indexing system ;
数据库软件:Oracle 。大多数 DB 都有 4 份拷贝。数据库使用的服务器 Sun E10000。另外据我所知, eBay 购买了 Quest SharePlex 全球 Licence 用于数据复制.

应用服务器


应用服务器有哪些特点呢?
  • 使用单一的两层架构(这一点有点疑问,看来是自己写的应用服务器)

  • 330 万行的 C++ ISAPI DLL (二进制文件有 150M)

  • 数百名工程师进行开发

  • 每个类的方法已经接近编译器的限制

非常有意思,根据eWeek 的该篇文档,昨天还有上面这段划掉的内容,今天上去发现已经修改了:

架构

  • 高分布式
  • 拍卖站点是基于 Java 的,搜索的架构是用 C++ 写的
  • 数百名工程师进行开发,所有的工作都在同样的代码环境下进行

可能是被采访者看到 eWeek 这篇报道,联系了采访者进行了更正。我还有点奇怪原来"两层"架构的说法。

其他信息

  • 集中化存储应用程序日志;
  • 全局计费:实时的与第三方应用集成(就是eBay 自己的 PayPal 吧?)
  • 业务事件流:使用统一的高效可靠消息队列. 并且使用 Cookie-cutter 模式用于优化用户体验(这似乎是大型电子商务站点普遍使用的用于提高用户体验的手法)。

后记

零散作了一点流水帐。作为一个 DBA, 或许有一天也有机会面对这样的数据量。到那一天,再回头看这一篇电子垃圾。

更新:更详细信息请参考:Web 2.0: How High-Volume eBay Manages Its Storage。可能处于 Cache 的问题,好几个人看到的原文内容有差异

--EOF--

关于这篇归档

This page is an archive of entries from November 2006 listed from newest to oldest.

October 2006 is the previous archive.

December 2006 is the next archive.

Find recent content on the main index or look in the archives to find all content.