July 2007 Archives

甲骨文全球大会

| 6 Comments

最近会议比较多,下周一到周四要跑到上海参加甲骨文全球大会(Oracle Open World)

对于一个 DBA 来说,每次 OOW 的技术讲座肯定比那些到处派发的小奖品更加吸引人。刚才总算有空仔细看了一下本次 OOW 的技术讲座列表。我对如下几个主题比较感兴趣:

  • Rich Niemiec 讲座序号 720: Oracle数据库11g的最佳新功能(一)
  • Rich Niemiec 讲座序号 721: Oracle数据库11g的最佳新功能(二)

Oracle 11g 最早也要到 8 月份才可以发布,不过现了解一点新功能过把瘾还是不错的。

顺便说一下,Rich Niemiec 接受了 Alibaba DBA 团队的邀请,将于 OOW 之后在杭州举办一场 Tuning at Block Level 的技术演讲。如果有杭州的朋友感兴趣,可以联系我。给你预留座位。技术方面国外过来的人物,Rich Niemiec 算是这次 OOW 比较大的腕儿了。如果你不知道他是谁,可以忽略这一段。

其他感兴趣的主题有:

  • 讲座序号 276: SQL Server向Oracle数据库迁移案例研究
  • 讲座序号 221: Oracle数据卫士----开创数据可用性和数据保护的新纪元 (数据卫士, 就是 Data Guard,翻译的挺好......)
  • 讲座序号 228: 如何利用 Oracle TimesTen 内存数据库大幅提高数据库管理软件的响应速度
  • 讲座序号 222: 超大型数据库备份和恢复策略
  • 讲座序号 238: Linux用户当然之选(Oracle Linux配置管理)
  • 讲座序号 215: 利用Oracle Database Vault选件保护数据

Oracle OTN 中文网还有个 OTN Lounge,我需要参加的。主要是个陪衬 :) 基本上国内这几个 ACE 凑齐了。对于这次活动,可以参见 eygle 的介绍

30 号晚上 ITpub 有个采访。主题是 《ITPub 5大 ACE 点评 Oracle 11g 数据库》. 其他的时间我还没有安排呢。或许去看看同学。对了,如果有朋友准备加入我们团队,可以直接和我联系 :)

周四我可能就必需要回到杭州了。

--EOF--

青岛归来

| 3 Comments

昨天实在是没时间了。这篇算是补充一下昨天的事情。继续说流亭猪蹄

我是早晨 8点 10分山航的班机,IBM 在宾馆早晨有送机服务。大雾,还好高速路没有封闭,跑起来,雾就有点散了。先到机场,然后给了点司机小费,让他拉着我到饭店去买。机场出来,走小路,到了鑫复盛,大门紧闭,看看时间,还不到7点钟,可能是比较早,没上班。司机说,我给你拉到后面库房看看,绕到后面,也没人,后面看样子刚拆迁过,很荒凉。

没办法,只好回机场,看到一个商场,很多人在里面买食品,进去一问,还真有。什么叫踏破铁鞋无觅处? 这就是。不过就剩一个了。我说要多买几个,服务员倒是还不错,到其他商店转了一圈,总算又拿到了几个。价格可不便宜,大约是鑫复盛的2倍还多。真是坐地起价,服务员说得倒好,"现在猪肉涨价了,你不知道么?"

去的时候是南航,服务态度不咋地,饮品也很少。回来的山航给我感觉还不错。这是唯一的一次在降落的时候耳朵不疼(关于飞机降落的时候耳朵疼,科学的解释是这样的:在飞机的起降过程中,由于压力的变化,牵拉耳膜触动神经,使耳朵觉得有异常。有的人说做吞咽动作会缓解,的确能好一点,不过还是非常难受)。是山航飞行员技术好? 还是飞机好? 其他航空公司降落的时候都是陡降,山航降落过程则是渐降(我的描述方式是这样,具体术语不懂).

杭州一落地可真是热,和青岛的凉爽没办法比。折腾到家里,已经 11 点半了。

--EOF--

流亭猪蹄

| 3 Comments

以前 Laura 在青岛工作过一年。时间过去了这么久,还没有忘记青岛的流亭猪蹄 :) 这次我来青岛,吩咐下来要带点回去。宾馆附近就是两个超市,Jusco 与 家乐福,转了一圈,一身汗。猪蹄倒是有,没有"流亭"字样。出门上了出租车,一打听,"市区买不到,除非你到流亭买。"

回到宾馆,搜索了一下,网上的一些简介基本上都是用这个:

流亭秘制猪蹄,据族谱记载,最早起源于清朝末年(1893年),至今已有110余年的历史,以"诚信、创新发展"的理念,五代相传。流亭秘制猪蹄系列产品。口味纯正,口感凉爽,香而不腻,无任何防腐材料,是岛城名吃,绿色食品,深受国内外消费者喜爱。

最有名的店有两家,鑫复盛与复盛,不知道啥关系。云里雾里,对复盛的介绍如下:

"复盛"字号创始于清朝末年、民国初期,是一个距今已有百年经营立时的老字号饭店。复盛饭店以祖传秘方加现代科技工艺和创新精神,研制出适合当今人们口味的流亭"复盛牌"猪蹄及系列产品,该产品曾荣获"青岛名吃"称号,在青岛市青年喜爱的国产消费品活动中获同类消费品活动中获同类产品第一名,"复盛牌"猪蹄以其独特的品质,赢得了顾客的认可和赞誉,饭店天天宾客满座,国内顾客络绎不绝,甚至许多国外游客也慕名而来,盛赞"复盛牌"猪蹄为"天下第一蹄"。

在网上找复盛的电话(给我的第一感觉可能这家正宗一些),发现好几个提供生活信息的网站列出的电话根本就是错的。不由得感慨在互联网相对发达的今天,仍然有很多闭塞的地方。鑫复盛自己有个介绍网站,电话过去,总算通了。问了一下营业时间,早晨不营业。"鑫复盛和复盛啥关系?","鑫复盛是老爷子的店,复盛是儿子开的。" 原来还是父子店。

看来"流亭猪蹄"这个品牌还有待进一步宣传与开发。唠叨了半天,明天早晨也不知道能买到不。

--EOF--

补记: 晚上吃饭回来,发现新华书店就在对面。走到门口刚要进去,服务员告诉我打烊了。看看时间还差几分钟,"能就在门口转转么?" "不行!" 新华书店的服务态度还是这么差,怎么迎接奥运啊?

在青岛

| 9 Comments

刚毕业那会儿,来青岛挺勤快的。之后俺家 Laura 从青岛辞职后,我就一趟没来过。这次借着开会的机会算是故地重游。地面 30 摄氏度,海风吹来,凉快极了。相比之下,杭州好像一个大蒸笼,就这个热,据说在全国的"火炉"评比中还排不上号呢。

下午跟着大家一起去石老人海滨浴场,这个石老人浴场其实离真正的石老人还有好远呢。沙滩还算凑合。中国北方海岸线上的沙滩估计都这样。天气不热,人可真多。没带泳裤,买条便宜一点的,20,要更衣的吧? 5块,游泳后总要冲一下的水吧? 冲水? 10块。浴场不收门票,倒也便宜你不到什么地方去。这样做生意倒也很有意思

晚上去什么啤酒街吃饭,我有痛风,平时不能喝啤酒,不能吃海鲜,今天稍微破点例。其他几个朋友都是南方人,胃口大开。回来的路上出租车司机问:
"吃的好?"
"还不错"
"那我就不说啥了"
"啊? 这里不好嘛?"
"都是政府的炒作,东西太贵,坑你们游客呢,我们吃都去老城区那边"
晕!

--EOF--

写 Blog 这件事儿

| 4 Comments

今天总算看到 FeedBurner 显示的订阅数字超过 5000 个了。算是我这个 Blog 的一个里程碑吧,自我虚荣一下。虽然这个数字里面有很大的重复订阅量。通过这个 Blog 分享了一些信息,也认识了不少朋友,这是让人快乐的事情。

关于写 Blog 这件事儿

很早以前我写过一篇 《Blog 写给谁》 很清楚的说明了自己写 Blog 的角度。既然这样,我写的东西肯定带有很大的个人倾向,我自己的立场。写这个东西没有谁给我发工资,还要自己掏钱买空间,域名续费什么的,容易么? 我不能保证所有文章都是墙头草,谁都不得罪,我也不能保证总写技术,也不能保证总写一些技术概述(这类东西读者多,被抄袭的也多),我喜欢写影评,那就写点,觉得没价值简单看个标题就过去好了,没必要看完了觉得不爽,非要表达一下自己的情绪,要知道我这个破 Blog 速度是出奇的慢。

最近有几篇还出现了一点不那么和谐的声音。也有人留言告诉我"应该"怎么做,怎么写。有语言洁癖的同学其实大可不看,风花雪月的你可以去看郭敬明,去看老徐,来这里浪费时间干嘛? 从小到大都被当作棋子儿,走别人划的印走惯了? 身体刚不那么柔软了,就开始想给别人划印了?

关于 Blog 内容的抄袭者

有些人可能看到我总结的玩意儿后觉得有点参考价值,就转载了一下。有的人注意到我每篇文章前面的声明,保留了版权信息和出处,在当前的网络文化下,我只能表示"欣赏"。而有些人给改头换面之后再来个 "CTRL+C / CTRL+V", 这是我最厌恶的方式。如果你觉得内容真的有用的话,直接收藏地址不就成了嘛? 不知道 del.icio.us 还不知道雅虎收藏+、百度搜藏么? 还不知道的话,你 IE 上不是还有个收藏夹么? 非把内容弄到你那一亩三分地干嘛? 再说了,如果是技术信息,我以后还有更新怎么办? 你在那里不是误导别人么? 对于不遵守我的版权声明的转载一律视为抄袭者。这样的人我这个 Blog 不欢迎!

关于 Blog 最近的一些计划

MT4 正式发布之后将重新设计一下模版。目前的模版拼拼凑凑的,问题不少,留言问题其实也和模版相互关联有关。尝试彻底解决一下。目前的空间还存在不少安全问题,真没准儿哪天直接给人一窝端了。如果真是这样,我还省心了。:)

--EOF--

YouTube 的架构扩展

| 27 Comments | 1 TrackBack

西雅图扩展性的技术研讨会上,YouTube 的 Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址),可惜国内用户看不到。

Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes 的介绍是本文的主要来源)

简单的说 YouTube 的数据流量, "一天的YouTube流量相当于发送750亿封电子邮件.", 2006 年中就有消息说每日 PV 超过 1 亿,现在? 更夸张了,"每天有10亿次下载以及6,5000次上传", 真假姑且不论, 的确是超乎寻常的海量. 国内的互联网应用,但从数据量来看,怕是只有 51.com 有这个规模. 但技术上和 YouTube 就没法子比了.

Web 服务器

YouTube 出于开发速度的考虑,大部分代码都是 Python 开发的。Web 服务器有部分是 Apache, 用 FastCGI 模式。对于视频内容则用 Lighttpd 。据我所知,MySpace 也有部分服务器用 Lighttpd ,但量不大。YouTube 是 Lighttpd 最成功的案例。(国内用 Lighttpd 站点不多,豆瓣用的比较舒服。by Fenng)

视频

视频的缩略图(Thumbnails)给服务器带来了很大的挑战。每个视频平均有4个缩略图,而每个 Web 页面上更是有多个,每秒钟因为这个带来的磁盘 IO 请求太大。YouTube 技术人员启用了单独的服务器群组来承担这个压力,并且针对 Cache 和 OS 做了部分优化。另一方面,缩略图请求的压力导致 Lighttpd 性能下降。通过 Hack Lighttpd 增加更多的 worker 线程很大程度解决了问题。而最新的解决方案是起用了 Google 的 BigTable, 这下子从性能、容错、缓存上都有更好表现。看人家这收购的,好钢用在了刀刃上。

出于冗余的考虑,每个视频文件放在一组迷你 Cluster 上,所谓 "迷你 Cluster" 就是一组具有相同内容的服务器。最火的视频放在 CDN 上,这样自己的服务器只需要承担一些"漏网"的随即访问即可。YouTube 使用简单、廉价、通用的硬件,这一点和 Google 风格倒是一致。至于维护手段,也都是常见的工具,如 rsync, SSH 等,只不过人家更手熟罢了。

数据库

YouTube 用 MySQL 存储元数据--用户信息、视频信息什么的。数据库服务器曾经一度遇到 SWAP 颠簸的问题,解决办法是删掉了 SWAP 分区! 管用。

最初的 DB 只有 10 块硬盘,RAID 10 ,后来追加了一组 RAID 1。够省的。这一波 Web 2.0 公司很少有用 Oracle 的(我知道的只有 Bebo,参见这里). 在扩展性方面,路线也是和其他站点类似,复制,分散 IO。最终的解决之道是"分区",这个不是数据库层面的表分区,而是业务层面的分区(在用户名字或者 ID 上做文章,应用程序控制查找机制)

YouTube 也用 Memcached.

很想了解一下国内 Web 2.0 网站的数据信息,有谁可以提供一点 ?

--EOF--

收到一段牛B且二B的留言

| 16 Comments

移步观赏.

--EOF--

关于 Fenng.com 的趣事

| 9 Comments

第一幕 (2007)

我在网上的 ID "Fenng" 是我造出来的一个词,记得当时是搜索不到具体意思的,个别能看到的结果也都是拼写错误。前几天偶然好奇,看看 Fenng.com 这个域名是否被注册了,显示是未注册。然后就没当回事。

昨天晚上,无聊之中又搜索了一下,发现已经被注册。还有点患得患失,被人抢注了,唉.

看一下注册日期,居然就是当天,再看一下注册人,Jackie Geng,啊,很熟悉,以前的同事老 Geng 就是这个英文名字。莫非,是他? 刚好这个时候,Jackie 在 MSN 上给我打招呼。
我直接问他:FENNG.com 这个域名是你注册的?
他很惊讶:这么快就被你发现了?
我说:我也是偶然看到的被注册了。
他告诉我刚注册没有几分钟,还热乎的呢。
想想,的确很神奇。不由得哈哈大笑。

老 Geng 很痛快的把这个域名送给我了,有机会一定要请他吃个饭。

第二幕 (2010)

且说这个域名我拿到之后还真的没怎么当回事,要过户到我名下还比较麻烦,所以一直没启用,结果一年后没留意,居然过期了。后来等想起来后悔已晚,去年想起来这事情查询了一下,发现又被别人注册,仔细一看联系人,居然是我在网络上认识朋友,还是我的本家。抱着试探的心态问了一下能否转让给我,这位朋友非常爽快,同意转给我。只是要把域名转出的时候发现还需要符合域名注册商的各项条件,只能再等几个月。

转出的时候还费了不少周折,发过来的域名密码在域名 Transfer 的过程中总被原来的注册商拒绝。反复尝试了很多次都不行,只得又麻烦这位朋友和域名注册商反复沟通了多次,终于又发来一个密码,比原来的密码多了两个反斜线,这次输入,还是不对。看着密码端详了半天,觉得两个反斜线或许是正则转义后多了一个,去掉,重试,成功。泪奔。

经过几天的等待,终于收到了这条信息:

Congratulations! The transfer request for the following domain name(s) has been completed:
FENNG.COM

从此之后, FENNG.com 这个域名正式属于我的了。

感谢这位割爱转让域名的朋友。

--EOF--

世说新语: 拍拖问题

我不是著名的广告人,但是我是在用生命经营的广告人
--侯总 史上最牛广告人

今天不拍拖是为了明天更好地拍拖
--华南师范大学南海学院李醒华对学生说. 这个学校的绝密文件真是 21 世纪的经典。

只要不谈房价!
--建设部官员们应承来参加房地产论坛的前提条件

我在外地上班,专门坐飞机回兰打狗,为此,我也付出了一定的代价。
--专程坐飞机回兰州上街打狗的人

对于《变形金刚》这样有着全世界拥趸的好题材,即使用好莱坞的末流导演来拍(只要不用中国的几个"主流"导演),票房也不会差到什么地方去。可是看完了片子,还是觉得导演 Micheal Bay 这次的水平真的到了末流之下。

没看电影之前,有些评论说什么几条线索同时推进,有明线,有暗线。现在真想评论一句:狗屁!本来就是一个挺简单的事儿,就别整什么复杂的情节了,根本不能自圆其说,简直是画蛇添足。自作聪明加进去的一些笑料,把电影搞得和肥皂剧差不多。汽车人们设计的也没有什么美感,浑身零零碎碎的,非常奇怪的是擎天柱和威震天搏斗的时候怎么不掉两个零件什么的。擎天柱脑袋用的材料不知道是不是二手回收塑料弄的,好像都起皮了。

最后要说的是 Micheal Bay 导演应该改叫做 Micheal eBay--实在是出来太多 eBay 的广告了。

--EOF--

Oracle 11g 中 Alert Log 的变化

| 2 Comments

从 Oracle 11g 开始,Oracle 以 XML 与传统的文本两种格式提供 Alert 日志。

新的日志位置由 Automatic Diagnostic Repository (ADR) 决定。可以通过新的初始化参数 DIAGNOSTIC_DEST 控制 ADR BASE 的位置。如果没有设定这个初始化参数的位置,而设置 ORACLE_BASE 环境变量的话,那么,如果没有设定 ORACLE_BASE , 则 ORACLE_HOME/log 即为 DIAGNOSTIC_DEST。

Alert Log 文件父目录的位置在:

ADR_BASE/diag/product_type{eg:rdbms}}/product_id{eg:11g}/instance_id

这个目录下有 alert/trace/bdump 之类的子目录。就是 Log 的具体位置了。alert 下是 XML 文件:

select value from v$diag_info where name ='Diag Alert';
trace 目录下是文本文件:
select value from v$diag_info where name ='Diag Trace';

这个位置的变化还是挺突兀的。用惯了旧版本的用户会不太习惯。尤其是基本版本都存在的环境更觉得麻烦. 好处 ? XML 能有什么好处......通过 EM 能更好的展现内容?

--EOF--

看了大卫-芬奇的《十二宫》(Zodiac),可能是我的期望值过高,Zodiac 并没有给我带来类似《七宗罪》的震撼。整个片子属于慢热型。杀人狂似乎只是因为阴差阳错而漏网,并没有体现出来多么高的智商,自命不凡倒是有那么一点。

结尾的主题歌很好听,搜索了半天才知道这首歌叫做《Hurdy Gurdy Man》,歌手是 Donovan,这首歌来自他的同名专辑(更正一下,专辑的名字也是《Hurdy Gurdy Man》)。Donovan 对声线的控制很有意思。感觉和 The Doors 有些神似。

--EOF--

EMC 推出 DMX4

| 5 Comments

在 HDS 发布新产品 USP V 后两个月,EMC 宣布推出 DMX-4

DMX-4 似乎没什么亮点。官方说明也就这么几个:后端终于支持 4GB 通道了(HDS 可是老早就支持了); 将支持 750GB SATA 盘。至于性能提升,说得比较模糊,大约是 1/3 的样子。在软件方面没有什么大的变化。 本来听说 DMX-3 将有一次微码升级才能支持端到端的 4GB。看来这次微码升级直接变成 DMX-4 了。

等闲下来收集一点资料,看看现在存储服务成本最低能控制到多少.

--EOF--

SNS 站点中的'水葫芦'

| 8 Comments

看这个题目可能有人会有疑问,SNS 站点和水葫芦有啥关系?

周六周日和项目团队去华庄生态农业园玩了一次,钓鱼,钓龙虾都挺有趣的. 不过给我印象最深还是水道上到处可以看到的水葫芦。有的地方已经占据了大半的水面。据说这玩意儿已经在滇池、太湖以及不少水域肆虐多时,因为繁殖飞快,很难根治。其危害来自"生长中消耗大量溶解氧,又会加剧水体富营养化",最近又有"专家"要用这玩意儿以毒攻毒对付蓝藻,我看完全是欠抽。

网络上也有'水葫芦', 在 SNS 站点里尤甚。拿我在 Wealink 中的体验来说,里面所谓的从事猎头和营销的用户就和水葫芦差不多,拥有几千个'连接'的猎头不在少数,而且这些人在里面折腾的还挺欢,每天收件箱里面都能收到转发来的所谓体现"人生智慧"之类的玩意儿。以致于我现在看到猎头人员发来的连接请求一律拒绝。记得很久以前 Wealink 还是不能主动和联系人断开链接的,我申请了几次后新功能也开发出来了。新型 Web 2.0 站点是这样,其实传统的论坛里也存在类似的情况,我以前喜欢去的一个技术论坛,就是因为有些用户大量的自我繁殖,发送格调低下的垃圾信息而导致不少用户流失,当然,很多站长还是喜欢这样的"水葫芦用户",毕竟带来了更多的 PV --垃圾 PV。

水葫芦消耗大量氧气,而"水葫芦用户"消耗大量网站资源,水葫芦使水体富营养化,使得其他生物大量死亡,"水葫芦用户"使得 SNS 站点"富信息化"--导致其他用户信息过载。这一点不少 Twitter 用户也深有体会吧?! 水葫芦破坏生态,"水葫芦用户"破坏一个社区的生态,而且会"暗示"更多的用户加入水葫芦的行列,如果不信的话,看看那些喜欢树立 "用户标兵" 的站点(比如新浪)就知道了。

任何站点都不可能没有"水葫芦用户",关键还是看管理者的态度。有些听之任之,甚至喜欢"水葫芦用户"带来的虚假繁荣,短期内可能好像有所收益,长期来看,最受损伤的还是站点自身。

国内的站点中,豆瓣在这克制水葫芦用户上做得很好,值得表扬。

--EOF--

Oracle 10g ASM 的一点经验

| 7 Comments

Oracle 10g 的 ASM (自动存储管理) 真是一把双刃剑,对于存储的管理给 DBA 带来了不少便利,可也存在无穷多的问题。

ASM_POWER_LIMIT 参数

这个参数 ASM_POWER_LIMIT 参数控制 ASM 后台进程 ARBx 的数量。ARBx 进程用来进行 ASM 磁盘数据重新分布打散。ASM_POWER_LIMIT 取值 从 0 到 11(据说从 10gR2 开始可以设置为 0 ). 当新添加磁盘或者删除磁盘后,ASM 会启动 ARBx 进行 IO 分散操作,这是个非常消耗资源的动作,所以一定要选择系统空闲的时候进行。

关于 ASM 的条带与分配单元

ASM 默认的 Stripe Size 为 128K。 (一般操作系统的一个 IO 最大是 1M,对于 Block Size 为 8K 的系统,一般来说,db_file_multiblock_read_count 设置为 16 即可)。分配单元( Allocation Unit ) 是 1M,这个 AU 对应 extent 。在一些 DW 环境,随着数据量增大,AU 会非常的多,会产生性能影响。Stripe Size 和 AU 是可以通过 ASM 实例上的两个隐含参数调整的:

  • _asm_ausize
  • _asm_stripesize(注意最大1M,否则会有负面影响)

磁盘组不能 mount

错误信息类似如下:
ORA-15063: ASM discovered an insufficient number of disks for diskgroup "FOO"
这个问题是因为 设备 PVID 导致的,一般可以通过如下三个方法解决:
  • 对磁盘组中的设备进行 dd 操作抹去磁盘 0 块的内容
  • 用 FORCE 选项把磁盘添加到其他磁盘组中。
  • 用 FORCE 选项用所有这些磁盘创建新的磁盘组。
哪一种方式都有风险,操作需要谨慎。

--EOF--

MT 4 Beta 版经验

| 2 Comments

今天将 dbanotes.net 所用的 Movable Type 从 Beta 2 升级到了 Beta 5 测试了一下,遇到了大小毛病都有,不得不退回来。有些怀疑这个 MT 4 将会是一个比较失败的版本。

插件目录的变化

Beta 5 要求插件必须在 Plugins 目录下的子目录下,不允许脚本直接裸奔在插件目录下了。Beta 3 和 4 我没有还用过。不知道是从哪一个版本发生的变化。当然,这个变化不是问题,问题是即使这样设置了,很多插件仍然识别不到。包括 relatedkeyword.pl 插件。这个插件虽然简单,但却是我原来 Blog 不可或缺的。

更新导致的数据库错误

如果重复运行了升级操作,似乎就有这个问题:

lib/MT/Author.pm line 337

可以参考论坛上提供的修改数据库的解决办法

Media Manager 插件不兼容

因为 Media Manager 不兼容会带来如下错误信息:

Unknown action mm_entry_edit

这个插件作用不大,直接删掉。

Updated: 测试了一下 最新的 Beta 6 ,又回滚了

Beta 6 还是有新问题。MTinclude 后面的模块名字中间不能有空格。

--EOF--

中国雅虎站长工具又将新增一个产品:统计系统

上手比较简单,只需要添加站点的相关述即可获取一段 JavaScript 脚本,把这段脚本粘贴到自己 Blog/页面模版中。稍后片刻即可看到数据了,数据更新还是比较及时的。数据展现的纬度也比较多,有些数据也是直接针对中文用户而展现的(比如 PV 与 IP 单独的统计与对比),从这一点来说,倒是比 Google Analysis 更为贴近用户。

统计数据可以选择是否公开,如果公开的话,还可以接受留言,这是个很讨好用户的功能,促进个人站长之间的互动。

刚开始使用,参见 Blog 右下角的小图标 不少功能还没有完全体验到。回头再和大家交流一下经验。

--EOF--

前几天 MySQL 站点上有个为期 12 天以 Scale-Out 为主题的活动,列举了不少成功的案例,每个页面有下方的这个图很引人注意:

scaleout_diagram_sm.png

注意到主备服务器之间的 HA 是通过 DRBD(Distributed Replicated Block Device)做到的。DRBD 号称是 "网络 RAID",开源软件,由 LINBIT 公司开发,MySQL 与 LINBIT 达成了合作关系,大张旗鼓的搞了这个 "12 天 Scale-Out" 活动也是这个商业合作驱动的吧。DRBD 助力 MySQL, 号称可以得到四个 9 的可靠性,这不低于任何一款商业数据库软件了。

DRBD 的出现的确对 MySQL 集群的可用性有很大提高。而且,有独到的特点,非常适合面向互联网的应用。因为是在存储层的数据块同步,很容易的做到应用层的 IO 负载均衡(备机承担一定的读压力),不但支持数据库失败接管,还能做到 IP 失败接管,接管时间小于 30 秒,真是穷人的绝佳集群解决方案(相比 Oracle 下的一些方案,比如 eBay 采用的方案,性价比还是不错的)。国外已经有很多成功的实现案例,国内的 Web 2.0 站点不知道是否已经有人在用,在这里推荐一下。更为有趣的是,已经有人通过 DRBD 来实现 Oracle 的另类集群。

怪不得前一阵子已经有开源爱好者开始宣称类似 "RAID即将成为过去式" 的激进言论。

--EOF--

Dreamhost 777 优惠活动

Dreamhost 活动,超值 777 优惠代码,只有一天。晚了可能就结束了。

--EOF--

《程序员》杂志在做关于 Web 可扩展性的专题,编辑朱海燕联系上了 Flickr 的 Cal Henderson, Web 2.0 应用最出色的架构师之一, 准备对他进行 e-mail 采访,如果大家有什么关于 Web 扩展性的相关问题,可以在后面留言或者发邮件给 [email protected] , 我代为转交。

五月份阿里巴巴举办的侠客行网络大会 Cal Henderson 因为时间的关系而没能成行,希望这次的采访能弥补一下不少人的遗憾。

--EOF--

在过去的 Blog 中, 我(插一嘴:这里的"我" 如果替换成 "Fenng" 似乎有些自恋, 也不是我喜欢的行文语气, 可发现转贴不留名的行为太多了,他大爷的)曾经介绍过 《eBay 的应用服务器规模》 , 也介绍过 《eBay 的数据量》,在这篇文章中提到过 "eBay 购买了 Quest Share Plex 全球 Licence 用于数据复制",这个地方其实没有说开来。

对于 eBay 这样超大规模的站点来说,瓶颈往往最容易在数据库服务器上产生,必定有一部分数据(比如交易记录这样不容易水平分割的数据)容易带来大量的读操作,而不管用什么存储,能承担的 IO 能力是有限的。所以,如果有效的分散 IO 的承载能力就是一个很有意义的事情。

经过互联网考古学不断挖掘,路路续续又现了一些蛛丝马迹能够多少说明一些问题。客观事实加上主观想象,简单的描述一下。见下图:

ebay_shareplex_F5.jpg

通过 Quest 公司的 Share Plex 近乎实时的复制数据到其他数据库节点,F5 通过特定的模块检查数据库状态,并进行负载均衡,IO 成功的做到了分布,读写分离,而且极大的提高了可用性。F5 真是一家很有创新性的公司,虽然从这个案例来说,技术并无高深之处,但方法巧妙,整个方案浑然一体。

F5公司专门为Oracle 9i 数据库开发了专用的健康检查模块,通过调用F5专有的扩展应用校验(EAV)进程,F5能够随时得到Oracle 9i数据库的应用层服务能力而不是其他的负载均衡设备所采用的 ICMP/TCP 层进行健康检查。

这个图来自一篇《F5助力eBay数据库服务器负载均衡》的软文,真是一篇很好的软文,国外恐怕不会出现这样"含金量"极高的东西。

当然,这个技术架构可不算便宜。Quest 的 Share Plex License 很贵,而且,对于每个结点来说,都需要数据库 License 与硬件费用。但优点也很多:节省了维护成本; 数据库层面的访问也能做到 SOA; 高可用性。

国内的一些厂商比较喜欢给客户推存储级别的解决方案。通过存储底层复制来解决数据分布以及灾备问题。这个思路似乎太传统了,对于互联网企业来说多少有点过时。

BTW: 对 Amazon 的存储架构非常感兴趣,谁/哪里能提供点线索呢?

--EOF--

DBA 还要人品好?

| 14 Comments

有感而发。从 ITToolBox 上一则 Blog 看到这个文章:一位 DBA 涉嫌盗取了 230 万客户资料。其中 220 万是银行账户资料,9.9 万条是信用卡记录。不知道这位一时想不开的 DBA 最后是否获罪。如果在国内,可能问题不大,教育教育罚点款就差不多无事了,在美国可不好说了,弄不好要关个几年,个人信用估计也将受到影响。

做个 DBA 可不容易,不但要技术好,还要人品好,能顶得住不义之财的诱惑(有没有什么公司提供高薪养廉的机制?)。莫伸手,伸手必被捉。

这种来自公司内部的威胁其实挺多的,最近《二十一世纪经济报道》上也有文章说的是类似的事情:危险的后门:内部"黑手"探囊安全网络

--EOF--

代发招聘信息:产品设计(PD)

最近发的招聘信息多了一点 :)

招聘单位:阿里巴巴软件(上海)有限公司
工作地点:杭州
要求:
1、熟悉数据分析技术和熟练使用 Excel。
2、熟悉一种或两种产品设计模型。
3、熟悉互联网产品设计流程(包括线上产品修正流程)或熟悉IPD亦可。
4、对互联网行业敏感,对WEB2.0元素及其常用设计方法熟悉。
说明:
本职位常年招聘。有意者请发邮件给: [email protected]

--EOF--

Oracle 11g 的两个特性

| 14 Comments

Oracle 11g 快发布了,相关特性的介绍断断续续可以看到,有些特性与其说是锦上添花,还不如说是"雾件",实用性不大。不过今天了解到的两个新特性,倒是令我比较感兴趣。

归档日志压缩

其中一个是归档日志压缩的功能。通过设置初始化参数 log_archive_dest_n 中 compression 选项,可以对归档文件进行压缩生成。对于网络传输比较吃紧的环境,这个功能会很有价值。

物理 Standby 可以联机查询

11g 据说也可以对物理的 Standby 进行联机查询,前提条件是激活 Redo Apply 。10g 之前,物理 Standby 都是要么恢复状态,要么 Read Only 状态。如果能够边恢复边查询的话,那么简直是一个比较完美的 IO 分布的技术方案了。SharePlex 之类的产品市场会又小不少。

还没有看到最终的官方文档说明,这些特性具体还有哪些限制不得而知。不管千变万化,11g 如果能够提供 9iR2 的稳定程度就是万幸了。10g 是一个比较失败的版本,如果不算失败,就算是过渡版本好了。

--EOF--

代朋友发一则招聘信息: 网站架构师。招聘公司是 BlogBus。详细招聘要求(我觉得写的挺有趣的)如下:

------------------------- Begin -------------------------

纯技术人员工种,需要撰写代码,这其实是个体力活,所以我们需要您比较年轻。但我们一样需要您有至少一年的网站开发的工作经验(学生时代自己摆弄建站亦可),曾经独立开发过某个项目(或者是主要成员)。

在 LAMP 平台上,我们需要您有纯熟的工作经验,能够直接投入到独立开发之中。如果您曾经开发过大型Blog系统,那是会得到加分的。

技术能力当然很重要,但我们更看重您的学习和钻研能力。我们希望您能不断挑战自己的技术能力,因为网络时代,技术更新实在可以说是日新月异。

我们对您的加入抱有很大的期望。但是,我们是一个注重工作流程的公司,因此,请您遵循流程,将简历投递到人力资源的专用信箱中。请不要直接和我们公司的高管人员接触,除非您有足够的自信会打动他们。通常情况下,您这样的行为,会首先被扣除这样一个分数:对于流程的尊重。

我们的面试过程分为两步:初试和复试。期间大概相隔一个星期。所有加入BlogBus的人员,都需要经过高管面试。我们对于人力引进非常慎重。

我们会提供具有挑战性的薪资,也会为您提供培训和职业生涯发展规划。我们严格遵照国家政府相关的劳动力雇佣政策。但是,我们实施的是KPI绩效考核体系,就目前状态下,我们不提供一年13个月甚至更多的薪资。每个岗位需要3个月的试用期。

------------------------- End... -------------------------

有感兴趣的朋友请给 [email protected] 发邮件,如果能提一下是在我的 Blog 上看到的招聘信息更好 :)

--EOF--

《侠隐》非常好看

| 1 Comment

张北海的《侠隐》,拿到书的那天一口气读完,非常好看!

虽然有武有侠,但《侠隐》绝对不是武侠小说,"武侠"对于这本书来说只是一层包装纸; 虽然有家仇国恨,风云际会,但也不是什么历史小说。整部书真正的内容还是老北京的"文化",关于老北京的柴米油盐酱醋茶。关于胡同,关于豆汁儿、春饼...老北京过去什么样子,没几个人知道,从这本书中可以恣意想象。北京又仿佛是作者虚拟出来的城市,遥远而又真实,夜幕降临,主人公李天然穿过大街小巷,跃至屋脊上飞行,一幕幕场景仿佛电影画面。

今年看过的最有趣的图书无疑是这本《侠隐》.

--EOF--

Automated Workload Repository (AWR) 与 Active Session History (ASH) 是随着 Oracle 10g 的两个关键功能,可以说是性能优化的一个很大的进步,但是,用户使用这两个特性是要单独收取 License 费用的(Oracle 企业管理器Diagnostic Pack,价格不菲)。Pythian Group 的 Mark Brinsmead 日前发布了一篇 An Open Letter to Larry Ellison on AWR and ASH Licensing,阐述了 "这样收取 License 的方式导致用户接受 Oracle 优秀特性更慢"的观点。后面附有准备发给 Oracle CEO Larry Ellison 的公开信,正在倡议 DBA 签名。

当然,公开信的要求不是很过分的,仅仅是希望 Oracle 能够重新考虑修改 License 方式或者允许用户能够访问 底层视图以及 AWR 与 ASH 的 API 即可。国外 DBA 的这份较真的劲儿值得学习。虽然,技术圈子里的这类公开信总有些自我炒作的嫌疑。

在过几天, 7 月 11 日, Oracle 11g 就要正式发布了,期待这封公开信能起到一定的效果。

--EOF--

关于这篇归档

This page is an archive of entries from July 2007 listed from newest to oldest.

June 2007 is the previous archive.

August 2007 is the next archive.

Find recent content on the main index or look in the archives to find all content.