August 2006 Archives

BlogDay

| 6 Comments
BlogDay
BlogDay
Originally uploaded by Fenng(dbanotes).

今天是 BlogDay,Blogger 的节日。 节日就该做点什么,按照游戏规则(有点群体行为艺术的意思),我推荐 5 个我觉得有趣的新网志:

槽边往事 by 和菜头
看和菜头写的东西,往往会笑出声来。这个勤奋的家伙,短短的三四个月来,在自己的比特海航行中奋键狂书。最近他刚过了六一儿童节

张五常作品
用经济学分析人类的行为。可以看到最新的张五常作品。维护者应该是经过张五常授权的。如椽巨笔,品评经济,我喜欢。

星张翼轸 by 张翼轸
虽然看上去似乎有点小资,但从他那里看到的财经信息还是很不错地。

时间足够爱你2.0(兼营歌曲联播) by 怪盗披头三
我是因为"怪盗披头三"这个ID 而记住这个网志的。经常从这个 Blog 上看到一些老歌,一个年轻人怎么会有这样的心境?

太阳的指纹 by Laura
荐 blog 不避亲。Laura 写的 Blog 我个人觉得挺有意思。

Tips:作了一个追踪 Blogday 2006 的页面.

--EOF--

通过 ONLINE 参数创建索引(或者重建索引), 如果进程被突然终止,或者是手工 CTRL+C 取消该操作, 在非常个别的时候,麻烦来了。重新创建索引,会告诉你该索引已经存在,drop index ,会告诉你该索引被锁,或者是 ORA-08104(this index object xxxxx is being online built or rebuilt) 错误。该过程失败之前创建的一些临时对象由 SMON 负责清除,糟糕的是, SMON 可能会不作为--我在 9i 上观察是 2 个小时(周期?)才清除掉。

如果是一个比较繁忙的 OLTP 系统, 并且是要维护单列索引,那么风险真的是很大的。在 SMON 清除这些临时对象之前,没有办法在该列上建立新的索引。服务器能撑住么?

在 10g 版本, Oracle 的 DBMS_REPARE 包新增了: online_index_clean ,能够手工进行清除:

dbms_repair.online_index_clean(
object_id     IN BINARY_INTEGER DEFAULT ALL_INDEX_ID,
wait_for_lock IN BINARY_INTEGER DEFAULT LOCK_WAIT)
RETURN BOOLEAN;

谢中辉说这是一个 Bug,经过仔细查看 Metalink ,发现很多文档都说的不够准确--10g 的功能,Oracle 还让 9i 的用户去用呢,很不幸,我也上当了。

非常繁忙的一天.

--EOF--

Movable Type 发布了 3.32 新版本: We've Updated; So Should You!, But, How We? 现在 MT 对 个人免费版本的支持真是越来越差了,谁让你不掏钱呢.

查看 Change Log(昨天这个 Log 还是看不到的) ,修复的 Bug 列表好长一串,还好,没有太严重的安全问题就成。

今天又看到 MT 的官方 Blog 在推荐 FastSearch 插件,不过这个功能是基于 MySQL 的 fulltext indexing 实现的,不知道对中文支持如何,可不要象 Feeds.app lite 插件那样乱码一片。

我个人最希望 MT 添加的一个功能是草稿自动保存, 很多次写了半天的东西因为浏览器不稳定,一下子就没有了,沮丧的心情难以形容。

--EOF--

今天重感冒,写不了新的了,把以前的修改稿贴上来。每个人都有一个爱因斯坦那样的小板凳。旧稿参见第一版

以出品 Nmap 而为业界知名的 Insecure.Org 网站日前发布了 《100 个最佳网络安全工具》(Top 100 Network Security Tools) 2006 版。在 2000 年与 2003 年,该站点曾经做过两次类似的活动,都在业界产生了深远的影响。

Tip: 新的产品列表增加了 5 种图标指示(包括是否支持 Max OS X),看起来更加一目了然。

第一名自然是 Nessus ,连续三次稳座第一名的交椅,这是了不起的成绩。虽然现在 Nessus3 已经不再开源,但是仍有免费版本可用,加上不可替代的强大扫描功能,仍然是许多安全人员心中的最佳。
第二到第四名分别是:Wireshark、SnortNetCat。对 Wireshark 或许有的朋友会稍感陌生,其实就是网络协议分析工具Ethereal。这里面有点小插曲,Ethereal 的主要开发者 Gerald Combs 跳槽到CACE 技术公司,但是他并没有这个产品的商标,于是乎一个新的名字 Wireshark 产生了。很多用户可能会觉得有点奇怪:怎么 Ethereal 原站点上看不出端倪? 个人觉得这样的更名多少有一点品牌损失。
相对 2003 年的评选结果,这次前四名的位置都没有变化,足以说明优秀的开源产品是能够经得起考验的。
接下来我们看到漏洞利用和测试平台 Metasploit Framework 在过去这几年中异军突起,一跃而至第五名。
最近微软收购的 Winternals Software公司的产品 Sysinternals ,排在 24 位。Sysinternals 系列工具在 Windows 平台上几乎是无可替代的,这是一个一直被开源阵营忽视的产品。
一路看下来,很多老牌的安全工具名列其中。等等,在第 34 位我们发现了谁?万能的 Google!Google强大搜索能力是一柄双刃剑:安全人员用来查找安全信息,心怀叵测者则用来发现可以利用的网络漏洞。把 Google 当作一款工具工具决不为过。或许,下一次排名的时候Google的位置还应该靠前。

完整性检查检查工具 Tripwire 比上次下降了 22 位,排名 37 。也难怪,Tripwire 昂贵的商业版让普通用户可望不可及,而开源替代工具( AIDE,integrit 等)又的确不够优秀,相信很多公司的主机完整性检查也都是安全环节中最弱的一环。可以看到的希望是发展缓慢的 Tripwire 开源版本最近终于开始支持 Linux 之外的平台,能否有更好表现,还要拭目以待。

匿名浏览工具 Tor 榜上有名,排名 59 。因为一些国家或地区的网络审查逐渐严格,这一类工具市场很大。列表里还提到一个跨平台的 Tor 实现:Vidalia。不过在这里笔者要向大家推荐 TorPark (http://torpark.nfshost.com/)。无需任何特殊的配置即可进行匿名网络冲浪了。

安全相关的操作系统工具值得注意的是 Knoppix 最新上榜,排名60。排在了第65名 OpenBSD 的前面,不过排名更好的是 BackTrack,BackTrack 则偏重于安全。

网络监控工具 Nagios 第一次上榜。第 67 位。这个工具目前在国内的一些网站应用也比较广泛,能够有效的监控大量主机服务状态,相信下一次应该还可以靠前一些。虚拟软件 VMware 也在榜上,89。利用 VWware 快速的搭建测试环境,对于安全研究人员便利了许多。

第 100 名是 MBSA (Microsoft Baseline Security Analyzer),终于有了一件微软土生土长的产品,不容易啊。个人觉得微软的 Windows Defender 对于国内饱受流氓软件骚扰的用户来说更为重要。

整个兵器谱看下来,最多的一类是嗅探工具(Packet Sniffers),共有 11 款。 网络脆弱点扫描工具与密码破解工具次之,各有 10款。此外这两年随着无线网络的普及,关于无线网络安全的工具也有增多的趋势。

这个结果是 3243 位 Nmap 用户投票选出的,权威性应该不容置疑。如果有疑问,那就是: Nmap 应该排在什么位置?


相关网址:http://www.sectools.org/ 。查看完整的列表与相关信息。

--EOF--

对一些 Web 2.0 站点的小建议

| 5 Comments

1) 不要推出真的 Beta 版产品
很多国外相对成功的 Web 2.0 公司都喜欢把产品打上 Beta 标记,实际上人家的产品真的已经很成熟了。反观,国内的很多 Web 2.0 站点推出的所谓 Beta 版本程序,可能只是 Alpha 的稳定性,甚至更差。我就见过某站点的 Top100 Blog 排行,其中有 30 多个是重复的,这样的简单错误挂在那里足足有几个月。用户会相信这个排行榜的技术含量么? 国内的 Web 2.0 公司是从模仿做起,模仿没有错误,但是不要给人不踏实的感觉。

2) 推广脚本不要"出卖"用户
一般的 Web 2.0 都会借助一些小脚本来进行推广[协助本站/推广本站]:一段小代码,用户贴在自己的 Blog 上,借助用户的口碑传播。但这个地方要注意:尽量用中立性的内容,不要随意更换脚本内的内容。"世界上最大"、"世界上最好" 之类的字眼最好不要使用,因为帮你推广的用户很容易会受到读者的质疑:某某站点就是你眼中的最好么? 还有的 Web 2.0 随意更换引用代码的内容,字体变个颜色啦,加上点挑逗性的词啦,都不可取。

3) 让用户真诚的称赞你,而不是自己发一些软文
有时间发那些什么 "仅一年的时间,目前我们的用户已经达到了1880万人" 之类的没人相信的话,还不如多写写站点的改进,多听听用户的声音。毕竟 Web 2.0 不能靠[忽悠]来成功。

4) 不要太渴望套现赚钱
最初作这个站点的目的是什么 ? 套现?赚钱?上市然后走人? 还是想为互利网用户真的带来一点有价值的东西? 盯着前者的“创业者”我认为很难真的做到"尊重用户,用户第一",用户在他们眼里或许只是"赚钱的工具,套现的砝码"。而那些拿到了几万、几十万投资就放大成几十倍来炒作的公司,动机就很可疑了。

给 Web 2.0 站点的一点小建议,或许 那些追捧、依赖 Web 2.0 应用的互联网用户也该看看,你所使用的站点靠普么?

本周言论 之 谋杀超女

| 3 Comments

用人部门不知道他有没有期权,根本没考虑这方面因素。
--百度梁冬 谈关于裁员

"那种感觉就是被爸妈安排去相亲,进去一看里面坐的是全智贤。”
--刘德华这样描述他第一次看到他投资的《疯狂的石头》的感受。

从零到全球第一, BossLink 也许只需要500天
--丁海森 其人事迹参见[忽悠为王]

我们一家三口都在读MBA
--上海, 学费2年2万的儿童 MBA 教育项目,700 余幼儿争读

超女谋杀超女
--黑楠 超女大众评委对上一轮获得评委5张满票的郝菲尔充满了妒忌.于是她们在这场比赛里集体"谋杀"了她.

自从搭上 Dreamhost 的贼船之后,我就在幻想 Dreamhost 什么时候能够支持 Nutch 就好了,这样就可以搭建一个个人的搜索引擎。令人沮丧的是 Dreamhost 似乎一直没有支持 Nutch 的打算(当然,Nutch 这个东西一旦能够被支持,一个普通的用户恐怕要吃掉所有的资源)。

今天从 Vingel 的 Blog 上看到他使用的 Swish-e, 是一个不错的选择。

安装 Swish-e 相对比较顺利。参见指导手册的 Installing without root access 部分。详细的设置记录随后给出吧。

初步效果参见: http://www.search.dbanotes.net/

准备把 Oracle 的文档索引一份,便于自己使用。

现在 Oracle 9i, Apache HTTPD 2.0 的文档已经可以搜索了。

这个工具一个最大的缺点: 不支持 Unicode,所以只能搜索英文文档。

--EOF--

Blogger 们准备要赚钱?!

| 19 Comments

最近在中文 Blog 圈子里一个很火的话题是 "Blog Network" ,之所以火爆,因为涉及到一个大家都会关心的问题:Blogger 准备赚钱了。

如果你的个人 Blog 每个月收入 6 万美元.....那么,Blog 是不是还算一份挺有前途的职业? 6万美元,当然不是信口胡说,TechCrunch已经做到了,消息来源可以去看 Business 2.0 的这篇 Blogging for Dollars,TechCrunch 并不是独一份,很多 Blogger 读者熟悉的 Boing Boing 在今年的收入已经接近 100 万美元。另外,一些非常受欢迎的个人 Blog 站点也已经受到 VC 的关注,最近 Huffington Post 就获得了一笔高达500 万美元的投资,估计国内很多 Web2.0 初创公司都会很羡慕。

这么多利好的消息,怪不得大家都在嚷着要加入 Blog Network 呢。

国内的 Blogger 赚钱,可行性、可能性大么?

对比一下国内外的信息: Techcrunch 订阅数量接近 10 万,国内知名度最大的 IT Blogger Keso 也超过了 1.5 万。那么,Keso 每月可以收到 1 万美元的收入么? 显然是不可能。Techcrunch 是独立的域名,而 Keso 是依托在媒体站点上,试想如果脱离 Donews ,读者还会有这么多么? 如果想赚钱,广告应该是唯一的途径,但是目前在国内的环境,广告商们的认可程度是一个问题。记得 Keso 曾经在央视的采访中透漏,他给和迅做的广告,每月也不过是"刚超过4位数"。

至于国内的一些 Blog Network ,基本上都偏重于新闻,"人无我有,人有我快",真正有自己观点的真是不多见,文章能产生一定影响的也少之又少,也有的 Blogger 在尝试争取与 Web 公司(比如 Google)的对话权,以其获得某种收益。

我个人的感觉是,赚钱可以,但现在还不是时候,可以提前进场热热身。


BTW: 我也曾经给某猎头公司做过一个月的 Banner 文字广告,收入 RMB256(我的标准是2的N次方,不过人家不给更多).只不过比 Keso 晚了一点点。后来又有一次 IBM 市场活动,广告公司要投广告,我嫌太麻烦,做了几天后撤下来了。

这篇 Blog 的话题比较俗,请勿介意。

--EOF--

这几天的诡异事情

| 2 Comments

这几天遇到不少诡异的事情。

我的在线书签 最开始的版本放在 Web 目录根目录下名字叫做 bookmarks.php, 大约有 3.5K ,调试之后我在 PHP 代码的前后分别加上了一段 HTML 代码,文件大小大约 18K。从浏览器访问,正常。可是过一会儿,问题就发生了:文件变回了 3.5K, 而且确确实实是旧的版本。第一次以为是看错了,重新上传了一次,第二天早晨一看,又变回去了。如此反复.....多次,我差点崩溃。检查了 Crontab 条目,其他脚本,没有重定向或者是能影响到这个脚本的。

一切事情皆有因果,可是这个事情我找不到"因"。(猜测或许和 Dreamhost 后台的某个 Cache 机制有关)

第二个诡异的事情是,Apache 日志中的错误访问,有大量的奇怪链接,链接的格式是 :

/local/path/File_Name.htmlhttp://www.dbanotes.net/MT/mt- \
atom.cgi/weblog/blog_id=x/entry_id=xxx 

HTTP 和前面的文件名字是连着的。莫明其妙。(猜测是 Spam 机器人搞的鬼, 程序 Bug ?)

--EOF--

Oracle SQL*Plus 输出 HTML 的一个小问题

很久以前,我记录过如何用 Oracle 的 SQL*Plus 工具创建 HTML 页面。今天写脚本过程中才发现 SQL*Plus 在命令行参数和进入 SQL*Plus 后 set 设定上的一个小差异。

如果是命令行参数 -MARKUP HTML ON SPOOL OFF ,则会打印 HTML HEAD 等标记,也就是说是 -MARKUP 后面的 SPOOL OFF 参数是无效的;

如果是在 SQL*Plus 提示符下 set MARKUP HTML ON SPOOL OFF ,则的确不会打印 HTML HEAD 出来。

这个和文档的说明不一致,或许是 Bug。我的版本是 9.2.0.6 .

最近的诡异事情特别多。

--EOF--

《越狱》第二季已发布

| 5 Comments

期盼中的《越狱》第二季已于今晚6时左右开始发布。截止 21:00 分,风软上同时下载的人数已经突破 7000。

第一季以一个充满悬念和疑惑的结局结尾之后,网友们也纷纷给出自己的推测。第二季的开集很有可能会决定整个第二季的方向,是不是以逃亡为主线。

从两集的衔接上看,似乎编辑也把自己绕到了绝境,镜头对接的不是很好,他们居然是用腿跑出去的。总算没让大家失望,主角们的逃亡生涯开始了。Sara 没有死,但是仍然没有摆脱嫌疑。狱警 Bellick 不再是追捕的主角,另有一个厉害角色 FBI 的调查员出场了,他推断出了Mike 的下一个目的地。在狱外,看起来 John Abruzzi 的处事方式更老道些,而 Scofield 的错误开始增多。T-bag 提着自己的手臂终于找到了一个兽医站,要受点儿苦了。

寻找钱的计划已经有了,不过看起来困难重重。五个人一起行动,应该不太实际,应该很快会分头逃亡吧。

不多说了,拭目以待!

--EOF--

Awstats 统计文件被下载的 Top 10

| 3 Comments

如何统计站点中下载次数最多的文件? 从 Antezeta 学来一招,在配置文件中添加一段 ExtraSection ,类似如下:

ExtraSectionName10="Downloads (doc,rar,sql,pdf,sh,tgz,zip) - Top 10"
ExtraSectionCodeFilter10="200 304"
ExtraSectionCondition10="URL,(.*((\.doc)|(\.rar)|(\.sql)|(\.pdf)| \
(\.sh)|(\.tgz)|(\.zip)))"
ExtraSectionFirstColumnTitle10="Download"
ExtraSectionFirstColumnValues10="URL,(.*)"
ExtraSectionFirstColumnFormat10="%s"
ExtraSectionStatTypes10=HBL
ExtraSectionAddAverageRow10=0
ExtraSectionAddSumRow10=1
MaxNbOfExtra10=10
MinHitExtra10=1 

可以添加或减少需要匹配的文件类型。

有朋友问我 Blog 首页下方的"最多阅读的文章"如何得到的,其实也是用 Awstats 得到的数据。细节内容请参考:AWStats Enhancements and Extensions

另外,根据 添加 egosurf 页面 的思路,又添加了在线书签的页面。不过遇到一个非常奇怪的原因。非常奇怪...

无独有偶,在后台 web 服务器的错误访问日志上也观察到很奇怪的现象,奇怪,非常非常奇怪 @*%*$$&*.....ooooooops

前一段时间就有朋友在留言中说订阅本站 RSS 后,每篇 Blog 都会显示两次。当时以为是个别现象而忽略。今天又有人说遇到这个问题:

FeedSky 烧录的种子会重复显示同一标题

稍加分析,只要用 FeedSky 烧录的 Feed 就有这个问题。看到 FeedSky 吕欣欣在线上,在后台检查后说我包含了两个 RSS 地址在 Feed 里面。这...不可能啊...

原来上次 FeedBurner 不能访问, Blog RSS 地址修改 的时候我把 index.xml 指向我在 FeedBurner 烧录的 Feed 地址 ,而 FeedSky 的处理机制存在问题: 不认识 http 重定向(HTTP 状态值 301、302、303、307)。认为里面有两个地址,每个都显示一次。就成了现在的样子。

前几天有人讨论"Feedsky 和抓虾zhuaxia,谁更有技术"的问题,我的感觉是 FeedSky 虽然占领了很好的资源,但技术上可不怎么样,一直以来,FeedSky 的解析速度、UI 都很糟糕,最近速度倒是有所改善,可是又发现这么一个不该发生的失误。这也是前一段时间 FeedBurner 出问题的时候我没有切换到 FeedSky 的一个主要原因。

提醒一下本 Blog 的用户,请统一使用 http://www.dbanotes.net/index.xml 订阅吧。


--EOF--

买个盗版也是个不容易的事情

| 5 Comments

昨天跋山涉水的去买DVD(我可没说是正版), 一进门看见老板娘正在收拾打包,说最近风声太紧。这回据说是全国范围打击盗版,昨天看网上的消息,说什么焦点访谈最近还有一期节目说什么打击盗版取得成果了,联想到公安部发出B级通缉令 缉拿贩卖盗版光盘嫌疑人,我知道碟友们的日子以后要不好过了。

要说咱们这片地搞什么都要一窝蜂,这会儿打击盗版颇有"除四害"的架势,不取得"成效"不罢休,这群大爷们怎么都不想想打击打击腐败呢? 打击腐败难度太大,打击打击学术腐败不也成么? 如果这个也不行,打击打击票贩子什么的

没有人说盗版这事情好,可是你总要给电影爱好者一个选择更多正版的权力吧? 每年上架或者进入院线的电影就那么几部,弄不好还被剪刀手弄得七零八碎的,能好看么? 买回来能舒心么?

有人说,线下买不到咱不还有网络么? 去网上下载啊,你还别着急,估计用不了多久,什么 BT、电驴啊,该屏蔽的屏蔽,该封杀的封杀,要想娱乐? 去看看央视的综艺节目洗洗脑,这样的生活你还不满意? 你这人要求咋这么高呢?

--EOF--

Dreamhost 这样的虚拟主机的 Shell 服务有什么好处? 举一个小例子:

curl --silent -L --user YourUserName:YourPassword -o \
del.icio.us_backup.xml -O 'https://api.del.icio.us/v1/posts/all'

一条命令就可以简单的把你 del.icio.us 所有条目备份到你的 Web 服务器上。注意其中的 -L 参数,能够有效的对付跳转。如果想定期备份,又怕密码出现在命令行上,可以考虑把这个命令写到一个脚本里,能提高一点点安全。然后在 Crontab 里定期调度执行。

更多信息参见:Backing up del.icio.us

如果用 Wget :

wget  --http-user=YourUserName --http-passwd=YourPassword  \
-O del.icio.us_backup.xml https://api.del.icio.us/v1/posts/all 

题外话:个人感觉从功能上比较的话, curl 要比 wget 好很多。curl 也有力有不逮之处,比如对某个 Web 目录做镜像的功能。

如果是程序员开发 Web 程序, curl 绝对是 Web 调试的瑞士军刀。

-Update: del.icio.us 最近对 API 做了升级
--EOF--

添加了一个 egosurf 页面

| 3 Comments

我在 Google Blogsearch 的时效性以及其他 说过:

因为 Technorati 访问困难,很长一段时间里,Google Blogsearch 就成了我进行 Blog eogsurf 最常用的工具

那天又和车东聊了一下,都认为把这个东西在本地展现会好很多。今天作了一个页面,把 Google Blogsearch 关于 www.dbanotes.net 的相关内容动态展示在本地页面上。效果参见 http://www.dbanotes.net/egosurf.php,这个页面的内容对应 http://blogsearch.google.com/blogsearch?hl=en&q=www.dbanotes.net 搜索出来的结果。

其实如果 MT 3.31 的 Feed Widget 好用的话,根本不用额外的脚本来做,可是这个东西在我的页面上解析任何 RSS 地址都会把展示内容之外的东西全变成乱码。

这个 PHP 脚本调用 MagpieRSS 库,没有乱码了,但还有些 Bug 。接下来准备把 del.icio.us 备份到本地展现出来。

--EOF--

本周言论 之 生死对决

| 4 Comments

易宪容老弟跟过我一些日子,显然没有学满师。最近北京的经济专家群起而出,大叫经济过热,说什么危险情况云云,易老弟的声浪竟然最高。
--张五常 《经济要从整体看》

成为中国首富,以前我定的期限是28岁,现在觉得用不着到那么晚,改成26岁了。
--陈峰伟 南京邮电大学数理学院的休学学生,南京“唐电”电器销售公司“董事局主席”兼“总裁”,其人事迹.

我愿意与方舟子先生签订如下的生死对决协议:
如果“破解四色定理”失败,黎鸣先生愿按照协议,文明地进行自杀;
如果“破解四色定理”成功,方舟子先生愿按照协议,文明地进行自杀。
--黎鸣 这位黎明先生声称自己用非常简单的方法证明了“四色定理”

数字霸权管理(DRM)是一种以限制用户为目的的程序设计方法。这些程序不是被设计成为你工作,而是以控制你为目的。
--Richard Stallman

现在这群小兔崽子,总是把自己的欲望当成爱,把对别人的控制说成喜欢,把满肚子邪恶包装成一脸无辜!
--《白板报》 《“爱”你妈个肺》

布朗先生的生日是几号?

| 9 Comments

今天在看《如何求解问题》一书的时候读到这样一个有趣的问题:

布朗先生是一位著名的探险家。在70岁生日的宴会上,有位女士问他十年前这一天作了什么。布朗先生想了想,说“我很清楚记得那一天,我在日出之前离开营地,向南走了一英里,然后向东走了一英里,在这点上又转向北走了一英里,正好回到营地。”

问题是,布朗先生的生日是几号?

其实,这个问题找到的答案可能并不是太厉害,要能找出来这个问题的漏洞才是有意思的。

--EOF--

10个最糟糕的域名

| 4 Comments

取一个好域名不容易,取一个糟糕的域名其实也不那么容易。在 Unofficial DreamHost Blog 上发现一篇有趣的帖子:10个最糟糕的域名 ,仔细看下来是挺有意思的。

1. A site called “Who Represents” where you can find the name of the agent that represents a celebrity. Their domain name… wait for it… is
www.whorepresents.com
2. Experts Exchange, a knowledge base where programmers can exchange advice and views at
www.expertsexchange.com
3. Looking for a pen? Look no further than Pen Island at
www.penisland.net
4. Need a therapist? Try Therapist Finder at
www.therapistfinder.com
5. Then of course, there’s the Italian Power Generator company…
www.powergenitalia.com
6. And now, we have the Mole Station Native Nursery, based in New South Wales:
www.molestationnursery.com
7. If you’re looking for computer software, there’s always
www.ipanywhere.com
8. Welcome to the First Cumming Methodist Church. Their website is
www.cummingfirst.com
9. Then, of course, there’s these brainless art designers, and their whacky website:
www.speedofart.com
10. Want to holiday in Lake Tahoe? Try their brochure website at
www.gotahoe.com

第 2 个稍加提示,读者可以找找其他 9 个的玄机。不用字典全部答对,送你非常糟糕的书,Steven King 的《尸骨袋》,并请你一定要收下。

--EOF--

prfldsvc Windows 进程是干什么的?

刚才查看用户搜索本站的日志,发现有用户查询 "prfldsvc" 关键词。非常巧的是,前两天我也顺手查了一下这个进程的信息。一句话就可以说明白:

prfldsvc(prfldsvc.exe)是 Microsoft Private Folder 的服务进程

更多阅读:Microsoft Private Folder 的"拒绝访问"

另外,站内搜索已经启用了 Google API:

Google API 与 MovableType 的搜索集成.png

搜索不到的时候会给你 Google 内的结果。

相信大家每天都被铺天盖地的垃圾邮件(Spam)烦透了,即使是目前对付垃圾邮件最好的Gmail,在我的邮箱里每天也会因为判断不明错放进来几十封。国外已经有些组织针对 Spam 开战,今天访问了 Project Honey Pot ,简单介绍一下该项目介绍的关于 Address munging 。

首先对于 "Munging" 这个词我还真不知道怎么翻译,来自英文 Wikipedia 的说法是:

Mung (or munge) is computer jargon for "to make repeated changes which individually may be reversible, yet which ultimately result in an unintentional irreversible destruction of large portions of the original item."
Address munging is the obfuscation of e-mail addresses...

第一种方法是简单的替换法。例如:dbanotes#example.com (把# 替换为@)。当然也可把地址中的某个短语或者字母替换掉。 英文环境中用 dbanotes(AT)example.com 或者是 [email protected] 可能更人性化一些。

第二种方法是稍稍复杂一点,如果熟悉ASCII 码的话,@ 等价于 ".", 可以在 HTML 代码中用这个替换 @ 如果 SpamBot 智商不太高的,基本可以骗过。从这一点出发,你可以考虑把整个邮件字符串都进行 ASCII 化。即使 SpamBot 比较高的智商,恐怕也束手无策了。

第三种方法则基本可以做到万无一失--除非 SpamBot 是人。 这个方法是脚本加上图片。很多 Blogger 站点上的联系方式都用图片,地址可以用一个 JavaScript 来代替。 具体的脚本获取在这里

道高一尺,魔高一丈,随着 Spam 技术的迅猛发展,很多 SpamBot 应该已经具备读取图片的能力(我的Blog 验证字已经不管用了),如果是网站站长,还可以协助 Project Honey Pot 来进行 AntiSpam。也可以考虑加上这个"稻草人":

@MEMBER OF PROJECT HONEY POT
Spam Harvester Protection Network
provided by Unspam

估计可能国外的 SpamBot 还能害怕一点点,国内的就不那么遵守流氓规则了。


--EOF--

V 字仇杀队(V for Vendetta)

| 4 Comments

如果 50 年后有人撰写世界电影的编年史, 2006 年的代表电影应该有 《V 字仇杀队》的一席之地。

这部电影注定要和《1984》扯上关系,那个无所不在的"伦敦之声"让你没办法不和"老大哥"联想在一起; 没有人知道真相是怎样,真理掌握在少数人手中,"真相也只为少数人所知",这又彷佛和《黑客帝国》一脉相承(监制就是沃卓斯基兄弟)。

可能很多人会把"恐怖分子"的帽子戴在 V 的身上。或许革命就是暴力与牺牲。在 9.11 之后,整个西方世界太敏感,殊不知他们受到的一点点伤害其实也是由他们自己导演间接完成的么?(去看看中东的 Vendetta,如果没有美国,真的会导致现在的局面么?) 电影中那些学校里被毒害的孩子的事实被巧妙的嫁接,掀起整个民族对异族的愤恨,仇恨使得他们暂时忽略了集权给他们带来的痛苦。仇恨凌驾于自由之上。

或许被绿色长城"保护"的我们,也应该有权利知道真相。《V 字仇杀队》, 国内 Blogger 都应该看的电影。

-----------------
V 的扮演者 Hugo Weaving ,就是黑客帝国里的那个 Agent Smith,从头到尾带着面具。
女主角扮演者Natalie Portman。(《这个杀手不太冷》中的那个小姑娘,她已经长大了。)

豆瓣上关于《V 字仇杀队》的更多信息.

--EOF--

Dreamhost 又掉链子了一回

| 11 Comments

刚才我的 Blog 所在的服务器宕机, 两个多小时才恢复正常.以往的宕机都是在我不更新 Blog 的时候,倒也不是太烦人, 不过这次有些火大.

刚才登录进去看了看, Load 高达 150 ,权限不够,看不到系统在做什么. 决定监控一下 Dreamhost 的可用性:

http://www.dbanotes.net's SiteUptime

刚收到 Dreamhost 管理员来的邮件:

We apologize for the inconvenience that you have encountered. However, we have resolved an issue with your server and dbanotes.net is working now. It appears that the server was rebooted, which usually means a high load or configuration problem. Fortunately, our admins were on top of it and have corrected the problem.

火气小了很多 :)

其实这个现象观察到好久了,那就是 Google Blogsearch实效性非常好,一般情况下 4-10 分钟就可以通过 搜索结果RSS 观察到我刚发表的 Blog 。因为 Technorati 访问困难,很长一段时间里,Google Blogsearch 就成了我进行 Blog eogsurf 最常用的工具。

国内的 Blogger 中,Keso 应该是 Google Blogsearch 的最忠实用户:

“我还是很关心别人怎么说我和我写的东西,所以看到有人谈论我,我就会很感兴趣地去读那些博客。提到我的人,多半是我博客的读者,他们关注我,我也会关注他们。很多次,都是因为有人提到了我的名字,我才发现了新的博客。”博客搜索为博客群体彼此间进一步的交流提供了可能。”--Keso 接受《互联网周刊》的采访

可能是所有 Blogger 的天性,有的时候我也这样,看到别人链接或引用了我写的东西,总要跑上去看看有没有引发出来什么更新鲜的内容。

发现,有的时候也是一种乐趣。

Blogsearch 中的 inurl 语法虽然有效,但是搜索结果有很大问题。应该用 Blogurl 语法(如 blogurl:dbanotes.net 所以车东以前做的测试似乎不太能够说明问题。我的测试结果:

BSP 名字结果数量
spaces.msn.com105,881,316
myspace.com73,014,029
Blogspot.com 66,813,563
Spaces.live.com 10,980,686
Livejournal.com62,989,323
Typepad.com 4,405,857

MSN Space 是当之无愧的第一大 BSP。

国内的 BSP 除了 CSDN 结果有三万多,其他的 BSP 都少的可怜--有的还没有我个人 Blog 的多。推测原因可能第一个是网站页面结构普遍设计的不好,对 Blog 的一些内置的技术特性理会的不好,也难怪,人家都是用作新闻的手法搞 Blog 的。再一个或许是 Google 对中文用户还没有投入那么大的兵力( Blog 的及时性可能只是针对少数更新频繁的 Feed 抓取 )。 如果你知道原因,请告诉我。

--EOF--

Dell 以为消费者是小孩子么?

| 20 Comments

自从 Dell 中国网上商店八月七日出了价格纰漏之后,很多下了订单的消费者都在静观 Dell 的动态。第二天晚上就有传出来消息说 Dell 赖帐了。

到现在为止,我接到 Dell 两个电话,第一个电话是 10 日下午 5 点多,一个女的,上来就说自己是 Dell 公司的,说价格问题是某个员工的错误, 然后给我开出的条件:

一个是取消订单;
第二个是 7.5 折买那款服务器;
第三? 没有第三。

虽然我早都在朋友们听到这样的选择结果,我还是火大。套用范伟的话说,"你这个人不讲究啊,你的承诺 Ni?"

我给的答复是: Dell 不是说安全购物么? 员工的错误也是 Dell 公司的错误,总不能把这个错误说成是消费者的责任吧? 出了这么大的事情,你们的道歉呢?你们连在公司首页做个道歉声明都做不到,我对这样的选择都不能接受。

不要给我退款,如果贸然把款退到我帐上,我会认为那是 Dell 给我的赔偿!

昨天下午,又接到 Dell 的电话,男的,这会上来自报家门,说自己是 Dell 销售经理,谁谁谁,然后还是那两个条件,让我选择。

那家伙说,"这款服务器原价 8000 多,7.5 折后才 6000 多,而且,这里面包含了一个软件就价值 4000 多..." ,什么软件我倒是没有听清,"那好,你把软件都去掉吧,我看看价格能不能接受" ....噎住了半天,说回去给我做个报价。

这件事情从头到尾 Dell 都做的非常不光彩。消费者的确是钻了你的漏洞,但漏洞是你们自己造成。总要拿出个让人满意的态度来吧 。

Dell 公司都以为消费者是小孩子么?

--EOF--

phpBB 搭建了一个小型论坛(talk.dbanotes.net)。测试的时候发现了问题:新帖子的标题如果是中文,则是乱码,测试搜索,结果中的关键词部分中文也是乱码。查看页面编码: iso-8859-1 。

网络上找了一下,似乎是一个常见的问题,有点似乎需要修改很多地方,我只修改了这两个文件:

templates/subSilver/overall_header.tpl
templates/subSilver/simple_header.tpl

把 Meta 部分的变量 S_CONTENT_ENCODING 替换为 UTF-8 。

重新测试通过。

我用的是 phpBB 2.0.21 ,各种论坛工具安全漏洞似乎都很多,如果这个版本现在有安全问题,请朋友们及时通知我一下吧。

这个论坛尽量保留有价值的帖子,降低不必要的流量。

--EOF--

韩国 IT 人印象 (2)

近年来,韩国流行文化在中国大陆形成了一股"韩流",年轻一代都开始哈韩了。但却很少有人知道这其实是上个世纪 80 年代韩国军权高压统治时期的愚民政策的产物,没想到在十几年后歪打正着(在韩国电影《下流人生》中多少可以看到一点端倪)。

当然,这是我个人了解到的背景信息吧,韩国人肯定不愿意承认这一点。虽说中朝(韩)文化很相近,也不要以为这些韩国人对中国了解有多少。很多韩国人连长白山(他们的白头山)在吉林省都不知道。说起长白山,倒是有个小插曲。 80 年代晚期,长白山当地政府突然头脑发热,举办什么人参节,把不少老外拉到参场参观,结果始料未及,很多外国人看到中国人像种萝卜一样种人参,国际市场对产自中国的人参评价一落千丈,刚好是这个时候,韩国人在世界范围内宣传自己的高丽参,造势很是成功。北朝鲜不作宣传,也沾了光。扯远了。

近代东亚历史上中日、韩日积怨极深。以前每每在媒体上看到韩国人断指,烧日本国旗之类的过激之举,我还以为韩国满大街都是愤青呢,根本不是那么回事。好几个人在中国买的车都是日本车,就是吃饭也总吃日本料理,以前国内媒体总说韩国人如何爱国,如何支持韩国货之类的文章,似乎颇有偏差。这些工程师这样消费日货在韩国国内也许会被周围的人鄙视,在中国,最多也就是给我带来一点疑惑吧。

这些韩国人在中国当然也不可避免的会接触国内的一些流行文化。一次,老板在公司门口问我 "你知道 S.H.E..吗?" ,我一时没听清,还以为他说某个网站的名字,老板神秘的笑笑说"我很喜欢 S.H.E",我当时差点晕了。老板用很不标准的中文说 "年轻人应该关注一点流行文化"。 还有一次在车上,聊啊聊,说起中国的音乐,我说,在中国有一位很有影响力的音乐家,在韩国还举办过演唱会,而且,是朝鲜族的? 几个人一起摇头,"不知道!", "他的名字叫崔健!", "崔健? 谁是崔健?" 他们倒是知道孙楠,还知道韩红呢。

和韩国人接触,很少听到他们谈关于政治的问题,尤其是决口不谈南北朝鲜的问题,即使是有的时候说起中国东北,马上马上就到朝鲜了,很巧妙的就把话题岔到其他地方去了。始终猜不透他们对北朝鲜是怎样一种感情,或许他们被活色生香的流行文化吸引了绝大多数的注意力。

--未完待续--

韩国 IT 人印象 (1)

| 4 Comments

前几天看到网文 《中国知韩派眼中的韩国》 ,颇为感慨。自己以前也算和韩国 IT 人有一点接触,杂七杂八的说说我对韩国工程师的印象。

2003 年 8 月末,我加入了一家新公司。老板是个韩国人,在美国受的教育,这家公司是他和两个中国朋友一起创建的,公司性质却是美资,公司在韩国也有分公司,人数比中国大陆要多,当初为什么到中国而不是到印度开办分公司,记得老板解释过,主要是考虑到中国的文化和韩国文化相近。

因为业务关系,经常与一些韩国人接触,给我留下的第一个很深的印象是"刷牙"。这帮韩国人都是工作狂,每天在公司工作到很晚。吃过晚饭后,立刻就回到办公室,而回到办公室的第一件事情就是刷牙,刷牙的方式也很特别,口里根本不用含水,直接干刷,一边刷还一边走来走去的(穿的拖鞋),颇为神奇的是,牙膏泡沫根本就不会滴在地板上,很艺术。看到第一个人这样做的时候,我还以为是个人习惯,可是后来好几个人都这么做,真的有点晕。他们刷牙的时候,我也只好上上网什么的,浑身颇为不自在,彷佛自己多不讲卫生似的。

说他们是工作狂,倒似乎也不是很确切。他们虽然每天在公司很晚,可这段时间倒也不一定真的是在工作,似乎只是为了加班而加班。比如,L 课长的一个习惯是专门在每天晚上 9 点多的时候开始做事情,9 点钟之前到处走走转转,9 点之后就好像突然想起来什么似的,急得狠。然后整个项目组里的人都转动起来。忙到了大家都要回家的时候,每个人都松了一口气,似乎这一天真的很有效率。

晚上回不去,因为白天会议多,多而且长。一点点事情也要开个会,开会起来必然会说到很细节的问题,加上语言沟通问题,没个半小时一个会议根本开不完。经常在某个时间,办公区的人都看不到--全跑会议室去了。这个问题其实国内很多公司也存在。

--未完待续--

前几天看到某 BSP 上的一个所谓"博客",把我写的一篇技术总结原封不动的转载过去,甚至下面的用户评论也不放过。这种现象在中文网络恐怕是司空见惯,很多人可能也习以为常了。

中国互联网有一种现象恐怕是老外很难看懂的,那就是网络论坛无比繁荣,甚至繁荣得泡沫四起。传递繁荣的载体之一就是"转载"("转贴","ZT","ZZ"),对于有的内容(比如实事评论、文学作品),转贴是一件好事,平面媒体不也有什么《文摘旬刊》之类的么? 但对于技术类的文章来说,转载则是一种很有问题的传播方式。

弊端主要有如下几个:

1) 丧失了原有的格式。HTML 语言标记过的内容经过简单的 CTRL+C CTRL+V ,丧失了原有的格式。这对于读者来说是一种不负责任的表现。有的文档,虽然原作者精心排版,可是在若干次拷贝粘贴后面目全非。

2) 丧失了数据准确性。技术文档可能包括实例代码、表格数据等内容,几经转载后很难认为该数据是不被篡改或是丢失,数据的可读性会给人带来一定的困惑。

3) 读者无法得到更新内容。超链接是 Web 一大基本属性。转载后的技术文档,很难保证原有的超链接仍旧存在。如果这个通道断掉。那么原作者对文章的更正、修改、补充等内容读者无从知悉。有此产生的误解、困惑谁应该负责?

4) 损伤原作者积极性。看着自己辛苦写出来的技术文章,一转眼的功夫就被人张冠李戴,任你再有涵养也要深为沮丧,几次过后也就没有了继续写作的兴趣。从 Web 页面本身来说,PageRank 也会受损,久而久之,劣币必然影响良币。

也或许,问题并不止这么几个。如果你看到一篇技术文档的确觉得不错,非常想转载,在转载之前不妨尝试如下几个步骤:

1) 收藏为书签。比如添加到 del.icio.us 或者是 365key,收藏的时候加上自己队该文章的一点评论最好不过。
2) 如果第一条不是很好转载的时候把原作者署名,并且一定要加上原文地址。别人看到这个'鸡蛋'不错,让他们直接去找生那只蛋的'母鸡'。
3) 如果还不行,问问自己这样做的目的。转载一篇很牛的文章后技术社区里的人会对你更有好感么(还是仅仅因为虚荣诱使你这样做)? 别人是否会误认为这篇文章的作者是你? 如果他们就这个问题对你提问,你能搞定么?

4) 最后一条。看过了前三条你觉得很麻烦,那么就不要转载了吧。

有的人可能是出于一种"好东西自己也要有"的心理,最喜欢用的理由是: 万一别的地方找不到了呢?

别担心, 搜索引擎会缓存互联网所有有价值的东西

--EOF--

和菜头今天发布了5月11日的比特海日志,庆祝 Blog 点击量超过 30 万。30 万,在那些门户网站扶植起来的"博客明星"眼里似乎不值一提,但这是他作为独立 Blogger 从无到有的一大步。和老完全有理由自豪:

离开新浪,我自己学WORDPRESS,自己架设网站,终于有了www.hecaitou.net,不再仰人鼻息,不再寄人篱下......回首这四个月的时光,可以说苦到了极点,因为在第一周里为了架设我的BLOG,我每天只能睡三、四个小时。而其中由于不懂IT技术而造成的困难和障碍,在精神上造成的郁闷和痛苦更是无法言说。在这段日子里,我每天更新数次以上,勤勉程度国内罕有匹敌,这当然也非常辛苦。但是,和个人BLOG带给我的快乐相比,这一切都算不得什么。打字本身带给我的快乐,足以弥补各种困难和艰辛带来的不快。终于可以有一块空间自由呼吸,大声呐喊,这比什么都重要。

自由之思想,独立之精神。个人认为和菜头是 06 年出现的一个真正意义上的独立 Blogger 。向和菜头致敬!

还等什么,去订阅他的 Blog 吧!

-EOF-

Webnote , 网络便签

| 3 Comments

看到 Keso 的留言版很有意思,心动不如行动,我也安装了 Webnote 这个小玩具,作涂鸦用。起个名字:网络便签。 下面是介绍内容:

介绍
WebNote 是一个基于 Web 方式的网络便签程序。通过浏览器(web browser)你可以随时记录思维的火花,与你平常用的便签无异。

您在创建便签本(workspace)后就可以创建便签了。你还可以便签本的 URL 地址告诉你的朋友,让他们给你留言。

用途

  • 可以把这个当作记事簿,记住你的便签本地址,每次想到什么就写下来;

  • 可以考虑把这当作留言本。把地址告诉你的朋友,让他们给你留言;

  • 诗兴大发的时候..."这里有很多诗人,他们的名字写在 Webnote 上" :)

提示
基于网络用户之间相互信任的考虑,在 WebNote 中不提供密码保护功能。你可能会担心:如果别人改动了你的便签怎么办? 其实问题不大,因为任何一个修改操作都是可以回滚的。

注意
如果你在使用这个服务,请遵守互联网法律法规,便签内容带来的一切不良后果由发布者负责。这个服务只用来测试目的,免费,且不对系统稳定性与数据可靠性做任何保证。

部分内容参考了刻录事介绍的WebNote的用法

可能我是第一个在 Dreamhost 主机上安装 Webnote 的用户。因为 Python 与其他模块的问题,需要一点小技巧。

如果给我留言可以用 http://www.dbanotes.net/webnote/fenng 这个地址。如果你也使用了,告诉我你的地址,我也去看看,呵呵。

来玩吧! Just for fun!

-EOF-

参观又拍网(Yupoo.com)小记

| 6 Comments

今天参观了图片共享网站又拍网(Yupoo.com)。

下午在 Gtalk 上收到 yupoohelp (后来才知道隐藏在这个 ID 后面的家伙就是 阿华,又拍网的共同创始人)发来的 关于购买 Dell 服务器的信息。聊了起来,惊奇的发现原来又拍的办公地点离我非常近。阿华要我过去转转,择日不如撞日,欣然从命。

又拍隐藏一个居民小区内,周围环境比较优雅,楼前就是一条小河。上了楼,一开门,迎面看见又拍创始人刘平阳那条金毛巡回猎犬,我可是一点心理准备没有,着实吓了一跳,不过这条大金毛貌似很吓人,其实真的很老实。

如果搜索关于又拍的故事,你一定会发现这样的话语:

2004年12月,刘平阳决定要买一条狗----金毛巡回猎犬。他将金毛当作自己的孩子一样爱护,狗狗的每一步成长的足迹他都一一记录下来。他想与朋友和家人分享这种喜悦,因为他发现,分享的过程也是传递快乐的过程。

这只金毛绝对是又拍的吉祥物,大家都很喜欢。只是网上的照片我没有找到,又没有带相机去。

平阳高而瘦,应该是作技术出身,语速缓和。他说话的时候,金毛就趴在他的脚边,温顺极了。

阿华(沈志华) 也不胖,可能经常熬夜造成的吧。

现在团队现在只有 7 个人(七剑啊),房间虽然不大,倒也不拥挤,很整洁,也看得出创业的艰辛。

又拍现在用户已经有了几十万,图片数据量亦很庞大,维护工作不轻,加班似乎是家常便饭,我去的时候还有另外两位正在电脑前忙碌着,房间里很安静。我们聊天也是"不敢高声语,恐惊工作人",以致于好几次我没听清阿华说什么,汗颜。

杭州是 Web 2.0 的重镇,相对于北京 Web 2.0 圈子,杭州这边相对低调很多。又拍人给我的感觉也是这样:低调、沉稳、目标明确。"100 万用户是最低线",平阳说这句话的时候,很平淡。


BTW: 又拍最近推出的搬家工具很不错,简单的几步就可以把 Flickr 或是网易相册的内容搬过来。

-EOF-

号外! 900 元购买 Dell 服务器

| 18 Comments

Dingdong 的相册看到, 点击这个(地址http://www1.ap.dell.com/content/products/compare.aspx/tower_servers_cn?c=cn&l=zh&s=bsd).

第一步: 选择PowerEdgeTM SC430, 点"自选配置",继续.

第2步,选网上价格 RMB 8,998.47的那台,点"定制并购买", 继续

第3步,操作系统选择linux,可减去7072元.

第4步,选择1年的硬件维护服务,可减727元

第5步, 选择英文文档,还可以省242.19

最后,价格已经是 955.89 元了,含税. 一直继续并填写你的资料,完成购买就可以了,不用急着付钱(不过我怕Dell赖帐,已经付了!)

会有销售代表会和你联系,别忘了打印订购单.

Updated 我收到的 Dell 确认邮件:

我们已收到您的网上订单,但并不构成戴尔已经接受您的订单。您可以通过附件查看您的订单详情。大约 在一个工作日内,我们将通过电子邮件,传真或电话与您联系并确认订单...

看来 Dell 如果选择 "不接受我的订单" 赖帐的话用户的也是没有办法的。事态如何发展,还要观望。

最新的消息:

8月7日中午13时许,DELL网站中的PowerEdge? SC430服务器的价格计算系统出现故障。这台原价8000多的服务器,删减一些软件配置和服务后,最后价格居然不到900元。直至16:00,DELL 才发现该漏洞,此时已经有约7000台被网友们疯狂定购。目前DELL没有发布官方处理结果。

-EOF-

在国内的 BSP 中, BlogBus 给我的印象是挺注重技术一家站点(比如搞一些搬家活动,虽然...但是还是会方便用户的)。不过从最近的数据恢复事故能看出来还是网站维护质量存在挺大的问题。

BlogBus 的公告板上写到:

事故原因:BlogBus于7月1日增加了两台新服务器用以解决网站负载问题,7月20日发现一台服务器可能由于Raid卡或硬盘出现故障,导致一个3G多的数据库文件损坏,致使7月1日至7月19日用户日志数据丢失。

解决办法:由于BlogBus采用静态页面发布,所有已发布日志均生成静态页面保存,所以丢失数据可以由静态页面导回数据库——就是说丢失的数据可以反向导回恢复。

让我不敢相信, 将近 20 天的时间内,数据库没有备份?! 难道他们的数据库是不做备份? 解决办法是静态页面导回数据库,不知道要耗费多少人力劳动。就算是技术人员写脚本,恐怕也不是那么省时的事情。估计最后可能仍然不可避免的会丢掉少量用户的元数据。

我曾经感慨过 Web 2.0 应用服务稳定性仍然任重道远,现在看起来,Web 2.0 应用服务的可靠性也会逐渐成为用户担心的问题。

备份! 备份!

-EOF-

GTD(Get things done) 的工具可以说是数不盛数,在了解 Tracks 之前我曾经用过一段时间的 Next Action

Next Action 是一个SPADE(Single [Page] Application and Development Environment) 程序,也就是说整个程序只有一个页面。 挺有趣的。

Next Action 的使用非常简单,只需要把这一个页面另存为到本地即可(注意: 必须用 Firefox 方可正确浏览,这是我针对中文显示修改过的,你可以到作者主页去找最新版。)。每次使用的时候用 Firefox 打开,修改完毕之后一定要记得重新保存该页面,保存类型选择'Web page, Complete'(这一点稍稍有点不方便)。

Firefox 用户可以查看我站点上的联机页面效果.

Get things done!

-EOF-

生活帮看到 一个开源的GTD系统-Tracks的介绍。去 Tracks 的网站上看了看,感觉是一个不错的 GTD 工具。决定在 Dreamhost 主机上尝试一下。

0.规划

准备起用一个单独的域名 GTD.dbanotes.net。相关文件安装在用户目录下的 gtd.dbanotes.net 目录。

1.准备环境

Tracks 使用 Ruby On Rails 开发的,所幸的是 Dreamhost 现在已经内建支持 Ruby On Rails 了。对于这一项几乎不需要任何额外的操作。

再确定数据库信息。创建一个单独的 MySQL 用户,然后记录该 DB 的主机名字等信息。

2.安装配置
在 Tracks 网站下载安装文件,当前的稳定版本是 1.041。解压所有文件到 gtd.dbanotes.net 目录下,安装指导也在,非常详尽,需要仔细阅读。然后参考文档作如下操作

cp config/database.yml.tmpl config/database.yml
cp config/environment.rb.tmpl config/environment.rb 

把目录 log.tmpl 重命名为 log。编辑文件 tracks/config/database.yml 把 'production' 与 'development' 这两个段需要的信息填入。'test' 段则不要修改。

编辑 config/environment.rb ,找到 change-me 修改为其他的。这个字段是用来加密密码的"盐",默认不改其实问题也不是很大。

在 gtd.dbanotes.net 目录下运行命令:

rake migrate

如果这个操作没有错误,Tracks 就可以跑起来了。

如果有必要,修改 安装目录下或者 public 目录下的 .htaccess 文件进行 URL 重写。

为了安全起见,把除了 public 目录之外的目录文件属性设为 700 。

参考我的 GTD.

3.后记
Tracks 这个东西内建了 WEBrick 这个 Web 服务器,所以如果你的机器支持 Ruby ,完全可以跑在本地 Windows 或者 Linux 或 Mac OS X 等各种操作系统上。这样使用体验会更好一些(我在 Dreamhost 上搭建的速度有些慢)。

Updated: 查看Tracks 截图效果 。如果需要测试用户请发送电子邮件给我: [email protected] .

-EOF-

Oracle SES 的实现案例

| 1 Comment

Oracle Secure Enterprise Search 站点上提供了一篇白皮书: Implementing search.oracle.com - A Case Study 比较详细的介绍了 http://search.oracle.com 的实现。Oracle 通过这个站点提供对公司首页内容与 OTN 的搜索。不过既然是安全搜索,为什么不加入 Metalink 内容的搜索呢?

服务器用的两台 Dell PowerEdge 2850(机器可挺破)。每台配置是 2 颗 3G 的超线程 CPU 加上 8G 内存。存储是 RAID 5 方式。共有 4.3T 内部(? 这个机型最大支持 1.8TB SCSI 内部存储,其余就需要接外部存储了啊? )磁盘空间可用。没有说具体的存储设备或是连接方式。划分了 700G 给当前用。其余留作扩展。写了一个简单的脚本定期从 OS 端检查磁盘状态。

操作系统用的红帽子 RHEL 3 Update 2。内核是 2.4.21-37.ELhugemem ,能够充分利用大内存。接下来的设置我有一点疑问。前面说的 700g 空间挂在目录 /u02 下,而 SES 软件安装在 /u01 下。这个目录是单个磁盘分区上的--这似乎是一个单点啊!

Oracle SGA 设置了 2.5G 左右。当前已经索引了 35 万篇文档,数据库大小是 15G,Cache 文件 17G,Log(搜索的Log) 文件 1G。如果 Oracle 不做站外搜索的话,4.3 T 的总空间是绰绰有余。其实我倒是觉得 Oracle 有义务对站外的 Oracle 论坛等相关信息作一下专门的搜索,也算是对广大用户负责的一种手段。

负载均衡设备选用的是 F5(青春偶像 F4 的旁边, 呵呵)。示意图如下:

Oracle SES and F5 负载均衡

最后的监控方法也值得借鉴。

整个搜索站点构建中,软件成本的标准是: $30K/CPU 或者是 $60/命名用户 或是 $30/员工。两台机器上的 SES 需要 License 是 12 万美金。这个报价可不低啊。

-EOF-

两位 DBA 的站点被黑

| 5 Comments

今天收到消息, eygle.com 被黑了。anysql.net 的内容也放在 eygle 的服务器上,一起遭殃。入侵者删除了所有数据。eygle 与 anysql 都是国内 Oracle DBA 圈子知名人士,想不到。

说起这个事情, eygle 很是黯然:

被黑客攻击了,数据全被删除,eygle.com 宣布无限期关闭。

刚才去看,已经恢复了部分内容。不过据说是没有最近的备份,只能恢复到三月份的状态。损失可谓惨重。

不知道是不是"专注观察天上的星星,而没有注意脚下的坑",个人站点的备份也是需要时刻注意做的啊。

eygle 的站点我记得很久以前就曾经有过安全问题,留言版可以进行脚本攻击。后来改进了许多。不知道这次是不是被跨站脚本攻击(XSS),被取得 MySQL 登陆用户,进而提升到 root 。重新开放后,他的留言板还在使用,要当心。

Updated: 2006/08/04 据说又被攻击了, 这次是 DDos.

Oracle SES 爬虫

百度认为企业搜索市场是鸡肋,可 Oracle 公司正在该领域投入重兵,磨刀霍霍。前几天,Oracle 公司率先使用自家产品 Oracle Secure Enterprise Search 打造自己的站内搜索:http://search.oracle.com

观察一下 Oracle Secure Enterprise Search(SES) 的爬虫:

"GET /OpenSource.htm HTTP/1.0" 200 7336 "-" \ 
"Oracle Secure Enterprise Search"
"GET /Publications.htm HTTP/1.0" 200 6959 "-" \ 
"Oracle Secure Enterprise Search"
"GET /OracleTech.htm HTTP/1.0" 200 14086 "-" \ 
"Oracle Secure Enterprise Search"
"GET /Others.htm HTTP/1.0" 200 5863 "-" \
"Oracle Secure Enterprise Search"
"GET /Others/Service.htm HTTP/1.0" 200 4268 "-" \ 
"Oracle Secure Enterprise Search"
"GET /Others/AboutMe.htm HTTP/1.0" 200 5186 "-" \ 
"Oracle Secure Enterprise Search"    

爬虫的名字就叫做 Oracle Secure Enterprise Search 。Web 日志上抓不到版本号。从 SES 服务器端的日志上可以得知目前的爬虫版本号为 10.1.6。

--EOF--

出品 Nmap 的著名安全站点 Insecure.Org 发布了 Top 100 Network Security Tools 2006 版。相比 2003 版来说,新增加了 5 种图标指示, 看起来更加一目了然。

前四名的位置都没有变化。分别是 Nessus(现在不开源了,但依旧免费)、 Wireshark(Ethereal 更换门庭)、SnortNetCat。值得一提的是漏洞利用和测试平台 Metasploit Framework,第五,窜升的非常快。

万能的 Google 上榜。排名 34。看来 Google 的漏洞搜索能力赢得很多人喜爱。

排名 37 的 Tripwire 下降了 22 位。个人认为 Tripwire 商业版与普通用户很难拉近距离,而开源替代工具(AIDE,integrit 等)又没有什么优秀的。所以完整性检验工具排名大大下降。

匿名浏览工具 Tor 榜上有名,排名 59 。因为网络审查逐渐严格,这一类工具市场很大。还有一个 跨平台的 Tor实现:Vidalia

安全相关的操作系统类值得注意的是 Knoppix 上榜,60。排在了 OpenBSD 的前面 :) 不过排名更好的是 BackTrack 。这个工具有时间要研究一下。

Nagios 第一次上榜。第 67 位。这个工具目前在国内应用也比较广泛,下一次应该还可以靠前一些。

有些莫名其妙的是 VMware 也在榜上,89。 如果把这个东西当作安全测试工具,似乎也说得过去。

第 100 名是 MBSA (Microsoft Baseline Security Analyzer), 终于有了一件微软土生土长的产品,不容易啊。(最近微软收购了 Sysinternals,排在 24 位)

整个兵器谱看下来,最多的一类是 Packet Sniffers ,共有 11 款工具。 Web Vulnerability Scanners 与 Password Crackers 次之,各有 10款。此外这两年随着无线网络的普及,关于无线网络安全de工具也有增多。

这个结果是 3243 Nmap 用户投票选出来的,权威性应该不容置疑。如果有疑问,那就是: Nmap 应该排在什么位置?

注:此文请勿转载!

Technorati 无法访问多日并不见解封后,FeedBurner 终于也被"阻尼"了。接下来会是哪一个? Del.icio.us ? Flickr ?

本 Blog 以后将采用本地的 RSS 地址:

http://www.dbanotes.net/index.xml (请朋友们自行修改一下吧。如果过两天 FeedBurner 起死回生,我会在服务器端作 301 重定向)

悔不该早日把 FeedBurner 的烧录方式修改为如下所示的更健壮的方式

正确的 FeedBurner 烧录方法


Update: 2006.08.01 23:16 FeedBurner 状态恢复正常。莫非我们都错怪了那谁?

修改了 .htaccess ,加入了如下一行:

Redirect temp /index.xml http://feeds.feedburner.com/dbanotes 

任何时候都可以通过 http://www.dbanotes.net/index.xml 这个地址订阅,如果FeedBurner 再次被封就不受影响了。 更多提示

关于这篇归档

This page is an archive of entries from August 2006 listed from newest to oldest.

July 2006 is the previous archive.

September 2006 is the next archive.

Find recent content on the main index or look in the archives to find all content.