October 2005 Archives

免费的Oracle Database 10g XE

| 8 Comments

看来真的是免费的午餐越来越多了. 打开 OpenRSS 居然看到一堆和 Oracle 的免费数据库有关的新闻.这是真的! Oracle 居然也推出了一个免费(Free,价格的Free)的 Database 版本: Oracle Database 10g Express Edition .

Oracle 10g Express Edition (XE) 集成了 Oracle HTML DB 2.1 ,便于开发基于 Web 的应用. 当然,这个免费是肯定有功能限制的:只能用于单处理器,最多处理 4G 用户数据.并且支持的内存也不能超过1G. 但是可以肯定Oracle将会逐步放宽这些限制. 联想到 10 月份 Oracle 收购芬兰的数据库技术开发商 Innobase , 看起来 Oracle 是对 MySQL 这一块中小数据库的市场有兴趣不小: 先挖掉 MySQL的半块墙角,然后抛出个半成品探探开源的路.

目前已经有Linux 平台与Windows平台的 Beta 版本可以下载.

不到一年的时间,Oracle 已经收购了大大小小十多家软件公司了.不知道是不是疯了.什么时候消化整合完都是个问题.不过推出 XE 的这个动作倒是不错.顺便搅搅局. 因为这段时间 MySQL 刚刚发布了 5.0 版本, 最为重要的是据说微软的 SQL Server 要正式推出 SQL Server 2005 了.也是阿,马上就2006 年了.新产品都要抓紧不是?

话说回来, Oracle 虽然野心大,但是也没有 Google 大,最近 Google 的 Google Base 相信会让任何一家潜在的竞争对手坐立不安

Http 1.1 Etag 与 Last-Modified

| 5 Comments

在 Blog 盛行的今天,一些 Web 应用需要解析大量的 RSS Feed .如何提高效率是个非常重要的问题.在 MagpieRSS 的 Features 中列举了这样的一条: HTTP Conditional GETs Save bandwidth and speed up download times with intelligent use of Last-Modified and ETag.. 这里的 Etag 引起了我的注意.

什么是 Etag ?

通过阅读 RFC 2616 ,得到了对 Etag 的一点印象:

The ETag response-header field provides the current value of the entity tag for the requested variant......Entity tags are normally "strong validators," but the protocol provides a mechanism to tag an entity tag as "weak." One can think of a strong validator as one that changes whenever the bits of an entity changes, while a weak value changes whenever the meaning of an entity changes. Alternatively, one can think of a strong validator as part of an identifier for a specific entity, while a weak validator is part of an identifier for a set of semantically equivalent entities.

从上我们可以大致得知,Entity tags 本质上说是一种"强校验器",但是 HTTP 协议提供了一种通过给 Entity tags 打标签的"弱"的机制(类似于内容的校验码).虽然这段话后面通过两种方式进行了解释,但是还是有些晦涩.我看了这段话之后只是得出了 Etag 的 "E" 代表 "Entity" 而已.

Magpie 首页上提到了一篇文章: HTTP Conditional Get for RSS Hackers ,拜读之后清晰了许多.要先说说 HTTP Conditional GETs 的基本原理,很简单,就是说,从 Web 服务器取数据的时候,如果文件变化了,给我新的文件,如果文件没有变化,只需告诉客户端没有变化即可,不必再把文件取回来.这样就可节省大量的网络带宽和资源.

Etag 与 Last-Modified 是从 HTTP 1.0 到 HTTP 1.1 才有的概念.当我们从 Web 服务器获取文件的时候,只需要读取 HTTP 响应头的 Etag 与 Last-Modified 字段即可,这两个字段里面的具体内容是什么可以不管(可能会千奇百怪,RFC 2616 对 Etag 没有具体值的定义),把这两个值 Cache 在本地,下次检查文件是否更新的时候比对这两个值即可.如果没有变化,服务器的响应代码不是 HTTP 200 (OK) , 而是 304.

http.304.png

如上图.目前 OpenRSS 虽然订阅了40 多个 Feed,但是响应速度很不错.在使用 Gregarius 的过程中(Lilina 也应用了 ETag),发现了 FeedBurnrer 烧录的 Feed ,几乎都是用了 Etag 的(否则估计服务器要瘫痪,Hoho).我们再测试一下 HTTP header 的响应情况:

$ curl -I http://feeds.feedburner.com/dbanotes
HTTP/1.1 200 OK
Date: Tue, 25 Oct 2005 11:34:15 GMT
Server: Apache
Last-Modified: Tue, 25 Oct 2005 04:30:12 GMT
ETag: U4q478bDKLqZ8UMMC8A5afZuHug
Content-Type: text/xml;charset=utf-8

$ curl -I http://feeds.feedburner.com/dbanotes
HTTP/1.1 200 OK
Date: Tue, 25 Oct 2005 11:34:21 GMT
Server: Apache
Last-Modified: Tue, 25 Oct 2005 04:30:12 GMT 
ETag: U4q478bDKLqZ8UMMC8A5afZuHug
Content-Type: text/xml;charset=utf-8

在这个期间,我的 Blog 没有更新.所以 Last-Modified 和 ETag 返回的都是相同的值.这样 Gregarius 就不必重新解析了. 国内的 GreatNews 是支持 HTTP Conditional GETs 的,更棒的是还支持 gzip/deflate encoding.而另一个 RSS 阅读工具 POPU (周博通) 就不知道了.

以上是我的笔记,如有理解错误,请指正!

--EOF--

因为 Gregarius 的 URL_REWRITE 做的不错.OpenRSS.net 也算上线了几天了.好奇心起,看看在各个搜索引擎的收录情况.从访问日志上看,各个搜索引擎的机器人都有光顾.尤其以 Yahoo Slurp 和 百度的 BaiDuSpider 最为频繁.这两家的爬虫居然各自有几千次.Google 的 Googlebot 光顾的次数比较少.每天大约 5/6 次而已. MSNBot 光顾的还要再少一些.

从搜索的结果上看,用 site:www.openrss.net 搜索百度,居然有 540 个站内页面可以找到. 搜索Google,只有孤零零的一个结果,而 MSN 的爬虫虽然来的次数少,但是还是有效率,可以找到 31 项. Yahoo! Search 呢? 用 domain:www.openrss.net 查询,结果为零.不过从一搜那里倒是可以找到一个.

2005/10/27Update:现在在一搜中的结果已经到了 470个.Google 还是 1. 在 Search.yahoo.com 中也出现了 9 条记录.百度1090 .不过 一搜 的窜升速度太快了.相信不久就可以超过百度.从这边爬虫的来访频度来看,也是一搜越来越频繁.

第一次注意到 Gregarius 是在 Lilina 的论坛里面. 看到 Gragarius 之后,就想抛掉 Lilina 以及 Ajax-ed Lilina. 因为 本身存在的一些问题没办法解决,不得不放弃.从一个普通用户的角度上看,Lilina 存在的主要问题有:

  • RSS 抓取速度太慢.尽管可以利用 Wget 工具在后台构建一个静态页面.但是 Lilina 订阅的种子数量还是不能太多.否则光解析就是灾难.
  • RSS Feed 不能分类.所有的 RSS 都放到一起.看起来有点杂乱无章.
  • 不支持数据库.
  • 开发进度缓慢,基本上已经停止开发.也就是说出现问题能够得到的支持非常的少.

另外一个功能类似的 Feedonfeeds ,结构太松散了.而对比之下, Gregarius 的功能似乎让人惊讶. 我比较关注的几点如下:

  • AJAX 能够带来更好的用户体验. 支持 AJAX 化的 Tag定制功能
  • Supports themes and plugins 带来了良好的扩展性.
  • Search in your feeds 具备查找功能 .
  • 良好的 url_rewrite 设计.
  • 支持 MySQL 和 SQLite

对 Gregarius 分析了几天之后,接着利用了几天的休息时间,把 Gregarius 在 OpenRSS.net 上搭建了起来.部署应该是个很简单的事情,但是因为是虚拟主机,遇到了很多问题.还好,大部分都已经解决.涉及到的问题大致有如下几个:

很多朋友是 FeedBurner 的忠实用户,把自己的 Blog ,图片书签等交给 FeedBurner 统一烧制成一个 Feed .其实,FeedBurner 也可以用来做 Blog 代理, BlogSpot 上的很多内容由于某种原因,国内都是不可以访问的,但是可以直接用 FeedBurner 烧制 Feed,这样间接的转一下,就可以看到大部分的 Blog 内容.

比如,Oracle 公司专家 Thomas Kyte 的 Blog ,就可以直接把 URL 交给 FeedBurner 烧制,可以自动探测出 Feed .

这样有的时候只能看到 Blog 的一部分.所以如果作者的 Blog "量给的足",不是只有摘要(Excerpt)或者链接.这个在 OpenRSS.net 上当我抓取 Official Google Blog 的 Blog 的时候很有体会.一次给足是个不错的习惯.期待 FeedBurner 以后能够推出可以抓取 Blog 全文的服务.毕竟这不是难事.

备份 Del.icio.us 书签

| 1 TrackBack

美味书签比较好用,但是如果一旦数据丢失,对广大忠诚用户的损失可不小.和车东曾经聊起过,如果有个地方可以备份个人在 Del.icio.us 的上的书签就好了。今天发现 http://www.rawsugar.com/ 提供了备份 del.icio.us 书签的功能。 当然,这可不是挖 del.icio.us 的墙角。

备份的步骤比较简单。先在 RawSugar 注册。然后跑到 http://del.icio.us/api/posts/all ,输入在 Del.icio.us 的用户名字和密码,就可以把 del.icio.us 书签全部导出来。XML 格式的。接着,在这里就可以进行导入。唯一不够完美的是,这个导入是否完全不是立刻可以得到结果,必须等到 E-Mail 通知。(当然,这个时间并不需要很长)

站点迁移到了国外

| 56 Comments | 4 TrackBacks

是不是前两天访问不到我的站点? 对这些朋友说声抱歉.这个站点这两天迁移到了国外,因为存在域名解析的问题,可能有的地方 DNS 同步比较慢.从今天下午的访问日志来看,基本正常了.

桑林志那里看到 Dreamhost 的主机服务不错的,而且有打折的机会,就赶紧申请了一个. Dreamhost 的虚拟主机功能比较多,最便宜的一款送一个独立域名, 4.8G 的网络空间[2006/01/08: 现在是20G了,每个月1T 带宽(原来是20G)],支持 不限数量的 MySQL 数据库,支持 WordPress / MT 等 Blog 软件, 支持 Awstats 、甚至还有 Ruby on Rails ,吸引我的还有一点是,可以得到 Shell 帐号,其他的功能也很丰富,更为重要的是这些只花了 24 个美金,没错,只有 24 个美金.一年的费用是24美金,我用招行信用卡就可以付款.之后我也建立了一个折扣代码: FENNG . 在申请之后结算的那个地方输入即可。会立刻告诉你节省了多少钱。见下表:

pROMO.png

申请 Yearly L1 是性价比最好的一款.

Thomas Kyte 生财有道。Expert Oracle Database 系列图书将会有三本。Expert One on One Oracle 这本书将一分为三.第二本的主题大致为: Expert Oracle Database Development: 9i and 10g Programming Techniques and Solutions.上一本 Expert Oracle Database Architecture: 9i and 10g Programming Techniques and Solutions 偏重于Oracle 架构,而这本是几乎完全面向开发人员的。当然,大部分内容应该会有所变化的。毕竟这本书是技术内容是要包括 10g 的,而 10g 又加入了很多新的特性。

Upcoming.org 被 Yahoo! 收购

| 2 Comments

昨天我们提到Tim O'Reilly 的大作 What Is Web 2.0 中对 Web 1.0 和 Web 2.0 的代表应用做了一些对比,其中有一条是这样的:

Evite—>upcoming.org and EVDB

我发现 Keso双叶 的站点对这一条都没有什么说明. evite 指 http://www.evite.com/ ,Evite 是干啥的? 通过该公司的介绍就很清晰:

Evite is the free social-planning site featuring invitations, social networking, local information and events listing. From planning a dinner party for friends to finding something to do on Saturday night, Evite makes it easy to explore local areas, communicate, coordinate, and make decisions. Launched in 1998, Evite is an operating business of IAC/InterActiveCorp (NASDAQ: IACI) Local and Media Services.

Upcoming.org 作为 evite 的 Web 2.0 接班人,无疑会钩起 Yahoo! 这样贪吃的巨人的胃口。今天看到创始人 Andy Baio 在站点上的 Blog 上写到 Yahoo! 收购 Upcoming.org. 但是没有透漏具体交易金额。Upcoming 的另外两位创建者 Leonard LinGordon 也分别在各自的 Blog 上发布了这个消息. Upcoming.org 创立到现在只有短短两年时间,应该是卖了一个不错的价钱。否则 Andy Baio 怎么会这么满意 ?

Web 2.0 时代谁拥有数据 ?

| 2 Comments | 4 TrackBacks

最近 Blog 的圈子里因为 Tim O'Reilly 的一篇 What Is Web 2.0 而引发了很多讨论。看翻译版可以到 双叶 , 总结可以在 Keso 处找到. 什么是 Web 2.0 其实我不是很关心 . 倒是文中提到的一段话很有意思:

As Hal Varian remarked in a personal conversation last year, "SQL is the new HTML." Database management is a core competency of Web 2.0 companies, so much so that we have sometimes referred to these applications as "infoware" rather than merely software.

数据库会是 Web 2.0 公司的核心竞争力 ?

所有的 Blogger 是否平等?

| 6 Comments | 1 TrackBack

老白那里看到他引申出来的一句话:

所有 Blogger 一律平等,但有些 Blogger 比其他 Blogger 更加平等。

这句话引出来一个问题:是不是所有的 Blog 都是平等的?

答案应该是否定的.很明显,就拿 Donews 来说,其他 Blogger 和 Keso 来比肯定是不平等的。Keso 可以每一篇 Blog 都放到首页上,但是其他 Blogger 的文章就是有选择性的。为什么? 因为 Donews 的"中心化".因为中心化,Keso 的文章出现的次数多(更类似电影电视剧演员镜头多,露脸的机会多),所以,逐渐得到的权重就大,所以,Keso 的 Blog 阅读量越来越大.这样我要说,虽然 Donews 上所有的 Blogger 看上去是平等的。但是实际上有些更加平等。而之所以有的人依然依依不舍这样的地方,就是因为他们想获得这种更平等的话语权.

豆瓣 使用感受

| 3 Comments | 1 TrackBack

豆瓣最近已经赢得了足够的注意力。说起来有趣,我在读书杂志上第一次看到豆瓣的那个还不够豆腐块大的广告的时候还以为是一个传统的旧书交流站点呢.对于很多贴着 Web 2.0 标签的新站点和新的 Web 服务,必须坚持使用才知道究竟是好玩儿不好玩儿。比如,Flickr ,我第一次看到这个站点的时候真有点不屑一顾的感觉:不就是一个图片收藏管理的站点么? 但是 Del.icio.us 的经验告诉我,虽然是一个很土的想法,也有可能成为很酷的工具。坚持使用下去,就会发现 Flickr 真的无愧于"图片收藏的 Google 这个称号". 而对于豆瓣呢 ? 似乎没办法定义它。但它和 Flickr 一样,用户体验做的真好。

豆瓣我不看好的是他的 Tag 功能。或者数对现在的 Tag 定位不太赞同。一个商品,很难在把它进行 Tag 化的,你看现在 豆瓣 中的那些 Tag ,很多真是风牛马不相及的。因为书、DVD、CD这些东西如果非要针对标题进行 Tag 分类是有些牵强的.比如《红拂夜奔》这本书,标签为:小说 (2) 我的精神家园 (1) 王小波 (1),意义不大,不是么?但是,并不是说豆瓣不应该出现 Tag .针对图书等的评论绝对是有必要 Tag 分类的。

关于这篇归档

This page is an archive of entries from October 2005 listed from newest to oldest.

September 2005 is the previous archive.

November 2005 is the next archive.

Find recent content on the main index or look in the archives to find all content.