| Twitter | Del.icio.us | Comments (13) | | Edit

4 TrackBacks

Nutch 初体验之二 from 数据库管理员的BLOG on January 4, 2005 3:08 PM

Nutch 进行全网的爬行(Whole-web Crawling) 的操作测试以及介绍。 Read More

Nutch 0.6 中新的改进 from 数据库管理员的BLOG on January 5, 2005 12:25 PM

Nutch 0.6 版本有哪些新功能 Read More

笔者利用春节假日对Nutch进行较深入的研究与了解。本文先根据Nutch在Windows上安装的过程与体会,对相关步骤与方法作了细解,以期对欲使用该软件者有所助益。 Read More

笔者利用春节假日对Nutch进行较深入的研究与了解。本文先根据Nutch在Windows上安装的过程与体会,对相关步骤与方法作了细解,以期对欲使用该软件者有所助益。 Read More

Comments Powered by Disqus

留言评论 | Comments (13)

写的好,本来我还想用lucene做blog的搜索呢,如果生成静态html的话,直接用这个就好了

sorry,有点问题,发了很多,麻烦删掉,不好意思!

谢谢你的中文指导,我有个问题想请教一下,假设我每隔一段时间要索引一个网站,那每次生成的索引怎么合并呢?我用nutch merge命令老是报错,一般都是某某目录不能删除的错误信息,请能告诉是怎么回事么?

请参考我的另一篇测试文档:http://www.dbanotes.net/archives/2005/01/nutch_aeeaeae.html

可以请教一下你的中文还有其他语言是怎么解决的么?麻烦mail我,thx:)

好文章啊,感谢作者。有个问题请教,当我运行这个命令时
#bin/nutch crawl urls -dir crawl.demo -depth 2 -threads 4
错误信息提示如下:
run java in /usr/j2se/jre
bin/nutch: IFS: cannot unset
为什么呢??? 谢谢

好文章,有没有 Nutch 的 windown 版本 下载

我使用nutch mergesegs -o -cm -i 进行多个索引合并,运行结果提示已经成功合并,但不能SEARCH结果,请问还要执行那些操作,我发现db目录缺少,请指点!

支持
永远

How do you make nutch.war?

如果是使用lucene做全文索引的,那中文分词应该没有问题啊。现在的lucene对中文虽然同样是单字索引,但是检索的时候,它会检查两个字是否相邻,否则不算数。

Hi what aa nice tool & API In open Source Technology

www.eworldtechnologies.com

What a nice tool it is!!!!!!!

Best Regards
E World Team
http://www.eworldtechnologies.com/

关于本文

这篇文章由 Fenng 于 January 2, 2005 8:00 PM 发布.

上一篇:ITPub Search Plugin for Firefox and Mozilla.

下一篇:Google PR 更新以及其他.

回到 首页 查看最近发表的文章或者查看所有 归档文章.