外部链接统计数据

| 2 TrackBacks

不得不说,Google 的 Webmaster Tools 功能越来越强大了。参考车东的这篇网站的外链/内链统计:来自Google的网站管理员工具,也对 dbanotes.net 进行了一下简单分析。站外链接的前三十条如下:

  13975 www.openrss.net
  10829 cang.baidu.com
  10586 www.itpub.net
   3935 www.wangtam.com
   3655 blog.csdn.net
   1748 blog.94smart.com
   1639 blog.donews.com
   1540 www.08show.com
   1283 www.shunz.net
   1281 www.kuangfeng.cn
   1095 www.hecaitou.com
   1080 blog.xfocus.net
   1008 yangtingkun.itpub.net
    988 reader.solarvistas.net
    985 www.cnblogs.com
    957 del.icio.us
    922 kakaryan.webcan.cn
    900 www.365key.com
    789 www.chedong.com
    639 zhanbin.com
    606 www.feedshow.com
    584 in.comengo.net
    567 www.i170.com
    565 www.ithack.net
    525 www.lifebang.com
    505 wulujia.com
    481 pengjiayou.com
    468 www.anysql.net
    461 www.megite.com
    389 www.builder.com.cn

OpenRSS.net 是我利用 Gragarius 软件搭建的在线 RSS 阅读工具。而来自"百度搜藏"的数量超出想象,而英文书签站点总体数量也不及百度的一半。有的站点(象solarvistas)居然第一次才知道。ITpub 是我常去的一个论坛,链接多应该是因为我做了签名档的缘故。

参考命令:

awk -F , '{print $2}' Links_external_www.dbanotes.net-_20070422T035406Z.csv \ 
|awk -F "/" '{print "<a href=http://"$3">"$3"</a>"}'\
|sort|uniq -c|sort -rn |head -n 30

(为图方便,直接用车东的命令,稍加修改了一下,其实还可以写的更简洁一些。

网站地址的外部链接统计前三十条:

http://www.dbanotes.net/ 51058
http://www.dbanotes.net/sitelog/how_to_subscribe_dbanotes_blog.html 5402
http://www.dbanotes.net/blog/ 2742
http://www.dbanotes.net/cats/ 596
http://www.dbanotes.net/cats/index.rdf 430
http://www.dbanotes.net/database/craigslist_database_arch.html 391
http://www.dbanotes.net/web/flickr_web_tech.html 320
http://www.dbanotes.net/sitelog/dbanotes_mt_templates.html 229
http://www.dbanotes.net/database/ebay_storage.html 220
http://www.dbanotes.net/review/dreamhost_really_sucks.html 212
http://www.dbanotes.net/Oracle/Install-Oracle10g-RHEL3.htm 203
http://www.dbanotes.net/web/technorati_db_arch.html 195
http://www.dbanotes.net/Oracle/Use_OpenSourceTool_implement_YourOwn_TPC-C.htm 177
http://www.dbanotes.net/review/google_china_daohang_and_others.html 174
http://www.dbanotes.net/Oracle/Use-SQLPlus-to-Create-HTML.htm 169
http://www.dbanotes.net/web/suggestion_to_web_20.html 164
http://www.dbanotes.net/review/review_words_20070316.html 162
http://www.dbanotes.net/review/second_life.html 157
http://www.dbanotes.net/techmemo/reinstall_xp_memo.html 157
http://www.dbanotes.net/database/dst_daylight_saving_time_oracle.html 154
http://www.dbanotes.net/review/blogger_make_money_and_blog_network.html 152
http://www.dbanotes.net/Oracle/10G-Beta-Install-Bug.htm 151
http://www.dbanotes.net/sitelog/dreamhost_outage_again_and_again.html 151
http://www.dbanotes.net/sitelog/movable_type_rss_comments.html 146
http://www.dbanotes.net/review/livid_v2ex.html 140
http://www.dbanotes.net/sitelog/blog_stats_0701.html 138
http://www.dbanotes.net/archives/2005/01/nutch_aee.html 138
http://www.dbanotes.net/review/24_hours.html 135
http://www.dbanotes.net/review/autoroll_a_widget_about_blogroll.html 135

说明一下,Feed 地址少是因为 RSS 地址都转向到 FeedBurner 上了。第二条是关于如何订阅的,可能也因为我在论坛上做了签名档有关。关于一些网站架构的文章,虽然技术细节不多,可能因为这类话题更容易吸引眼球,链接还是不少的。

--EOF--

2 TrackBacks

Nutch 初体验 Read More

车东在Gtalk上问我,做没做网站的外链统计?突然发现Goo... Read More