| Twitter | Del.icio.us | Comments (10) | | Edit

Comments Powered by Disqus

留言评论 | Comments (10)

yahoo现有的数据仓库基本上还是10年以前开发的,不过现在正在尝试使用PGCLUSTER来替代,yahoo也尝试过使用Hadoop来进行DW的升级,但是似乎hadoop并没有达到预期效果。

“以前总说信息爆炸,这个时代刚刚来临。”
这句话读着很有沧桑的味道

那google呢 今天对雅虎有了新的认识

这帖子被转到了 CNBeta(有出处),然后到 CSDN(出处没了)

这年头遵守CC版权的人太少了

“其特点是 基于列 的而不是 基于行 的模式。”

Hbase 是同样的存储机制。

@accesine

Hbase 存储非结构化数据很适合,存储关系型数据就不是非常合适了,这也是 Yahoo! DW 目前还没有用 Hadoop 的一个主要原因吧

有没有更加详细的信息呢?
如何基于列而不是行?

Everest is built on top of PostgreSQL and is a 2PB database.
插张相关图片:http://farm3.static.flickr.com/2377/2520304654_b25ec0fa44_b.jpg

看来基于列模式的逐渐流行了?也许2维的数据库今后也无法适应大数量的爆炸了,会不会出来个多维度直接钻取的DB?拭目以待……

列存储比较合适做数据仓库类的应用,,对于需要取出几乎所有列的查询, 行存储还是有很大的优势的..

另: Hbase,BigTable,Cassandra都是行列混合的存储. column family之间类似于列存储,column family内部类似于行存储.

关于本文

这篇文章由 Fenng 于 May 26, 2008 7:12 PM 发布.

上一篇:侠客行会议归来.

下一篇:Linux 的 Out-of-Memory (OOM) Killer.

回到 首页 查看最近发表的文章或者查看所有 归档文章.