DBA Notes: OpenSource 文章列表

Yahoo! 与 Hadoop

By Fenng on November 14, 2007

Yahoo! 和 Carnegie Mellon 大学合作的开源分布式计算项目代号为 M45，这个超级计算集群有 4000 个处理器，3T 内存，1.5 PB 存储空间，自称足以跻身世界超级计算机 50 强。这两天网络上搜索最火的一个词应该就是 Hadoop 了吧? 雅虎的这套集群就是跑在 Hadoop 上。

Hadoop 现在已经有很多不错的应用案例可以参考，比如这篇 Running Hadoop MapReduce on Amazon EC2 and Amazon S3

Yahoo! 或许早意识到自己的 Web 1.0 方式下的计算能力比 Google 差的太远，干脆放手一博，助力 Hadoop 项目，期望能借助开源的力量与 Google 掰一下手腕。从这里我们得知 Yahoo! Hadoop 团队早在 06 年就成立了，当然，这个团队成立的前提是 Doug Cutting 入职雅虎。

雅虎现在不应该担心追不上 Google ，应该担心 Doug Cutting 别被 Google 挖去，否则，可真的没机会了。

--EOF--

WikiPedia 技术架构学习分享

By Fenng on November 4, 2007

维基百科(WikiPedia.org)位列世界十大网站，目前排名第八位。这是开放的力量。

来点直接的数据：

峰值每秒钟3万个 HTTP 请求
每秒钟 3Gbit 流量, 近乎375MB
350 台 PC 服务器

数据来源

架构示意图如下：
Copy @Mark Bergsma

在我写的这些网站架构的 Blog 中，GeoDNS 第一次出现，这东西是啥? "A 40-line patch for BIND to add geographical filters support to the existent views in BIND", 把用户带到最近的服务器。GeoDNS 在 WikiPedia 架构中担当重任当然是由 WikiPedia 的内容性质决定的--面向各个国家，各个地域。

负载均衡：LVS

WikiPedia 用 LVS 做负载均衡, 是章文嵩博士发起的项目,也算中国人为数不多的在开源领域的骄傲啦。LVS 维护的一个老问题就是监控了，维基百科的技术人员用的是 pybal.

图片服务器:Lighttpd

Lighttpd 现在成了准标准图片服务器配置了。不多说。

Wiki 软件: MediaWiki

对 MediaWiki 的应用层优化细化得快到极致了。用开销相对比较小的方法定位代码热点，参见实时性能报告，瓶颈在哪里，看这样的图树展示一目了然。另外一个十分值得重视的经验是，尽可能抛弃复杂的算法、代价昂贵的查询，以及可能带来过度开销的 MediaWiki 特性。

Cache! Cache! Cache!

维基百科网站成功的第一关键要素就是 Cache 了。CDN(其实也算是 Cache) 做内容分发到不同的大洲、Squid 作为反向代理. 数据库 Cache 用 Memcached，30 台，每台 2G 。对所有可能的数据尽可能的Cache，但他们也提醒了 Cache 的开销并非永远都是最小的，尽可能使用，但不能过度使用。

数据库: MySQL

MediaWiki 用的DB 是 MySQL. MySQL 在 Web 2.0 技术上的常见的一些扩展方案他们也在使用。复制、读写分离......应用在 DB 上的负载均衡通过 LoadBalancer.php 来做到的，可以给我们一个很好的参考。

运营这样的站点，WikiPedia 每年的开支是 200 万美元，技术人员只有 6 个，惊人的高效。

参考文档：

Wikimedia architecture （PDF)
Todd Hoff 的文章

--EOF--

Linux 上生成硬件信息与配置报告: Sysreport

By Fenng on October 27, 2007

今天才注意到 Linux 上这个 Sysreport 工具。当需要 Linux 主机详细完整的描述给另一个人的时候，这个工具非常适合。用 root 用户之行，但要注意最好不要抓取 currently installed packages 信息，这一步非常慢。(用 -norpm 参数)

存储厂商 EMC 也有个 EMCgrab 工具，工作原理类似，额外抓取了存储相关的信息而已。估计各家存储厂商都有，要不远程支持也太费劲了。

--EOF--

YouTube 的架构扩展

By Fenng on July 24, 2007

在西雅图扩展性的技术研讨会上，YouTube 的 Cuong Do 做了关于 YouTube Scalability 的报告。视频内容在 Google Video 上有(地址)，可惜国内用户看不到。

Kyle Cordes 对这个视频中的内容做了介绍。里面有不少技术性的内容。值得分享一下。(Kyle Cordes 的介绍是本文的主要来源)

简单的说 YouTube 的数据流量, "一天的YouTube流量相当于发送750亿封电子邮件.", 2006 年中就有消息说每日 PV 超过 1 亿,现在? 更夸张了,"每天有10亿次下载以及6,5000次上传", 真假姑且不论, 的确是超乎寻常的海量. 国内的互联网应用,但从数据量来看,怕是只有 51.com 有这个规模. 但技术上和 YouTube 就没法子比了.

Web 服务器

YouTube 出于开发速度的考虑，大部分代码都是 Python 开发的。Web 服务器有部分是 Apache，用 FastCGI 模式。对于视频内容则用 Lighttpd 。据我所知，MySpace 也有部分服务器用 Lighttpd ，但量不大。YouTube 是 Lighttpd 最成功的案例。(国内用 Lighttpd 站点不多，豆瓣用的比较舒服。by Fenng)

视频

视频的缩略图(Thumbnails)给服务器带来了很大的挑战。每个视频平均有4个缩略图，而每个 Web 页面上更是有多个，每秒钟因为这个带来的磁盘 IO 请求太大。YouTube 技术人员启用了单独的服务器群组来承担这个压力，并且针对 Cache 和 OS 做了部分优化。另一方面，缩略图请求的压力导致 Lighttpd 性能下降。通过 Hack Lighttpd 增加更多的 worker 线程很大程度解决了问题。而最新的解决方案是起用了 Google 的 BigTable，这下子从性能、容错、缓存上都有更好表现。看人家这收购的，好钢用在了刀刃上。

出于冗余的考虑，每个视频文件放在一组迷你 Cluster 上，所谓 "迷你 Cluster" 就是一组具有相同内容的服务器。最火的视频放在 CDN 上，这样自己的服务器只需要承担一些"漏网"的随即访问即可。YouTube 使用简单、廉价、通用的硬件，这一点和 Google 风格倒是一致。至于维护手段，也都是常见的工具，如 rsync, SSH 等，只不过人家更手熟罢了。

数据库

YouTube 用 MySQL 存储元数据--用户信息、视频信息什么的。数据库服务器曾经一度遇到 SWAP 颠簸的问题，解决办法是删掉了 SWAP 分区! 管用。

最初的 DB 只有 10 块硬盘，RAID 10 ，后来追加了一组 RAID 1。够省的。这一波 Web 2.0 公司很少有用 Oracle 的(我知道的只有 Bebo,参见这里). 在扩展性方面，路线也是和其他站点类似，复制，分散 IO。最终的解决之道是"分区",这个不是数据库层面的表分区，而是业务层面的分区(在用户名字或者 ID 上做文章,应用程序控制查找机制)

YouTube 也用 Memcached.

很想了解一下国内 Web 2.0 网站的数据信息,有谁可以提供一点 ?

--EOF--

有扩展性问题请向 Flickr 的 Cal Henderson 提问

By Fenng on July 7, 2007

《程序员》杂志在做关于 Web 可扩展性的专题，编辑朱海燕联系上了 Flickr 的 Cal Henderson, Web 2.0 应用最出色的架构师之一, 准备对他进行 e-mail 采访，如果大家有什么关于 Web 扩展性的相关问题，可以在后面留言或者发邮件给 [email protected] , 我代为转交。

五月份阿里巴巴举办的侠客行网络大会 Cal Henderson 因为时间的关系而没能成行，希望这次的采访能弥补一下不少人的遗憾。

--EOF--

再说 Linux 下恢复 EXT3 Superblock

By Fenng on June 30, 2007

翻出以前写的这则: 恢复 EXT3 Superblock 的正确方法 , 补充几点内容。

1) 获取超级块位置

前文说过超级块的位置，对于一个未知的 Ext3 文件系统，也可以用 fsck 模拟对设备的格式化，输出的内容中会列出 Superblock 的位置。命令开关是 "-N".
Testdisk是一款超强的开源文件系统恢复工具，通过它也很容易检查到超级块的信息以及如何恢复，很关键的一点是，这个工具能检查到"可用"的超级块信息

有关分区表信息

有的时候，也有可能是分区表信息损坏。fdisk -l /dev/hdx 会提示该设备上没有任何分区信息。gpart 这个小工具恢复分区表比较有效。当然，前面介绍的 Testdisk 也能做到这一点，如果该设备上只有一个文件系统，那么直接 fdisk 处理一下也是可行的。

恢复 Ext 文件系统上删除的文件

Linux / Unix 没有 Windows 回收站这个概念，rm -rf 有的时候会造成一定的灾难。个别的时候，e2undel 能派上用场。

--EOF--

Putty 发布了 0.60 版

By Fenng on April 29, 2007

Putty 发布了新的版本 0.60，最有用的一个改进是在默认设定的地方可以存储主机名字。

- Pressing Ctrl+Break now sends a serial break signal in the serial back end, and in the SSH and Telnet backends it asks the server to do the same (if the server supports it). The previous Ctrl+Break behaviour can still be triggered with Ctrl-C.
- On Windows, it is no longer necessary to configure high-numbered
serial lines such as COM10 as `\\.\COM10'; PuTTY does this
automatically.

- You can now store a host name in the Default Settings.

还有不少 Bug 修订。估计 Putty 在国内网络人员中的普及原不及 SecureCRT。

--EOF--

GNU 核心工具

By Fenng on February 22, 2007

"说出 10 个 Linux 基本命令?"

这是当年我在毕业求职的时候遇到的一个面试题。没有难度。如果说法换一下，"说出 10 个 GNU 核心命令"，即使我能蒙出来 10 个，怕也会有错误。

GNU 核心工具(GNU Core Utilities)指的是 GNU 操作系统基本的文件、Shell、文本维护工具。

The GNU Core Utilities are the basic file, shell and text manipulation utilities of the GNU operating system. These are the core utilities which are expected to exist on every operating system.

GNU 核心工具包括 fileutils、Shellutils、textutils 三个部分。其中 fileutils 只有 22 个命令，有三个命令我居然从来没有用到过，分别是 mkfifo(Creates FIFOs)、shred(Destroy data in files)、vdir(Long directory listing)。Shellutils 有 35 条命令，其中也有我从来没有注意过的命令，比如 pinky(Lightweight finger)；textutils 工具中也有用的极少的工具，而且用的时候也往往有一些坏习惯，textutils 有 26 条命令，注意 VI/VIM 并不在其中。

初学 Unix/GNU Linux 的时候往往觉得老虎吃天，无从下口。这里有个小小的建议：从这个 GNU 核心工具开始，逐步掌握包含的三类几十条命令。对于类 Unix 操作系统你就可以拿出去蒙人了，呵呵，象 Unix 操作系统速成? 这有点像《天龙八部》中鸠摩智学会了小无相功，就能把少林 72 绝技耍的像模像样有些类似。当然，仅靠这一点还不足以行走江湖，有时间咱再继续说。

--EOF--

在 OpenSource 类别下的文章

Yahoo! 与 Hadoop

WikiPedia 技术架构学习分享

GeoDNS

负载均衡：LVS

图片服务器:Lighttpd

Wiki 软件: MediaWiki

Cache! Cache! Cache!

数据库: MySQL

Linux 上生成硬件信息与配置报告: Sysreport

YouTube 的架构扩展

Web 服务器

视频

数据库

有扩展性问题请向 Flickr 的 Cal Henderson 提问

再说 Linux 下恢复 EXT3 Superblock

1) 获取超级块位置

有关分区表信息

恢复 Ext 文件系统上删除的文件

Putty 发布了 0.60 版

GNU 核心工具

文章分类

搜索本站

关于归档