星期二 十月 24, 2006

黑箱计划简介

正如我前一段时间所讲的,我们的客户 — 特别是某个细分市场的客户*,正面临着诸多严峻的挑战。当在曼哈顿市中心工作的首席信息官用完了楼顶空间和电能后,她该怎么做呢?在遭到海啸袭击的大城市里,救援机构如何与 5000 名救灾人员保持基本的联系?当石油公司准备把高性能分析工作转移到远离陆地的海上平台或超级油轮上时,应如何做呢?或者,如果一家大型网络服务公司希望以固定模式方式在水力发电厂附近构建类似的基础设施,从而获得廉价的电能,而且完成的时间要以周而不是以年计算,该怎么办呢?

所有这些都不是容易解决的问题 — 特别是一次只能连接一台计算机时。它们是您能想到的再普通不过的事情。现在,您明白我们询问这些简单问题背后的真正动机了 —“完美的数据中心究竟是什么样子?”

新一代数据中心应在其父辈(即传统数据中心)的基础上经过诸多改进,它必须更加节省空间和能耗。性能卓越,而且是针对机器而不是为人设计的豪华办公空间。它的供货周期应在数周内,而不是数年内。此外,它还必须便于移动,让客户可在任何地方部署 — 如灾区或水力发电厂附近。

不过,让我们从最基本的问题入手。它应该有多大?

在纵向规模式或对称式多处理系统的世界里,一系列 CPU 共同使用一组通用内存。但是,特定系统的大小受物理和逻辑方面的限制:它不能超出用于连接所有内部离散要素的专用网络。

然而,未来的网络明显朝着横向或网格运算方向发展。在网格中,传统网络用于连接一组更小*的通用要素(如 Sun 的 Niagara 或 Galaxy 系统)。“最大的网格有多大?”这一问题没有明确的答案 — 它们可以如您想像的那么大, 就像 TACC 正在建造的、超出普通用途的全球最大超级计算机一样。

因此,不久前,我们询问了数位精明的系统工程师一个简单的问题:横向扩展式系统的最佳的尺寸. 非常有趣,答案既不是源于 Solaris 计划,也不是源于博士论文。它源于我在第二段中论述的客户所面临的环境现实。而且,更有趣的是,它可能源于您当地的造船厂。

造船厂?

我们所能建造的最大物体最终可能是我们能在世界上运输的最大物体 — 答案应该是标准化的运输集装箱。为什么呢?因为世界上的运输基础设施已经为做到这一点进行了恰如其分的优化 — 运输集装箱可以在铁路、公路和海上运输。当然,我们可以移动比超级巨轮更大的东西(参见图示),但确切地讲,它并不是一个通用系统。

因此,现在的问题变为,“您可以在运输集装箱里建造多大的计算机?”而且,这也是系统工程的起点。

首先,服务器为何安装在机架中且由风扇从前向后冷却?是为了最大程度地方便那些与系统交互的人员。但是,如果您希望拥有一个“故障冻结型”数据中心,人机交互将不再是您考虑的唯一事项。因此,我们把机架转动 90 度,在多个机架中形成非常高效的气流。另外,除了气冷方式外,为何不采用水冷的方式 — 如果您的手受到了灼伤,您是在空气中挥动手,还是把它浸入一碗冰水中?显然,后者是更加有效的冷却方式。

在普通数据中心的运营费用当中,由于需要冷却空间巨大的、温度非常高的运算平台,电费占相当大的比例 — 相对于空气,增加水冷却器可以显著降低冷却费用。这对环境也有同样的影响。我不是说过,“eco-responsible”中的“eco”表示“economics(既对环境友好,同时又具有经济效益)”吗?。对于许多公司而言,电费在数据中心费用清单中仅次于工资,位居第二。(的确,电费开支非常庞大。)

不过,这正是我们开始追求高效节能的原因。

其次,如果您能自己发电,而且费用比供电公司向您收取的费用要少得多,那么何乐而不为呢 — 在旁边的箱体内中放入发电机,并靠近冷却器,即可使用几乎无任何限制的廉价电能。(嘿,您甚至还可以使用生态柴油发电机发电。)

此外,如果电价或工作量要求发生变化,您要移动您的集装箱的位置 — 好消息,世界上的运输设施随时听候您的差遣。火车、卡车、轮船,甚至是重型直升机。您可以把它们移到远离陆地的石油钻控平台上, 重灾区, 无基础设施的偏远地区, 或最需要它们的任何地方。

最后,在我所参观的大多数数据中心,我看到地板砖数远远多于计算机数。为什么呢?因为早在操作人员充满数据中心之前,他们就已用完了电能容量 — 由于机架之间离得很远,导致他们浪费了大量的、非常昂贵的办公空间。在容器中,我们采用的做法恰好相反 — 凭借充足的电源和冷却能力,我们把系统的密度提升了数个级别,真正做到了空间的精打细算。而且,它可以在任何地方运行,如地下室、车库或房顶上等。这些地方只有设备, 没有人。

我们进展顺利,再加上与客户进行的充分沟通,我们知道我们有望成功,这就是为什么我们要揭开尚处于试验阶段的黑箱的面纱, 将这一计划公布于众的原因。我们已完成了大量的琐碎工作,同时致力于将集装箱的安全系统集成到企业级安全系统中。您可以通过 GPS 确定它所在的地方(如果您喜欢,还可以通过 Google 地图确定它们的位置。传感器知道容器是否已被打开或是否已被移动。我们甚至还做了基本的落地试验(一次偶然的落地),以应对运输过程中的危险(内部机架可以应付 8g 的撞击!)。此外,我们还开发了伪装选件(如果您确实不想在客户设备上显示一个大大的 Sun 徽标,以暗示“偷我吧,我有充足的内存!”)。

我们公开的每个客户都有这样那样的顾虑或难题。在我的意识中,没有克服不了的困难。然而,我们显然不可能拥有全部的答案,这也是我们与重要合作伙伴和集成商密切合作的原因(一个客户希望容器在遭到破坏时自行爆炸 — 嗯... 绝对可行,但不是 Sun 应做的事情)。

作为全球顶级企业,我们深知不存在能治百病的灵丹妙药。

但从上面的示例中可以看出,或许存在一个适用于所有网络运算的黑箱

规格和详细资料即将推出 - 正在开发中,这里有几幅非常棒的图片和使用方案(我特别喜欢把它和Java启动的火星车放在一起 — 那是 Greg 出的好主意)。

____________________________________

* 之后还会推出更多。

Share this post  del.icio.us | digg.com | slashdot.org | technorati.com | reddit | facebook | stumbleupon

No Comments

Post a Comment:
Comments are closed for this entry.