云计算被认为是”革命性的计算模型”,它是将用户从桌面推向互联网关键的一步棋,在新旧规则交替的紧要关头,谁赢得了战场,谁就赢得了规则的制定权。因此在这场云计算的较量中不乏互联网巨头,而它们也各有技术特色。其中最典型的要属Google和 Amazon.com.许多老牌IT巨头纷纷加入战团,推出了自己的云计算服务.
Sun公司推出“黑盒子”计划,该计划基于云计算理论建立,目标是把数据中心,从局限在拥挤而闷热的机房里搬到户外,变成一个个可移动的集装箱,企业可以把它移动到各种地方,降低机房的开支。
蓝色巨人IBM也高调参与了进来并推出“Blue Cloud”蓝云计划。该计划的目标是使企业数据中心与互联网运行更为贴近的计算机与软件产品组合. 为企业建立属于自己的云计算模型的数据中心。它的特色是可以使IBM绕开数据从本地转移到互联网过程中的安全问题这一障碍,通过向客户出售云计算方案与终端。
微软也以在线服务战略”Windows Live”为基础,联结起数以亿计的Windows用户,并向他们提供云计算,在线存储是微软迈出的关键一步,比尔盖茨表示:“当你想到存储,就会想到Windows Live。”
|
|
|
|
Google :GFS、MapReduce和BigTable
Google是这场角逐里重要的角色。Google 的目标是整合全球信息,所以它比一般网站更早遭遇了只有分布才能存储的数据。因此Google开发出了特有的GFS (Google File System),MapReduce和BigTable技术。
GSF是Google最核心的平台,相对于其它文件系统GSF具有更强的跨数据中心表现,成千上万的网络节点的伸缩性,能满足上千兆字节大块的数据读写带宽的需求,高效的跨节点操作分发来减少瓶颈,部件错误不再被当作异常,而是将其作为常见的情况加以处理,大部分文件的更新是通过添加新数据完成,而不改变已存在的数据等特性.
正因此用Google File System存储的海量数据分析起来需要的运算量也是惊人的。这就催生了MapReduce 分布式开发平台,通过把海量数据集的常见操作抽象为Map和Reduce两种集合操作,大大简化了程序员编写分布计算程序的难度。
BigTable是Google构建于GFS之上的分布式哈希机制,用来存储结构化数据.它并不是关系数据库,所以也不支持SQL类型查询等操作,但它包含千千兆的内存,支持每秒钟处理百万的读写.而这些正式“云”的基础架构。如今Google将部分“云”计算的知识以开源的姿态分享出来,启动了“代号Google 101”项目,这意味着用户更多可以参与到基于Google“云”系统的编程开发,这被视作推广云计算方式的有利手段。
|
Amazon.com:S3、EC2和 SimpleDB
Amazon.com也是率先加入“云”计算服务的提供商之一,比较典型的”云”计算应用主要包括S3(Amazon Simple Storage Service)、EC2(Amazon Elastic Compute Cloud)以及SimpleDB。
S3提供在线存储空间,依托它独有的分布式存储技术,解决海量数据(特别是非结构化数据的)在线存储问题,同时S3 开放了 Web Services为开发者提供了开发接口,并允许第三方工具例如 S3 Backup , Duplictiy,S3 Solutions等等在Amazon S3上开发。
EC2在S3的基础上更进一步帮助用户提供了在线的计算的能力. EC2是一个基于Xen虚拟机管理程序结构的网络计算计算服务。它允许开发者创建基于Linux的虚机,这种创建过程既可以从零开始也可以使用预先构建好的映像文件。然后,使用Web服务API或该API的脚本封装器,你可以快速部署到任何数目的虚机,几乎可以运行任何程序。
SimpleDB(简单数据库)则针对结构化数据查询的解决方案,目前已经能够提供数据库的一些核心功能。对用户来说,你不再需要针对数据库的复杂的维护工作,.虽然目前SimpleDB 仅仅是针对的增、删、改、查等简单的Web 应用数据库的操作,但对传统的 RDBMS (关系数据库)功能已经是一个挑战。
|
|