云计算 已评论

AWS 吹走了私有云天空中最后一片乌云

2018-12-5 17:08

  【天极网云计算频道】作者:张鑫

  作者简介:张鑫,是世界上最早一批虚拟化开发者,是《系统虚拟化》一书的主要作者。2010 年赴硅谷加入 IaaS 初创公司 Cloud.com,是 CloudStack 核心架构师,负责 Oracle VM, Barematel, Baremetal VPC 等核心功能。之后随 Cloud.com 并购加入软件巨头 Citrix,继续从事 CloudStack 的核心技术研发。2015 年回国创办开源 IaaS 项目——ZStack。

AWS 吹走了私有云天空中最后一片乌云

  长久以来,私有云厂商都被一朵乌云笼罩着:私有云是否是一个伪命题,这个世界是否终将被公有云统治?无论如何振振有词,当 2006 年 3 月 14 日亚马逊向全世界公开其公有云服务 AWS 时,IT 的历史车轮就碾入了公有云纪元,传统 IT 厂商不得不面对 AWS 这个门外的野蛮人。

    关于私有云,AWS CTO Werner Vogels 在 2010 年就做出了他的论断,Vogels 称所谓的私有云不过是个销售话术,是 IT 厂商为了将客户蒙在鼓里设计出来的词汇。Vogels 认为私有云是“false cloud“,其目的是想让客户购买更多硬件来“build your own cloud”。

    虽然“false cloud”和“build your own cloud”本身就存在逻辑矛盾,但这并妨碍 AWS 表明其态度:私有云不过是 IT 厂商造出来自 high 的救命稻草,根本不能称为“云”。过去几年我被多次问到这个问题,问题的核心在于公有云是否终将统治世界。

  只有公有云的世界是什么样子?

  如果全世界的 IT 基础设施被几家公有云垄断,会是什么样子?首先 Intel 会沦为附庸,除了为不断萎缩的 PC 市场生产 CPU 外,其所有服务器芯片只能卖给公有云从而彻底丧失议价权。公有云也会用其它架构的 CPU(例如 ARM)来打压 Intel 的价格,AWS 在此次 re:Invent 2018 年度云大会上就发布了基于 ARM 芯片 Gravtion 的 EC2 实例。

  DELL、HP、Cisco 等硬件公司会倒闭或被公有云收购。所有的计算、存储、网络能力都集中在公有云手中,没人会再买他们的硬件。公有云也不会购买商业硬件,而是自己制造。不用等到未来,现在公有云/互联网巨头已经大量使用白牌硬件,HP 不再做公有云/互联网公司的服务器生意,实在无利可图。

  微软、Oracle 等基础软件公司会消亡(微软可以通过 Azure 重新统治世界)。公有云会用自己的产品取代现有一切基础软件,提供自己的操作系统、数据库以及一切 PaaS。他们已经开始这样做了,并且会越来越成功。

  应用软件商要看公有云脸色过活。如果足够的有利可图,公有云会毫不犹豫的进入你的领域,依靠庞大的技术生态制造出类似的产品并打压市场价格。巨头没有边界,2014 年 AWS 就推出了 WorkSpaces 云桌面产品。

  这样的未来,IT 创新可能会停滞。公有云之间仍有竞争,但 IT 市场实在太大,几家分享数万亿美元的市场很容易让巨头们达成默契的垄断。

  这像是危言耸听,毕竟跟我们熟悉的 IT 世界太不一样。但不要忘记,在几十年前的大型机时代,每个人一台便携移动计算机(手机)更像天方夜谭。而现在都成真了。

  没有 SLA,AWS Outposts 不性感

  “我们能统治世界”,2010 年的 AWS 多半这样认为。仅仅过了 8 年,2018 年的 re:Invent 云大会上 AWS 发布了 Outposts 产品,一款从产品形态和商业模式上都不性感的混合云产品。

  Outposts 基于 AWS 的自有硬件(基于 Nitro 架构的服务器,类似于阿里云的神龙服务器),可以部署在客户自己的数据中心,AWS 负责安装部署并提供后期升级运维等服务,客户可以在自己的数据中心内使用 AWS 公有云上流行的产品(例如 EC2、ECS,后期还会包含 RDS 这样的 PaaS 产品)。

    Outposts 提供 VMWare 兼容以及 AWS 兼容两种模式,客户既可以使用他们熟悉的 VMWare 控制平面,也可以基于 AWS API 编写程序让应用在本地数据中心和 AWS 公有云无缝部署。除了首发使用自有硬件,AWS 表示未来不排除跟 HP、DELL 等厂商合作,让 Outposts 运行在这些厂商的硬件上。

  Outposts 没有发明新东西。产品形态上,Azure Stack 做了同样的事情。按使用付费的租赁模式,国内一些厂商做的更彻底,提供从机架到虚拟机里应用打包的全租赁。跟公有云相比, Outposts 缺少一个核心:超高的 SLA(Service-Level Agreement,服务等级协议,供应商对客户服务的质量承诺,达不到服务质量会有相应的赔偿)。

    从本质上讲,公有云出售的是“资源的使用权+SLA”。传统 IT 厂商其实也提供 SLA,但内容条款跟公有云很不一样。SLA 在上世纪 90 年代末或 2000 年初变得流行,早期的 IT 厂商是以产品保修的方式提供售后服务,随着客户越来越重视业务的在线时间,IT 厂商发现服务质量保证可以成为额外的收入来源,故通过 SLA 跟客户签订如产品故障后限定多少时间内修复或换货的承诺。公有云将业务在线时间相关 SLA 提高到传统 IT 厂商无法达到的高度,源于对 IT 基础设施的控制力,从机房、电、网络、硬件到软件都能控制,故能提供分钟级别的 SLA。

    例如 AWS 的 EC2(虚拟机)、EBS (块存储)SLA 的月度在线时间比例(Monthly Uptime Percentage)是 99.99%,相当于每个月最多有 4 分 23 秒的不可用时间,对 SLA 未达到的情况会做出 10%~30%消费赔偿。IT 厂商做不到这样的 SLA,因为他们的产品只是整个 IT 架构的一部分,有太多第三方因素可能会影响 SLA,硬件故障、机房断电、运维误操作等等。超高的 SLA 对看重业务在线时间的客户极具吸引力。

    互联网公司尤其如此,设想一下微信、支付宝这样的应用因 IT 基础设施故障停用数天会导致什么样的灾难。虽然微信、支付宝能够构造 AWS 类似的基础设施,但大部分对 SLA有高要求的企业是无力自建这样的基础设施的,公有云对他们来说是很好的选择。

  Outposts 无法提供公有云的 SLA。其产品形态让它跟普通 IT 产品一样,只是客户整个 IT 架构中的一部分,有太多因素超出 AWS 掌控,例如客户数据中心遭遇暴风雪而导致大面积断电。即使未来 AWS 为 Outposts 拟定 SLA,其条款也只会类似 IT 厂商的常规条款,例如售后服务响应时间、产品升级或更换硬件导致的服务不可用时间等。

    虽然媒体用很多新兴概念来描述Outposts,但正如8年前Vogels指责传统 IT厂商在任何产品前都加一个“云”字一样,这只是一种“sales pitch”(销售话术)。Outposts 将 AWS 的部分公有云产品本地化固然给客户带来了巨大的价值,但这种价值来源于 AWS 公有云的成功,Azure、阿里云也在做同样的事情。总之,公有云为 IT 带来了巨大的创新,但一旦它的产品失去了 SLA,就不再性感。

  Outposts 是 AWS 对物质世界的妥协

  对于 AWS 推出 Outposts 的动机,中外媒体大多认为是一种妥协,AWS 自己也承认客户想在自己的数据中心获得跟 AWS 公有云一样的功能和体验。妥协这个词含有一种不是创新者乏力而是这些客户不行的意思。AWS 在 TO B 的世界有着苹果在手机领域相同的创新者地位,人们对于颠覆性创新者总有无限期盼,希望他们毫无妥协的改造这个旧世界。但 AWS妥协了,对象并不是手中握有大笔 IT 预算的 CIO,而是我们生存的物质世界。

  尽管 IT 帮助所有的行业提高了效率,这个世界仍有大量的生产活动还没有被 IT 彻底替代。种植粮食的仍然是农业机械、挖矿的还是矿机、钻取石油的依然是钻井,总之除了几万亿美元的 IT 支出外,还有几百万亿美元投入到了其它的生产活动中。回到云计算,未来辅助生产活动的 IT 基础设施是否只有公有云?AWS 给出了否定的答案。这里有复杂的原因,但可以粗略归为:异构 IT 的复杂性、计算/存储能力的本地化以及网络的不可靠。

  异构 IT 的复杂性

  大多数生产系统并非是围绕 IT 设计的,他们比 IT 更早出现,现在被 IT 改造,例如给炼钢设备安装大量的传感器收集数据,给生产线安装机械手臂。这些改造的复杂性制造出异构性 IT。如果世界只有公有云,意味着所有的 IT 都要接入公有云,这不符合公有云的商业模式。

    公有云能快速发展壮大是因为向客户提供标准的 IT 模型(例如 AWS 最早的经典网络以及后来的 VPC)从而实现规模化。当客户的 IT 太过异构不能直接套入公有云 IT 模型中时,面临的选择只有两个:一是期待客户 IT 系统改造以适应公有云;二是提供私有云来适应客户 IT 系统。

    第一条路目前行不通,且不说传统的力量多么强大,单从体量上讲,千亿美元规模的公有云很难要求动辄万亿美元的行业为它改变。只有第二条路可走,提供私有云来适应客户 IT 系统。反对者可能会说 AWS Outposts 输出的仍然是公有云产品,没有特别的改变,这个留到后面分析 Outposts 产品形态时再讲。

  计算/存储能力的本地化和网络不可靠问题

  即使异构 IT 都能接入公有云,仍然面临当前 IT 技术的限制。我们杜撰一个 AI 系统,它能根据炼钢设备传感器数据实时控制炼钢设备。那么传感器数据存储在哪儿?AI 系统又运行在何处(需要依赖的计算能力在哪)?假设钢厂地处偏远,炼钢设备就必须通过网络接入数千公里外的公有云数据中心,将数据传送至 AI 系统并等待分析结果再做下一步操作。这样的 IT 系统难以让人充满信心,因为它运行在不可靠的网络上。

    相对于人类社会的数据总量(据传为 100ZB,约为 10 的 14 次方 GB),目前的网络绝对是一个低带宽、高延时、不可靠系统。要保证上述钢厂网络的带宽和延时,得通过专线连接数千公里外的数据中心,且必须有冗余,否则无法防范施工队的铲车轧断线路导致生产中断。这无疑是巨大的投资。如果把炼钢系统的传感器换成摄像头,要求 AI 系统做出低延时的图像识别,网络建设成本更是不可想象。

    解决的办法是将计算/存储能力本地化,例如在钢厂 500 米内建一个机房,让 AI 系统就近运行,网络的问题也就解决了。对于云计算厂商来说,输出一套私有云/混合云系统到钢厂的机房,比设计一个横跨数千公里接入公有云的系统更为简单和可靠,这是目前 IT 技术的限制。

  生产制造业的例子似乎听起来很遥远,但就在日常办公中公有云也会有 IT 接入的难题。2014 年 3 月 AWS 发布 WorkSpaces 云桌面产品时,我的第一反应是在想 AWS 的云桌面怎么跟办公室里的打印机、扫描仪以及视频会议系统连接起来,因为云桌面的主要场景为日常办公,不可避免的要跟办公室的各种设备对接。后来我在 AWS 官网找到了打印机使用的文档,但同时也在 AWS 论坛上看到了不少打印机无法使用的吐槽。这样的例子有很多,银行的 U 盾、智能投影仪等,总之在公有云接入本地设备还不那么容易。

  假如我们生存在一个虚拟世界,不需要衣食住行只靠信息交换就可以生存(像科幻电影中那样戴一个头盔接入虚拟世界),则公有云完全可以满足生产活动的所有 IT 需求。我说 AWS 是对物质世界妥协,因为目前的公有云只满足现实世界的部分 IT 需求。

    再来看一下苹果和 AWS 的创新,你会发现苹果在发布 IPhone 短短几年内几乎消灭了所有老牌手机厂商,诺基亚、摩托罗拉、黑莓。而 AWS 虽然对传统 IT 厂商打击巨大,但 IBM、HP、DELL、Oracle 仍然坚挺的活着。这是因为 IPhone 除了巨大的创新外,还满足了客户对手机的所有需求,如果 IPhone 不能打电话,诺基亚仍然会是最好的手机厂商。尽管 AWS 跟苹果一样带动了新行业的发展(移动互联网、SaaS 等),获取了巨大的创新红利,但他并没有满足这个世界的所有 IT 需求。

    传统 IT 厂商活了下来,做着 AWS 称为“false cloud”的私有云,现在 AWS Outposts 来了,吹走了私有云天空最后一片乌云,不必再争论私有云/混合云是不是伪命题,是“true cloud”或是“false cloud”。正视物质世界 IT 需求的复杂性,也许未来公有云会满足一切 IT,但不是现在。

  用 VMWare,AWS 又做对了

  Outposts 是 AWS 和 VMWare 合作的产品,客户可以使用他们熟悉的 VMWare 的控制面板,也可以使用 AWS Native 模式,第一代产品主要是 IaaS 功能,提供 EC2、EBS。可以肯定 Outposts 的 IaaS 部分几乎全是 VMWare 贡献的,AWS 也宣称客户可以使用 VMWare NSX、AppDefense、vRealize 等产品。

    从技术角度来说,AWS 要实现 Outposts 有两条路可以走,一是基于 AWS 公有云的代码改造,一是跟 VMWare 这样的厂商合作。AWS 选择第二条路,这是对的。公有云和私有云面对不同的复杂性,公有云更强调规模和性能,用统一的 IT 架构提供资源,对传统 IT 异构性和利旧基本不考虑。私有云则必须面对异构的 IT 形态并兼容利旧各种设备,但规模和性能上不必向公有云看齐。

    Outposts 的目标客户是想在自己数据中心中使用 AWS 产品的企业,他们多为传统 IT 架构,如果通过改造 AWS 公有云代码来满足客户需求,无论难度还是风险都非常大,这意味 AWS 的公有云产品在后续发展中都不得不为私有云考虑,这不仅会拖慢公有云创新的步伐,实际上也难操作。想象一下 AWS 的内核工程师在优化虚拟机热迁移功能时要顾及一款他从来没有听说过的 PCI 设备,因为私有云客户会透传它给虚拟机使用的。采用 VMWare 做 IaaS 则没有这个问题,VMWare 从来就是服务于传统企业客户,20 年来趟坑无数,沉淀出大量传统 IT 需要的功能。

    前面提到 AWS 可以通过部署 Outposts 来适应企业客户的传统 IT 需求,反对者可能认为 Outposts 输出的也是 AWS 公有云产品(例如 EC2、EBS),并没有为异构 IT 做任何适配。是的,AWS 自己没有做,VMWare 帮他做到了。AWS 宣称 Outposts 可以在一台服务器上运行,离开 VMWare 也是无法办到的。要在一台服务器上将 AWS 公有云的控制面和数据面全部塞进去,还要运行客户自身的业务,无异于将一头大象塞进冰箱。

  在商业策略,跟 VMWare 合作也是正确的选择。VMWare 除了自身的产品优势外,最强大的是遍布全世界的销售网络。外媒报道 Outposts 会在 VMWare 销售网络中售卖,这无疑极大的节省了这款产品触达客户的时间。要让一款新产品快速的被市场认可和接受,即使伴着 AWS 的高光也需要花费不少力气。这不仅仅是技术问题,还是销售体系、供应链、售后服务体系的问题。亚马逊本身是互联网公司,更偏向线上售卖,而 VMWare 则擅长线下售卖。

    在这场合作中,怎么看 AWS 都是受益的。VMWare 则祸福难料,一旦开放自己的销售网络让 AWS 触达终端客户,在产品建立起认可度后,很难说 AWS 不会专门成立部门用自己的技术完全取代 VMWare 并建立适合线下的销售系统。此外,AWS 也不仅仅只有 VMWare 一家伙伴,HP、DELL、Cisco 可能正等着欢迎 Outposts 进入他们的销售渠道。

  与 AWS 技术路线相反,Azure Stack 选择用其公有云代码改造能在几台服务器中运行的混合云产品。微软历来有统一 code base 的冲动,在智能手机方面就尝试用 Windows 相同的代码打造适用于 PC 和手机的操作系统,最终结果是从智能手机市场退出。虽然现在不能断定 Azure Stack 这种技术路线是否成功,但它始终会面临同一套代码要服务于两个截然不同市场的问题。内部的技术团队协调也会遭遇挑战,公有云团队强势必然导致 Azure Stack 的很多技术需求得不到及时响应,Azure Stack 团队强势则会拖慢公有云团队创新的步伐,甚至将他们拖入传统 IT 的泥沼中。

  我个人赞同 AWS 的路线,保证产品体验一致性才是核心,这只需要在 Outposts 的数据面/ 控制面的 API 上和公有云兼容即可。至于是一套代码或两套代码并不重要,一是客户不关心,二是公有云和私有云的市场规模都非常巨大,营运两个技术团队服务于不同的市场是值得的。AWS 也提到他们并不打算通过 Outposts 输出所有 AWS 产品,且承认公有云和私有云交付模式不同(Our initial goal is not to re-create all of AWS in Outposts -- they're kind of different delivery models ... but there are some really basic components that we're hearing consistently that are wanted on-premises)。

    这反应出 AWS 对 Outposts 的定位非常明确,在小规模的产品形态中是无法将所有 AWS 产品都交付到客户数据中心的。实际上企业客户也没有能力负担和运维整个 AWS 公有云,大部分企业仅仅需要 AWS 的几个基本功能,这正是 Outposts 出现的目的。当然也有客户需要整个 AWS 公有云,例如正在竞标中的美国国防部百亿美元大单,这时 AWS 自然会将所有产品带到客户数据中心,当然不是用 Outposts。

  公有云的未来:要么统治世界,要么灭亡

  未来,公有云要么统治一切 IT 基础设施,要么消失,到时将不再有云计算这个词汇。这都不依赖于现在 IT 从业者的力量,而是依靠物理学家在基础物理上的重大突破,颠覆现有的计算机体系。公有云接入传统 IT 的几个问题中,只要网络问题解决了,其它都能解决。目前低带宽、高延时、不可靠的网络极大的阻碍了公有云统治世界的步伐,尽管网络性能在不断提升,但这种小步伐提高远远赶不上人类生产数据增长的速度。如果基础物理创造出超级网络,访问不受地域距离限制,达到目前 CPU 访问内存的带宽、延时和可靠性,那么世界只需要公有云。

    我们不再需要本地计算能力,可以将所有的计算、存储集中在几个公有云巨头的数据中心里,然后通过超级网络访问。如果基础物理向着计算/存储能力方面突破,假设未来手机大小的计算机就可以拥有现在 AWS 公有云全部的计算/存储能力,那我们就不再需要云这个概念,计算可以在任何时间地点发生,中心化的基础设施失去存在的理由。

  未来世界的样子还无法预测,但在这个时间,AWS 发布了 Outposts 产品,他终于进入了传统 IT 厂商相同的维度,从降维打击到同维竞争,后十年的云计算领域一定会更加精彩。

转自:天极网云计算频道

#+1你赞过了
人已赞
#
分享

取消

1万人参加的全球顶级大数据峰会 听Splunk公司如何诠释大数据?
#
年末该感谢的人是?华为云12.12卷来一股回馈风
#
效率提升100倍,生命的密码在云中开启
#
进军混合云领域 亚马逊AWS亮出混合云产品Outposts
#

©2018 天极网旗下网站

#