云计算 已评论

如果云知道 华为云成长的几个故事

2017-12-26 16:17    嘉文

  【天极网云计算频道】差不多是20年前了,那时候,学生时代的我有了人生第一个Walkman,用攒了一星期的零花钱买了正版的《如果云知道》专辑。彼时,一个安静的午后、很高很蓝的天空、稀稀点点的白云、灼热的阳光...像极了那张专辑的封面,而许茹芸特有的“芸式唱腔”也打动了当时很多的少男少女。一想起这首歌,就回忆起20年前那个孤单又灿烂的自己。

如果云知道  华为云成长的几个故事

  然而,今天想谈的不是这个“云”,而是我们科技圈儿里常常提到的那朵“云”——云计算。

  就像《如果云知道》这张专辑横扫了当时的亚洲唱片界一样,谁曾想到,10年前大家以为是概念炒作的云计算,会引发一场旷日持久的大革命,席卷着各行各业。

  不信?从生活的种种轨迹也能追寻得到:比如,旅行的时候手机拍的照片直接传到iCloud备份,很多小区里的洗衣店改成云洗衣了;现在的90后开始流行云养猫了......就像水电是我们生活中的必需品,云计算平台成了互联网的基础设施,是企业数字化的必经之路。

如果云知道  华为云成长的几个故事

  代号为“Y”

  07、08年,我刚刚从事媒体工作,看到“云计算”这个词的搜索指数不断攀升,而很多资料都是来自于国外的网站。在平行的宇宙中,一些人和云计算也开始产生了交集:

  小王,目前主要负责华为云计算服务产品管理和规划工作。2008年,她刚加入华为公司的时候,就被分配到了一个代号为“Y”的项目组,后来才知道,“Y”原来是代表云计算的首字母,也是从那个时候起,小王跟云计算开始结缘了,一路走到现在,一晃就是近10个年头。虽然不能说最早,但至少在国内,算是较早一批接触云计算的人。

  类似像小王这样早期结缘云计算的在华为还有很多:华为云硬件首席架构师老余在20年前加入了华为,那时候主要做华为传统的通讯产品的主控系统,是在交换机、路由器里面核心、处理能力最强的环节,后来开始做网络处理器,到了2007年、2008年开始进入数据中心市场,为国内的互联网客户提供定制化的服务器,2012年是一个转折点,那时候老余的团队发现,很多标准的芯片,并不能完全满足云计算等业务的要求。他便由此开始负责数据中心领域的芯片开发工作。这几年间,他参与的数据中心芯片发货数量已达到了190万片。再后来,这些工作现在都已经放到了华为的云(数据中心)里面。

  最重要的往往是你感知不到的

  云通常可以理解成为,将IT资源整合起来,通过分布式的方式向用户提供按需服务的一种商业模式创新。对于用户来说,底层依托的硬件平台是看不到摸不着的,但它又是非常重要的载体。像自动驾驶、智慧交通、智慧制造、AR、VR等越来越多的新兴应用,对于背后的计算能力都提出了非常高的要求。另一方面,在企业应用上云以后,对背后的IT系统要求更高,表现在可靠性、安全性、极致性能的要求。

  困难和挑战总是如影随形,不得不面对一个现实:摩尔定律变缓了,CPU单核能力提升速度放缓,虽然整个业界还在努力,但已经很难避免;放缓还体现在CPU周边的部件,比如内存,如果仔细观察,会发现内存技术、工艺的巨大革新已经停止。所以,在单个部件上的性能提升这条路走不通的话,就需要考虑新的方法,让云计算数据中心的摩尔定律能够延续下去,那么,多层次的部件系统结合在一起,通过重新思考重新组合,能否发生“化学”的变化,带来更强的算力?

  据了解,和目前主流的公有云上定制化硬件的做法不同,华为云另辟蹊径把“减法”变成“加法”,也就是在整个基础设施上的多个方向做增强,这个“新发明”被称为“业务驱动的基础设施(SDI)”。据老余介绍,这个架构在CPU的能力上和合作伙伴开发定制化CPU,面向网络、SSD以及整个系统层的企业关键应用大型系统,或者新兴的多种人工智能、图像处理等应用异构系统。“我们的一个理念,是让计算的Workload跑在最合适的硬件上,例如适合于通用处理器运算,就让它跑在通用处理器上,适合于网络处理,会准备专门为网络优化的硬件,这些部件加在一起,形成相比于原来的更强大的计算力,来保证多样化的应用能够在华为云上得到最好的体验。“

  老余的团队花了五六年的时间打造的SDI平台,目前在华为云已经是第三代产品。以前有可能一个处理器大概三分之一左右的资源是被一些基础能力消耗掉了,采用了SDI以后,把这些能力全部转移到一个专为存储和网络所设计的芯片上,这样以来,宝贵的X86 CPU资源能百分之百的释放出来给用户使用。CPU是公有云里最重要的一个环节,目前,华为和英特尔、英伟达紧密合作,针对公有云专门定制了多款CPU,去满足现在公有云客户的需要。

  我们了解,衡量云尤其是公有云,计算、网络、存储三个方面的能力缺一不可。在网络方面,华为的30年经验自然不用多说,他们开发了一个专门针对公有云的智能网卡,一个4×25G的专用网卡,可以提供1500万包/秒转发能力,可以称霸业界,成为公有云上最快的网卡。在存储上,据老余回忆,早在2005年,他们和国内非常著名的互联网公司一起去找寻,针对在做搜索处理上的一些业务瓶颈,引入了SSD的技术,现在经历多次迭代,已经是第六代产品了。

  他把平台能力打造的历程称华为云的“硬件淬炼之旅”。

  一个云上“头等舱”的故事

  有着16年资深经验的老罗,目前作为架构师负责华为云IaaS的虚拟化计算和异构计算相关的技术和架构设计工作。他讲了他第一次坐飞机头等舱的体会:一是独立的专属空间,二是空姐的周到服务,三是有一些定制的套餐可以选择。

  那么,我们再切回到云计算“频道”上,是否也有一种云上的“头等舱”呢?企业用户是否需要云上头等舱?

  实际上,目前大多数公有云基本上都在走“经济舱”的模式,就是做大资源池,降低成本从而提高性价比。成本降低的同时带来了一个潜在的问题,以计算为例,云上承载计算主要的是虚拟化技术,其中一个很大的风险,就是虚拟机逃逸。在一次黑客大赛,中国黑客唐青昊仅用20秒的时间,攻破了VMware虚拟机,获得了系统权限,向世界警示虚拟化漏洞的风险。如果是共享的资源池,就很可怕了,就可以通过一些手段去窃听到或者偷窥到其他虚拟机的数据,如果说再进一步拿到主机的越狱权限,就可以访问主机的存储资源,甚至可以注入程序,影响云上用户的根本安全。如果说把计算和存储都放在一个专属的空间,就像在头等舱里面一样,即使发生了逃逸事件,对用户安全也不会产生大的影响。此外,在云上,QoS配置都是相对比较固定的,VIP客户如果需要定制这些配置,也可以像头等舱一样,拿出一个“菜单”,给用户提供更多的选择性。

  云上的“头等舱”的落地产品被称为华为云专属云DeC。据老罗介绍,DeC的主要特点体现在:一,算力专属。即所有的算力都在一个专属区里,以不同等级的专属硬件来承载,在上面进一步呈现专属的ECS、BMS的服务,在专属区里充分保证计算的安全性和存储的安全性。二、数据专属。包括专属分布式存储和专属的企业存储,其中,专属的企业存储基于华为的企业阵列存储,采用FC的连接方式,对于OLTP低延迟的场景非常有帮助。三、专属服务。使用了专属云就被默认为华为云的VIP客户,可以享受到专门的高级咨询服务和高级的运维服务。

  他回忆起一次专属云的实战经历:某大型国企的ERP系统,部署在线下的时候,每次生成报表需要几天的时间,后来把OLAP系统和OLTP系统从线上放在华为云的专属云上,把OLAP系统用华为云BMS来承载,同时把OLTP系统放到了华为云的KunLun服务器上,“KunLun服务器+BMS+DEC”帮助客户财务报表的生成从数天降为了数个小时。

  基因想对你说

  很多人不会想到,喝牛奶会拉肚子是基因的一种表达,是rs4988235、rs182549两个乳糖代谢突变导致的乳糖不耐。

如果云知道  华为云成长的几个故事

  2005年加入华为的老任,是KVM社区最早的贡献者之一,目前是华为云HPC解决方案的架构师。说起HPC,就会联想到它造福的一个领域--基因测序。老任介绍说,第一代基因测序技术中70%的费用在测序步骤上,然而随着测序技术的发展,测序难度和花费会不断降低,基于HPC基因数据分析会变成最大的瓶颈。华为云推出的FPGA云主机已经将测序的时间缩短到了原来的十分之一,同时大大降低了测序的成本和计算的能耗。现在流行的是第二代基因测序技术,已经从临床实验室走进生活中。测一个全基因组费用大概一千美元,区域基因测序的只需要几百人民币。测序的速度和成本大大降低,这个功劳得靠HPC。

  为什么呢?基于HPC的MPI并行计算,原来是一个测序文件,而把任务分发到多台节点进行结算,把数据拆分成很多小块再集合成一块,就降低了成本。基因测序行业提出了“一次测序”的口号,一次测序产生的原始数据量大概100GB,基因公司将这些数据存到公有云上,人们通过手机等终端就可以查询得到。

  不只基因测序,HPC驱动了很多传统行业突破瓶颈,而据老任介绍,华为云HPC主要解决了“三快一安全”--运算快、发放快、服务快,与线下交付HPC相比,云HPC的优势还体现在,容易达到需求和资源的平衡,并且确保了客户数据的绝对安全。在高性能计算场景中,华为云第三代高性能计算型实例H3,搭载华为云优化的Elastic vSwitch,网络转发性能高达500万PPS,支持AVX 512,HPC场景性能相比上一代提高20%以上。

  写在最后

  无数个凌晨4点的黎明,无数个被露珠打湿的草地,无数盏在夜色中透着光明的路灯,见证了华为云技术团队的努力和执着。如果云知道?云是知道的,这些努力换来的是公有云市场快速的成长:仅用了半年的时间完成了华为云整个中国区域的布局;在2017年上半年就同时完成了德国、法国以及拉美区域的公有云的布局,初步形成了整个华为云的全球一张网。

  在“硬专快稳”四个方面,从“芯”打造服务器,实现了数据中心层面的摩尔定律,为客户提供稳定、可靠、性能好的云“底座”;专属云解决方案为企业客户带来了云上“头等舱”的体验;HPC解决方案提供了且快且安全的超算能力。

  就像是我们总要跟20年前的青葱时代挥别一样,曾经那个崇尚集中式的时代也已经不再。希望积累深厚、匠心打造的华为云能够遇见最好的你。

#+1你赞过了
人已赞
#
分享

取消

效率提升100倍,生命的密码在云中开启
#
进军混合云领域 亚马逊AWS亮出混合云产品Outposts
#
直击悠络客腾讯云战略合作发布会 共推智慧零售解决方案
#
AWS EC2添新功能 用户可使用实例预测性伸缩
#

©2018 天极网旗下网站

#