登录站点

用户名

密码

企业存储向超融合系统演变进化的3个瞬间

已有 903 次阅读  2016-05-21 17:18   标签交易系统  吞吐量  增长率  带宽  电子 

  企业存储向超融合系统演变进化的3个瞬间

  摘要:前的IT应用中,有一“小”一“大”是几乎所有人关注的焦点。“小”是前端的移动,虽然设备的尺寸在逐渐变大(如不久前推出的iPhone6Plus),总的来说还是比PC/Mac小很多,关键是操作习惯不同,强调简洁和随时随地使用;“大”是后端的大数据,不仅仅是数据大、多样性,更重要的是追求数据的全集而非子集,特别是从历史数据中发掘价值。

  有厂商将为传统应用设计的平台称为记录交易系统(systemsofrecord),为新一代应用设计的平台称为互动参与系统(systemofengagement)。划分不是很严谨,兼具二者特性的新平台亦非鲜见。

  不过,每一笔交易都会产生交易记录,这些在传统应用中已经成为历史的数据,可以被新一代应用拿来做离线分析,供定向广告、精准营销等应用。日积月累下来,互动参与系统的数据增长率显然更高,数据吞吐量也非记录交易系统可比,即要求大容量、高带宽。典型记录交易系统处理的数据量不算大,但对延迟要求较高,类似需求在新一代应用中只多不少:

  一方面,电子商务的蓬勃发展,让人们的交易更方便快捷。以前交易的瓶颈通常在窗口/柜台,排队的是人;现在每个人的手机/平板或PC/Mac都可以成为窗口/柜台,随时随地发起交易,排队转到服务器里进行,峰值时交易请求量提高多少数量级,如淘宝+天猫的双11,以及春节前后的12306mdash;mdash;挤爆点由售票大厅,换成了服务器。

  另一方面,在移动时代,人们更加缺乏耐心,一个页面或App两三秒还没有加载内容,可能就要关掉ldquo;走人rdquo;了;12306的票刷不出来还可以忍,ldquo;光棍节rdquo;的失败则是阿里巴巴无法承受的。大量I/O请求时仍要保证延迟不超标,互联网应用面临的挑战是全方位的。

  简而言之,除了传统的容量和IOPS,新一代应用需要存储(子)系统在带宽和延迟上也有很好的表现,而这是传统存储难以满足的。传统存储的局限存储作为一个独立的行业存在,很大程度上得益于80年代初的硬盘驱动器(HDD)小型化浪潮。在此之前,基本上每家主机厂商都有自己的硬盘(驱动器)业务。如今最大的存储公司EMC,和很长时间内作为最大硬盘公司的希捷(Seagate),均创立于1979年,不能完全以巧合来解释。大尺寸硬盘可以提供更大的容量和更高的顺序传输性能,小尺寸硬盘在随机I/O上的表现更好。即使提高转速、缩短寻道时间,单个硬盘的IOPS(I/Opersecond,每秒I/O操作数)也有限(在二三百的量级),要获得更高的IOPS,就必须尽可能多的增加硬盘数量,而服务器内部空间是有限的。

  香港服务器托管介绍,使用专门的存储设备则不受此限制,而且还可以通过SAN(StorageAreaNetwork,存储区域网)被多台服务器共享。与直接连到服务器内部的方案(DAS,DirectAttachedStorage)相比,存储网络增加了延迟,带宽也相对有限。不过,在硬盘时代这都不是大问题:延迟方面,响应速度在毫秒(ms)级的硬盘才是瓶颈;带宽方面,每个交易的I/O块都不大,以4KB计,每个硬盘也就是1MB/s左右的输出,就是有几千个硬盘一起工作,又能有多少呢?闪存技术的成熟,彻底改变了游戏规则。

  英特尔公司非易失性存储器(NVM)解决方案事业部市场总监PeterK.Hazen曾经给过一个非常直观的比喻:从旧金山飞到北京需要大约11个小时,如果说这是硬盘的速度,那么,换成基于闪存的固态盘(SSD,Solid-StateDrive),只需要1分钟。延迟和IOPS是闪存的强项,别说600多倍,千倍的理论指标都有。而从实际应用来看,SSD在硬盘的百倍之上,通常是可以保证的。当SSD的访问延迟(latency)可以低至几十微秒(mu;s),通过存储网络访问的延迟就不能再忽略不计了;当单个SSD随机I/O访问的输出都能填满一条8Gb/sFC(8GFC)主机通道,主机和存储之间的带宽也可能成为瓶颈了。特别是,当几个SSD就能满足一台服务器对I/O能力的需求时,用户为什么还需要外接磁盘阵列呢?除了容量hellip;作为存储行业的领头羊,EMC很早就意识到了变革的来临。EMC不仅在存储厂商中率先拥抱SSD,还给出了上述问题的解决之道:要么让存储靠近计算,要么让计算靠近存储。第一条好实现mdash;mdash;把存储重新塞回服务器里去(并不是EMC表达的原意)就行了。

  第二条呢?Oracle给出了一个范例。Exadata的早期启示2008年上半年,EMC在其高端存储SymmetrixDMX-4里引入了SSD;下半年,Oracle联合惠普推出了数据库一体机Exadata的ldquo;前身rdquo;。说是前身,一则Exadata只是存储服务器的名字,而一个整机柜最多有8个数据库节点和14个Exadata存储服务器组成,全都是HP基于英特尔至强(Xeon)CPU的服务器,通过高速InfiniBand(IB)互连;二则定位为数据仓库设备,不适于OLTP应用。道理很简单,数据仓库系统中以英特尔为代表的x86处理器是主流,更关键的是OLAP应用以批量传输为主,只要不频繁的随机访问,硬盘的吞吐量并不算差。

  如果是OLTP应用,14个存储服务器的100多个硬盘不够用,20多个至强CPU又显浪费mdash;mdash;因为要的就是IOPS。然而,Oracle之所以用存储服务器,要的就是里面的CPU,以实现让计算靠近存储的目标,为网络和数据库服务器减负。计算靠近存储的一个典型好处就是,在靠近数据的地方处理,直接返回结果,而不是传输大量的原始数据到服务器去处理,这在原始数据集很大,而处理结果很小的情况下效果尤为明显,可以避免大量网络传输的开销。虽然Exadata采用高速的InfiniBand,但首要是利用其低延迟的特性,再高的带宽,传输大量数据也需要耗费时间啊。

  Exadata不同于一般的OracleRAC,很重要的一点就在于其内置智能扫描(SmartScan)处理技术,将一些简单的查询工作卸载到存储服务器,ldquo;通过把扫描处理从数据库中剥离,减少了数据库服务器的CPU负担,同时极大降低了无效的信息传输mdash;mdash;仅仅传输需要的有价值的信息rdquo;。理论上从数TB的表中返回几MB的数据到数据库服务器,意味着多大的节省hellip;总之,可以明显提高OLAP应用的效率。

  2009年初,Oracle收购了Sun,半年后推出ldquo;根正苗红rdquo;的Exadata。之所以这么说,一是Exadata正式成为整个一体机(融合系统)的名称,二是服务器全都换成自家的SunFirex86服务器mdash;mdash;都基于英特尔至强,能有多大差别?所以,真正重要的变化是,由于在存储服务器中引入了PCIe闪存卡作为SmartFlashCache,极大地提高了I/O性能,使Exadata也能胜任OLTP应用,而不仅仅是一款数据仓库设备。

  从2009年的SunOracleDatabaseMachine(V2)加入闪存开始,Exadata就不再局限于数据仓库

分享 举报