Paul Bell先生戴尔公共事业和大型企业事业部全球总裁
市场调查机构预测:未来18个月整个世界的数据总量会翻倍;到2020年,整个世界的数据总量将会是今天的44倍。数据量激增给企业提供巨大机遇的同时,也带来巨大的挑战。因此,未来数据管理解决方案需要具备两个要素:一是存储成本的增长速度要远远慢于数据量的增长;二是不仅要实现存储,还要进行管理。在关键数据的整个生命周期进行有效管理,以便任何需要的用户可以在任何设备上、在任何时间里,去正确地调用它,这就是我们提倡的智能数据管理(IDM)。智能数据管理的优势,在非结构数据存储领域体现得为明显,而互联网数据爆炸性增长显著的一个领域恰恰是非结构数据。
今天我们所创建的90%的数据都是非结构性数据,如何在对非结构性数据进行存储时实现上面提到的两大目标呢?首先,通过先进的精简配置存储技术,来避免传统存储解决方案要求为应用预留大量额外容量的弊端。在智能数据管理解决方案中我们只需留出必须的使用空间,从而降低存储设备的采购成本。其次,在整个生命周期对数据进行管理,主要是通过自动分层存储模式来实现的。也就是逐一对每一条数据进行分析,了解每一条数据的使用频率。如果使用频率相当高,就采用高速度但高成本的存储方式;如果数据较少被使用,则可以选用成本较低的存储方式。
Brian Bell先生戴尔Compellent销售副总裁
传统的数据管理,是在数据产生后进行存储、归档操作,但数据在各个不同阶段是相互割裂的。而智能数据管理,是流动的数据架构,数据在一个整合的系统架构当中流动。流动数据架构的价值是在提升效率的同时,提升架构应对应用的灵活性。
存储的问题是什么呢?首先是容量的增长。使用传统存储系统时很多用户都有一个共同的体会,就是当还有30%到40%的可用空间时,存储系统就难以适应应用的增长,需要采购新的存储系统。在应用当中有很多数据是不怎么活动的,比如前几天我同事发给我一封邮件,事情处理后我不会再去看这封邮件,但邮件却会一直存放在很昂贵的存储设备中。很多企业用户都会碰到这样的问题:不停采购新的存储设备,让存储系统变得越来越庞大,或者不得不把以前的信息删除。
这样的问题怎么解决呢?采用流动数据架构就是一个有效的方式。流动数据架构的核心,首先是把数据的存储用非常精细的颗粒度进行管理,在颗粒度精细的管理下让数据适应各种各样的需求。其次,对数据的管理是自动的,可以将不经常访问的数据自动移至低速且廉价的存储层。后,是充分利用现有存储设备。比如说一个应用从应用架构来讲需要很大的存储空间,但真正需要存储的数据非常小;因此不一定非要按照长期规划全部采购,而只要购买目前所需的数据物理存储就可以了。
流动数据架构与传统存储架构相比在基础设施层面存在根本性差异,基于此种架构的存储解决方案在统一的存储平台里进行虚拟化。虚拟化后数据不再存储于一些特定的硬盘上,而是存储于速度不同、成本差异巨大的各类硬盘(比如FC硬盘、SAS硬盘等)中,数据可以在异构介质磁盘之间进行移动。有些企业用户会存储多达数十上百个TB的数据,以往他们会把大量的数据分别放在不同的存储系统当中;而基于虚拟化的流动数据架构解决方案是一种可延续的系统,海量数据也可以轻松存储在一起并且很自然地伸展。
如何提升存储虚拟化的费效比呢?从2004年开始使用的自动分层存储技术是核心的一环。以邮件系统为例,每个企业都有大量的邮件信息需要存储,传统的解决方案中这些邮件很可能就存于高成本的FC硬盘或者SSD硬盘里。如果采用自动分层存储技术,邮件系统中常用或者新的邮件就在高层(速度快、成本高),而不怎么常用或者较陈旧的就会在中层或者低层(速度慢、成本低);对于用户来说这样分层后使用起来并没有感觉上的差异,因为所有的数据都是在线的,可访问的。新的、常用的数据在高速的存储级别,不怎么常用的数据会慢慢往下沉、甚至是归档,这样就可以将存储成本减少80%~90%。