10
2013
09

"中国计算机报大数据应用调查报告"分析

 

  “你们的客户中,有多少主动提出要做大数据项目?”记者问。

  “现在不是有多少客户提出需求的问题,而是很多用户都已经实际部署了大数据平台或应用。”一位国内数据库厂商的市场负责人指着该公司新制作的一本案例集告诉记者,“这本案例集中列举的客户都已经采用或已经测试了我们的新型数据库,用来解决大数据应用的问题,包括政府、金融、电力、税务等行业的客户。”

  在此之前,记者也与一位国外的市场分析师进行过沟通,她表示中国的大数据应用只是刚刚开始,远远没有达到普及应用的阶段。数据科学家等人才的缺乏,也是制约大数据应用的重要因素。

  与云计算一样,大数据从诞生那天开始就一直存在争论,体现在概念、技术、实现方式、商业模式等诸多方面。不过可以肯定的一点是,大数据与云计算都已经是不可逆转的趋势。

  大数据是现实需求

  为了进一步了解中国用户对大数据的接受程度以及目前的应用状况,《中国计算机报》利用“第三届计算技术大会”举办之机,选定一部分参会的行业客户进行了一次有关大数据应用情况的问卷调查。本次调查共发放了问卷320份,收回的有效问卷308份。从调查结果看,大部分的用户通过多年的信息化建设积累了大量数据,处理TB级甚至PB级的数据量对他们来说确实是一个难题。但是,对于是否现在就采用大数据的工具,用户基本分成了两派:一派对大数据持积极拥抱的态度,已经开始尝试或有计划采用相关的大数据解决方案;但另一派用户在未来12个月没有上马大数据项目的需求。

  从调查结果看(如图1),58.8%的被调查者表示,其当前的数据量已经达到了TB级,另有16.8%的用户的数据量甚至达到了PB级。将近80%的用户数据量已经达到TB级以上,这从一个角度证明了在过去几年中数据的爆炸性增长是一个事实。

  有人曾经提出过这样的问题:我们每年为企业信息化建设投入了那么多资金,最后我们得到的是什么?当然是数据。以前是集中存放在数据中心里的数据,而现在除了数据中心,还有更多的数据来自于各种各样的移动智能终端以及大量的企业分支机构。这些数据在相当长的时间内是保持“沉默”的,有人说它们是沉睡的宝藏,但也有的人说它们是一种负担。其实在大数据的概念出现前,人们已经开始用“海量”这个词来形容数据,这也是大数据“4V”特征中一个最明显的特征。但是由于技术的限制,人们不可能实时地处理和分析这些数据,用一个高效的存储平台将这些数据保存好已经占用了用户的绝大部分精力,而进一步挖掘数据的价值在以前是可遇而不可求的。

  除了数据量大这个难题以外,数据类型越来越复杂也是用户以前无法很好地处理和加工数据的一个原因。调查显示(如图2),60.5%的用户反映,其现有的数据是结构化与非结构化数据兼而有之。以前,大家习惯了用数据库来处理结构化的数据,而非结构化数据的快速增长让用户在选择新型存储和分析工具时捉襟见肘。从技术的角度看,使用一个能够同时处理结构化和非结化数据的统一存储和分析平台可以一劳永逸。

  现在一提到大数据,很多人首先想到的就是那些分析软件和工具。从我们的调查结果看,79%的用户表示更关心分析软件和工具,这也证明了这一点。不过,61.3%的用户表示会更关注存储架构,还有37.8%的用户表示会在计算平台上下更多功夫。计算、存储与分析对于大数据来说是密不可分的三个重要组成部分。

  其实,就像经济基础与上层建筑一样,分析软件好比是上层建筑,存储则是经济基础,如果没有一个坚实稳固而且高效安全的存储平台,就不可能将真实、准确的数据提供给大数据分析工具进行再加工和处理。从厂商提供的大数据解决方案来看,大多数走的还是融合的道路,就是将存储平台与大数据分析工具进行整合,为用户提供一个整合的甚至是一体化的大数据解决方案,比如华为近期就与国内数据库厂商共同推出了大数据一体机产品,包括惠普、Oracle等在内的许多国外厂商也早就发布了大数据一体机。

 

« 上一篇下一篇 »

相关文章:

评论列表:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。