大数据量解决方案范文

时间:2023-03-15 14:56:11

引言:寻求写作上的突破?我们特意为您精选了12篇大数据量解决方案范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。

大数据量解决方案

篇1

“一张CT扫描图像,就含有约150MB的数据;一个基因组序列文件大小约为750MB;标准的病理图的数据量接近5GB。如果将这些数据量乘以人口数量和平均寿命的话,仅一个社区医院累积的数据量,就可达数TB甚至数PB之多,而且其中还富含图像、视频等非结构化数据,更别说规模更大的医疗机构,甚至是地区医疗主管部门汇集的数据集了。”嘉和美康副总经理范可方摆出的数据充分说明原有行业解决方案急需针对大数据做出调整和升级,以满足医疗行业对数据处理的需求。

从建立大数据存储、管理和查询平台入手,嘉和美康不断优化应用软件和解决方案,以帮助医疗单位跨过大数据这道门槛。“大数据在医疗行业的前景和收益是嘉和美康最根本的驱动力,作为医疗行业信息系统的开发者和建设者,嘉和美康必须在产品上、技术上、应用上迈上一个大的台阶。”试想,小到辅助临床医生做出更为科学和准确的诊断和用药决策或帮助医院根据患者潜在需求开发全新个性化服务及自动服务,大到帮助研究机构实现突破性的医疗方法和药物革新或支持地区甚至全国医疗行业主管部门优化医疗资源及服务配置,这些美好规划实现的前提即是大数据好好为医疗行业所用。

“嘉和美康在电子病历的基础上,推出了新一代的临床数据中心系统――基于CDR的临床信息系统。” 范可方介绍,这个系统是面向临床的深度应用,基于CDR平台借助大数据处理技术推出的新一代产品。

携手英特尔

篇2

中桥咨询的一份大数据调查报告显示,大部分中国用户还处于“系统整合”阶段,需要对来自企业内外部的大量数据进行收集和整理。

“为什么现在用户对大数据解决方案求贤若渴?”高国辉自问自答,“因为传统的技术和解决方案已经无法解决用户当前遇到的诸多应用难题,比如实时交易数据的处理和分析等。金融行业提出‘小核心、大’,电信运营商积极构建双活的数据中心都是从各自的实际需求出发,以应对大数据带来的新挑战。美国的某电信运营商就采用戴尔的SharePlex技术构建了双活的数据中心。”

其实,无论企业的数据量有多大,数据是结构化还是非结构化,戴尔都可以提供具有针对性的解决方案。Spansion是一家知名的制造企业,它希望通过升级现有的数据库来更好地支持其关键统计流程,从而达到提升业绩的目标。为此,它采用了戴尔的SharePlex技术对原有的Oracle数据库进行升级,不仅安全地完成了数据库的迁移,而且节省了大量资金。

“诸如此类的例子还有许多。”高国辉介绍说,“不同的用户,在大数据方面的需求不同,而且对价格的敏感度不同,这就决定了用户在选择大数据解决方案时有其‘个性化’的需求。比如,许多互联网企业十分热衷采用基于Hadoop的解决方案,就是考虑到经济性的问题。戴尔的优势就在于,可以为不同的用户提供适合其需求的大数据解决方案。”

戴尔软件事业部已成为戴尔企业级端到端解决方案的核心组成部分。具体到软件解决方案本身,戴尔也强调端到端,比如戴尔软件可以提供从移动办公管理到信息数据管理再到数据中心和云计算的全面软件解决方案。其中,信息数据管理软件就与大数据直接相关,它包括数据库管理、应用系统及数据集成,以及大数据分析等产品。

全面的软件解决方案

篇3

全面解决方案才能奏效

当前,越来越多企业将大数据的分析结果作为其判断未来发展的依据。同时,传统的商业预测逻辑正日益被新的大数据预测所取代。但是,我们要谨慎管理大家对大数据的期望值,因为海量数据只有在得到有效治理的前提下才能进一步发展其业务价值。

最广为人知的大数据定义是Gartner给出的大数据的3V特性:巨大的数据量(Volume)、数据的快速处理(Velocity)、多变的数据结构和类型(Variety)。根据这一定义,大家首先想到的是IT系统中一直难以处理却又不容忽视的非结构化数据。也就是说,大数据不仅要处理好交易型数据的分析,还把社交媒体、电子商务、决策支持等信息都融入进来。现在,分布式处理技术Hadoop和NoSQL已经能对非结构化数据进行存储、处理、分析和挖掘,但未能为满足客户的大数据需求提供一个全面的解决方案。

事实上,普遍意义上的大数据范围更加广泛,任何涉及海量数据及多数据源的复杂计算,均属大数据范畴,而不仅局限于非结构化数据。因此,诸如电信运营商所拥有的巨量用户的各类详细数据、手机开关机信息、手机在网注册信息、手机通话计费信息、手机上网详细日志信息、用户漫游信息、用户订阅服务信息和用户基础服务信息等,均可划归为大数据。

与几年前兴起的云计算相比,大数据实现其业务价值所要走的路或许更为长远。但是企业用户已经迫不及待,越来越多企业高层倾向于将大数据分析结果作为其商业决策的重要依据。在这种背景下,我们必须找到一种全面的大数据解决方案,不仅要解决非结构化数据的处理问题,还要将功能扩展到海量数据的存储、大数据的分布式采集和交换、海量数据的实时快速访问、统计分析与挖掘和商务智能分析等。

典型的大数据解决方案应该是具有多种能力的平台化解决方案,这些能力包括结构化数据的存储、计算、分析和挖掘,多结构化数据的存储、加工和处理,以及大数据的商务智能分析。这种解决方案应具有以下四个特性:软硬集成化的大数据处理、全结构化数据处理的能力、大规模内存计算的能力、超高网络速度的访问。

软硬件集成是必然选择

我们认为,大数据解决方案的关键在于如何处理好大规模数据计算。过去,传统的前端数据库服务器、后端大存储的架构难以有效存储大规模数据并保持高性能数据处理。这时候,我们让软件和硬件更有效地集成起来进行更紧密的协作。也就是说,我们需要软硬一体化的专门设备来应对大数据的挑战。

篇4

2012年,在美国旧金山召开的秋季英特尔信息技术峰会(IDF)上,柏安娜接受了本刊的独家专访,这是她近期首次对中国媒体就英特尔的大数据战略进行详细的解读。她透露了自己的目标:五年内英特尔数据中心的相关业务将会实现倍增,2016年时达到200亿美元,而这一高速增长的乐观期望,正是来自于云服务商提供的大数据业务。

移动设备爆炸带来变革机会

云计算会吸引更多人上网,接入更多设备,从而产生更多海量数据——这个即将出现的循环将带来巨大的机会。

《数字商业时代》:云计算的出现让全世界所有信息和通信技术覆盖的地方,都试图通过技术来生成一个数字化的投影。这种更彻底的数字化浪潮将为商业和经济带来怎样的影响?

柏安娜:云计算从提出到取得飞速发展是最近五年的事,它在面向消费者和企业的相关服务及应用的数量都在快速增加。云计算模式很有吸引力,它可以在低运营和低拥有成本的基础上进行大规模的扩展,而且它具有按需提供服务的能力,因为它的基础设施是共享的。可以看到,中国和美国的云建设都在飞速发展。这就像一个虚拟的循环,随着越来越多的人上网——目前有23亿人上网,他们会购买更多设备。这些设备与数据中心连接,需要建设云基础设施来支持这些设备。这会推动新服务和解决方案的创新,从而吸引更多人上网。这些推动了云计算的发展,并推动相关服务的发展。在这个令人惊叹的循环中,随之带来的是我们从未想过的新式服务和解决方案。就像你所说的,我们现在真正处于数字创新时代,新服务在线上不停地涌现,因为我们能够在云中进行新功能的快速部署。

《数字商业时代》:与这种数字化浪潮最为匹配的技术,似乎就是大数据分析技术,现在和未来一段时间内,有哪些因大数据技术而生的商业模式值得人们关注?

柏安娜:一直有很多企业数据,但从来没有分析和利用这些数据的高效方式。这种情况下,数据就没有发挥作用。现在围绕大数据有很多行业创新。一个是计算成本继续增加,例如横向扩展存储等。一个重大成本是这些数据的存储成本,传统存储方式太过昂贵。因此,你看到存储创新,基于英特尔平台的横向扩展存储。然后是围绕开源数据分析解决方案的大量创新。Hadoop是个非常好的开源框架,让你能够提取所有这些数据,高效地存储并实时分析。计算存储平台和分析解决方案相结合,让企业和消费者都能看到重大数据。有个很好的例子,中国政府要求电信运营商为消费者提供90天的交易记录,让消费者能够上网了解过去90天的所有消费情况,这是一个重大的大数据问题,涉及的数据量也非常巨大。我们与电信运营商合作,利用Hadoop向他们提供一个稳定、优化的Hadoop平台以分析和报告这些信息,从而满足政府的监管要求。我们目前是Hadoop框架的分销商,我们现在所做的是以前从未做过的事情。

数据就是价值

大数据时代,IT将不再是成本,而成为价值。

《数字商业时代》:有迹象表明在云计算与数据的时代它将开始主导企业业务的发展甚至是变成一个核心业务,简而言之就是变成企业的盈利中心,你对这一趋势有何看法?

篇5

英特尔亚太研发有限公司总经理、软件与服务事业部中国区总经理何京翔认为,大数据本身其实是信息革命的一个新引领。在未来几年随着物联网的发展,可能会有2100亿个RFID或者集群,在我们的环境之中,如果未来的移动互联、物联网如果变成现实,我们的生活会被传感器、会被数据采集装置所拥抱,这时候数据量将更大。这些数据量仅仅是数据,并不能解决问题,它要从数据变成信息、变成智能、变成商业价值,这才能够体现出真正的大数据的价值。

VMware全球高级副总裁范承工认为,在过去三年当中,看到大数据的发展从无到有,市场上大家说大数据的趋势,三年前可能还没有人说这个词,现在已经如火如荼。然而,现在除了数据本身发生了改变,云计算也使数据变得更加分散,在这样的趋势下,传统数据库对于海量数据的需求、快的需求、开发者数据多样化的需求难以满足,使各种各样的解决方案大行其道。

EMC的大数据和存储专家、EMC资深产品经理李君鹏认为,大数据本身就是一个问题集,云技术是目前解决大数据问题集最重要有效的手段。云计算提供了基础架构平台,大数据应用在这个平台上运行。目前公认处理大数据集最有效手段的分布式处理,也是云计算思想的一种具体体现。

对于大数据给云计算带来的影响,Teradata技术总监StephenBrobst表示,公有云架构对数据仓库没有影响,因为企业的CIO不会无缘无故把财务数据或者客户数据放到云上,那样很危险。然而,私有云架构确实有影响:第一,通过私有云,可以巩固数据集市,减少利用率不足的问题;第二,可以通过灵敏的方式将数据集成,实现业务价值。

篇6

早在一年半之前,昆腾就开始研究大数据的应对之策。如今,昆腾的业务重点之一是积极推动大数据解决方案的落地。大数据带来的挑战主要表现在,由于数据量迅猛增长,用户对存储性能的优化和数据处理提出了更高的要求。另外,由于新的业务数据类型不断涌现,比如基因数据、卫星数据等,用户的存储和数据保护策略也要随之改变,比如存储设备要与应用、数据分析和挖掘等技术更紧密地结合在一起。“存储的前端要与应用相结合,后端则要在分层存储的基础上,为前端应用提供高性能、灵活的平台,便于应用对大数据的访问。”张金华表示。

从行业的角度看,政府、广电、石油等行业的用户很可能成为最早使用大数据工具的用户,而这些行业也正是昆腾切入大数据市场的抓手。

“具体来说,基因数据分析、视频监控数据的归档、高性能计算等应用将成为昆腾大数据业务新的增长点。”张金华表示,“中国的数据备份市场还处于刚刚起步的阶段。昆腾不仅会重视大型企业客户市场,而且会针对中小企业客户提供全面的数据保护解决方案。”

软件硬件化

StorNext是昆腾大数据解决方案的核心。StorNext如今已经出了四个版本,全球部署的StorNext文件系统超过7万套,管理的数据总量超过0.5EB。

以前,StorNext主要是以软件的方式进行销售。如今,随着软硬件一体化解决方案日益盛行,StorNext也走上了软件硬件化的道路。

“客户反映,作为一款软件,StorNext虽然具有强大的功能,但是其配置和使用相对比较复杂,对客户的技术水平要求较高。此外,用户在选择产品时,希望厂商提供一些具有可比性的技术指标,比如性能、容量等,但是StorNext作为一款软件,很难提供这样的指标。”昆腾公司大中华区技术总监王刚表示,“为了满足用户的需求,我们将StorNext软件进行了硬件化,为用户提供软硬件一体化的解决方案。”举例来说,StorNext M330和M660元数据设备就是专为大数据内容处理设计的,可以实现高性能的文件共享。

StorNext软硬件一体化的解决方案集成度更高,部署和使用也更加方便,同时还降低了维护成本。未来,StorNext将采用软件和一体化方案两种销售模式。StorNext不仅可以管理昆腾自己的设备,而且能够管理第三方的存储设备。“一体化解决方案是一条正确的发展道路。”张金华表示,“不仅中小企业可以采用一体化的解决方案,简化系统部署与应用,而且大型企业也可以利用一体化的解决方案构建一个通用的基础平台。”

磁带技术还在进步

篇7

“大数据需求很普遍,比如网页浏览数据就是一种典型的大数据,其中包含大量的用户行为信息,处理起来很不容易。同样,电信企业要进行IP地址溯源等业务分析也需要用到大数据的相关技术,这也是一件费时费力的工作。”精诚运中心暨Etu负责人蒋居裕表示。

大数据处理之所以困难,是因为它有别于传统关系型数据。数据量大(Volume)、速度生成快(Velocity)、数据类型多(Variety)、价值密度低(Value)是大数据的4大特点,即“4V”。尤为值得一提的是,大数据虽然量大,但与关系型数据相比,其同等数据量的经济价值要小得多,如果还像传统数据那样投入就得不偿失。

“大数据并不适合用传统数据处理技术进行存储和分析,因而我们需要一种新的技术,而Hadoop正是这样一种数据处理技术。”Hadoop China发起人、中科院计算所查礼博士表示。据悉,Hadoop是一种开源软件架构,能够自由部署在x86平台上,其独特的分布式和可扩展性都非常适合大数据的处理。这几年Hadoop市场发展迅猛,且出现很多开源版本,如Cloudera公司的Distribution Including Apache Hadoop是其中颇有影响力的一个。

篇8

大数据存储不是一类单独的产品,它有很多实现方式。EMC Isilon存储事业部总经理杨兰江概括说,大数据存储应该具有以下一些特性:海量数据存储能力,可轻松管理PB级乃至数十PB的存储容量;具有全局命名空间,所有应用可以看到统一的文件系统视图;支持标准接口,应用无需修改可直接运行,并提供API接口进行面向对象的管理;读写性能优异,聚合带宽高达数GB乃至数十GB;易于管理维护,无需中断业务即可轻松实现动态扩展;基于开放架构,可以运行于任何开放架构的硬件之上;具有多级数据冗余,支持硬件与软件冗余保护,数据具有高可靠性;采用多级存储备份,可灵活支持SSD、SAS、SATA和磁带库的统一管理。

通过与中国用户的接触,杨兰江认为,当前中国用户最迫切需要了解的是大数据存储有哪些分类,而在大数据应用方面面临的最大障碍就是如何在众多平台中找到适合自己的解决方案。

EMC针对不同的应用需求可以提供不同的解决方案:对于能源、媒体、生命科学、医疗影像、GIS、视频监控、HPC应用、某些归档应用等,EMC会首推以Isilon存储为核心的大数据存储解决方案;对于虚拟化以及具有很多小文件的应用,EMC将首推以VNX、XtremIO为核心的大数据存储解决方案;对于大数据分析一类的应用需求,EMC会综合考虑客户的具体需求,推荐Pivotal、Isilon等一体化的解决方案。在此,具体介绍一下EMC用于大数据的横向扩展NAS解决方案——EMC Isilon,其设计目标是简化对大数据存储基础架构的管理,为大数据提供灵活的可扩展平台,进一步提高大数据存储的效率,降低成本。

EMC Isilon存储解决方案主要包括三部分:EMC Isilon平台节点和加速器,可从单个文件系统进行大数据存储,从而服务于 I/O 密集型应用程序、存储和近线归档;EMC Isilon基础架构软件是一个强大的工具,可帮助用户在大数据环境中保护数据、控制成本并优化存储资源和系统性能;EMC Isilon OneFS操作系统可在集群中跨节点智能地整合文件系统、卷管理器和数据保护功能。

杨兰江表示,企业用户选择EMC Isilon的理由可以归纳为以下几点。第一,简化管理,增强易用性。与传统NAS相比,无论未来存储容量、性能增加到何种程度,EMC Isilon的安装、管理和扩展都会保持其简单性。第二,强大的可扩展性。EMC Isilon可以满足非结构化数据的存储和分析需求,单个文件系统和卷中每个集群的容量为18TB~15PB。第三,更高的处理效率,更低的成本。EMC Isilon在单个共享存储池中的利用率超过80%,而EMC Isilon SmartPools软件可进一步优化资源,提供自动存储分层,保证存储的高性能、经济性。第四,灵活的互操作性。EMC Isilon支持众多行业标准,简化工作流。它还提供了API可以向客户和ISV提供OneFS控制接口,提供Isilon集群的自动化、协调和资源调配能力。

EMC Isilon大数据存储解决方案已经在医疗、制造、高校和科研机构中有了许多成功应用。

方案点评

EMC Isilon是一个强大但简单的横向扩展NAS方案,适用于希望投资数据管理而不是单纯存储的企业。当初,EMC将收购来的分布式数据仓库软件厂商Greenplum的软件与Isilon存储组合成了EMC最早的大数据解决方案。用户既可以分开选择Greenplum软件或Isilon存储,也可以选择由Greenplum软件和Isilon存储组成的一体机解决方案。现在,Greenplum软件虽然已归Pivotal公司,但EMC是Pivotal的经销商与合作伙伴,Greenplum与Isilon存储的组合方案并不会因此受到影响。

HDS UCP:统一平台 应用优化

HDS中国区解决方案与专业服务事业部总监陈戈认为,大数据存储应该是一个解决方案:“大数据解决方案是由基础架构的各部件组成的,包含数据存储、计算和分析,而存储是此架构中的一部分。”

大数据的存储类型与传统的存储类型有一定区别:在大数据存储中,更多的应用是一次写、多次读,读得更多是大数据存储的一个特点,而在传统的数据存储中,读写是随机的,由于每个应用不同,其读写的比例也是随机的;大数据存储需要具有横向的可扩展性,并可支持多种接口、多种数据访问协议,便于不同数据进入这个大数据平台。

谈到中国用户在大数据存储应用中最迫切的需求是什么,陈戈认为,中国用户最迫切的需求是如何逐步实现大数据应用,即用户从现有的模式如何过渡到大数据,如何更好地利用大数据进行经营分析。

大数据的经典定义可以归纳为四个“V”,但企业不可能一步到位实现四个“V”,这需要一个循序渐进的过程。海量的、多种类型的数据是一次性全部载入到大数据中,还是通过现有的平台进行数据初选,再导入到大数据平台中,是两种不同的实现途径。“先通过现有平台进行数据初选,再导入到大数据平台,这种方式更适合于客户逐渐实现大数据,可以缩短用户实现大数据应用的时间。”陈戈表示,“大数据主要是非结构化数据。用户可以使用基于对象数据存储的HCP,利用其独特的元数据采集和智能工具,对非结构化文件数据进行管理,实现智能的自动化,这有助于对数据进行深度分析,帮助客户从单一系统中存储、共享、同步、保护、保存、分析和检索文件数据,减少垃圾数据,进而为大数据分析建立一个良好的基础。”

谈到用户在大数据应用中遇到的主要障碍,陈戈表示,一方面,应用软件本身的智能程度是否能满足行业应用需求,应用软件是否已经成型,大数据人才是否具备等,是让大数据应用落地的关键;另一方面,如何抽取数据,放在大数据平台中进行相应的计算是另一个关键问题。

HDS可为所有数据提供单一、可扩展的虚拟化集成平台。HDS推出了“三步”云战略,从基础架构、内容和信息三个层面帮助客户解决目前所遇到的问题。具体来看,通过“基础架构云”,HDS可以帮助客户进行虚拟化和集成管理,实现数据中心的整合;在第二层的“内容云”当中,HDS可以按需提供内容,更可以不受应用限制地进行数据搜索和集成;在第三层的“信息云”中,针对所有数据类型,HDS在其存储平台中融入了分析功能,使客户可以从数据信息中获取洞察力。

HDS提供的UCP for SAP HANA集成了基于大量数据集的创新和内存分析技术,并提供实时的洞察力,从而使当前的信息驱动型企业可以加快其商业决策的速度。陈戈介绍说,UCP for SAP HANA解决方案结合了HDS刀片服务器技术、企业级存储系统和业内领先的网络组件,在这样一个集成的、高性能的硬件平台上可以快速交付SAP下一代内存计算技术。全球已有超过200家客户在使用HDS和SAP的大数据解决方案。

方案点评

其实,HDS的“三步”云战略也可以看成是其大数据战略。HDS借助以UCP为核心的大数据平台,可以帮助企业用户构建从基础架构到内容归档和搜索,直至信息提取和分析的全面、高效的大数据解决方案。HDS的“信息云”直接与大数据相关。UCP是一个集成了计算、存储与网络的一体化平台,它既可以提供像一体机一样的整合性、简单性,又可以提供灵活的选择,连接第三方的设备组件。HDS还通过与包括SAP在内的众多大数据分析类的合作伙伴合作,针对行业定制优质的大数据解决方案。

HP StoreAll :快速部署 极速搜索

中国惠普有限公司企业集团存储产品部存储架构师张楠向记者表示,大数据存储是一套解决方案,应该能够对大数据的Volume、Velocity、Variety和Value四个方面提供全面的支持。

第一,大数据存储要支持海量级的数据存储,比如具有PB级的存储能力。第二,大数据存储要支持更高的存储速度,支持10Gb甚至更高的网络连接。第三,大数据存储要支持数据的多样性,如图片、文本、视频、音频等。第四,大数据最重要的是价值的体现,而为了实现这一点,存储本身应该具备快速、智能的数据检索能力。“在存储的最底层提供最直接、快捷的数据检索。这一过程简单说就是,将上层的数据挖掘工作下移,充分利用存储强大的处理能力和数据识别能力。”张楠举例说,“比如,在秒级的单位内对数据进行极速的搜索, 从几千万甚至上亿个文件中找到目标数据。”

另外,模糊查询能力也是大数据存储不可缺少的功能。智能的模糊查询将为大数据平台提供更加便捷的存储服务能力,使得存储更像一台智能的高速计算设备。

目前,很多中国用户在存储厂商的引导下,片面追求存储的大容量和高性能,而忽略了大数据存储本身应该提供的其他额外属性。中国用户在实施大数据的过程中经常遇到的障碍有以下两方面:第一,无法将存储与大数据平台进行对接;第二,无法充分利用大数据存储的价值,也很难将其运用到实际的业务中。张楠表示,究其原因,主要在于有些大数据存储产品没有开放的接口协议,或没有针对用户的大数据场景进行特别优化,也没有用户容易接受的易用的管理方式等。

惠普在大数据方面可以提供软硬结合的解决方案。惠普在收购Autonomy公司之后,将其软件与惠普的硬件平台进行了整合, 形成了一套完整的大数据解决方案。张楠介绍说,在存储方面,惠普拥有像StoreAll这样的大数据存储平台。借助HP StoreAll硬件平台,用户除了可以实现海量数据的存储和高速数据访问以外,还能实现高级的数据检索功能,对特殊文件进行快速定位。同时,结合HP Autonomy软件的特性,惠普还引入了模糊查询、智能语义库等概念,可以帮助企业用户通过存储底层为上层业务带来所需的大数据业务价值。

如今,闪存不仅在大数据领域,而且在Tier 1存储市场同样占据着十分重要的地位。对于大数据平台来说,闪存可用来提升存储的存取速度,降低I/O的响应时间等。针对那些I/O压力十分明确的大数据平台, SSD可以发挥其效果, 提升存储的整体性能。但是,SSD并不是万能的。因为大部分的数据都是非结构化的,而非结构化数据对I/O的响应要求远远没有对带宽的需求大,所以,让用户花数倍的价格购买SSD存储在目前来看还是比较困难的。从目前情况看,引入闪存的大数据解决方案还不是很普遍。

方案点评

惠普在大数据方面收购了两个软件公司Vertica与Autonomy,然后将它们的软件与原有的硬件平台进行整合,针对结构化和非结构化的数据都可以提供针对性的解决方案。惠普在将大数据软件与存储硬件结合上也进行了尝试,其中一个成功的例子就是HP StoreAll大数据存储平台。HP StoreAll具有以下特点:横向扩展,最大可以扩展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,实现实时大数据的价值;内置对OpenStack的支持,可快速部署;支持文件和对象类型的数据存储。

NetApp:统一架构 无限扩展

如今,企业若想获得成功,就必须想方设法应对具有前所未有的复杂性、高性能的海量数据,并尽可能地管理这些数据,从中发掘更大的商业价值。

对于国内用户来说,无论企业的规模和数据量大小如何,运用大数据的关键在于,企业是否把大数据作为一个真正的工具,去体现企业的差异化,从而提升竞争力。随着越来越智慧的企业信息化的发展,IT不再是束缚企业发展的瓶颈,而是真正地融入了企业自身的业务中。越来越多的公司将大数据成功地运用于企业的商业模式。例如,在欧美,很多企业已经着手将大量资源投放在大数据领域。反观国内,在金融领域,有为数不少的企业通过大数据的分析工具来分析金融的走势,实现风险管理,进行信用卡的追踪等。此外,像零售、制造、电信等行业也已在尝试利用大数据分析工具为企业营销和决策提供支撑。

无论企业现在是否正在使用大数据工具,企业都应全面地考虑自身未来发展的需求,选择一个厂家的平台与之共同发展,这可以有效避免因数据和应用迁移带来的麻烦。

在大数据方面,NetApp能够帮助企业实现数据管理,应对业务挑战的极限,将以数据为导向的洞察转化为有效行动。若想将数据转化为商机,仅仅提升管理能力是不够的,需要彻底转变数据和业务之间的联系模式。NetApp可以帮助企业用户持续管理数据,迅速把握意料之外的新商机,永久保存所有数据,并在灵活、开放的存储平台之上打造属于企业自己的大数据解决方案。

NetApp提供了可高效处理、分析、管理和访问大规模数据的大数据解决方案。NetApp的解决方案组合可划分为分析、带宽和内容三个主要用例,这被称之为大数据的“ABC”基本要素。

具体来看,分析(Analysis)是指针对极大数据集的高效分析。NetApp分析解决方案就是帮助用户深入了解和利用数字世界,将数据转化为高质量的信息,以及提供关于业务的更深入见解,从而帮助企业做出更好的决策。

带宽(Bandwidth)是指适用于数据密集型工作负载的性能。此类解决方案着重于为速度非常快的工作负载提供更高的性能。高带宽应用包括高性能计算(能以极快的速度执行复杂的分析)、用于监控和任务规划的高性能视频流、媒体和娱乐领域中的视频剪辑和播放。

内容(Content)是指无限的安全数据存储。此类解决方案着重于满足可扩展的安全数据存储需求。内容解决方案必须支持存储的无限扩展能力,以便企业可以根据需要存储任意多的数据,并能在需要时找到所需的数据。

NetApp致力于通过一系列解决方案来提供高性能的运算和大数据的应用。2013年11月,NetApp再次更新了E系列家族产品,推出E2700和E5500。该系列产品采用可轻松扩展的设计,适用于要求99.999%的可靠性且稳定、高性能的工作负载。

用户在采购大数据存储产品时,需要注意以下五个方面的问题:大数据存储必须具有向上扩展与向外扩展的能力;架构必须是针对工作负载进行优化的,具有实时处理能力;具有整合的数据保护功能;保证7×24小时运行不中断,可在线进行容量扩展,实施数据迁移等;可以实现服务的自动化。

方案点评

NetApp的技术优势集中体现在其统一存储平台上,从入门级产品到企业级产品,全部基于同一个体系架构和操作系统,不仅部署和使用方便,而且升级和扩展非常简单。当初,NetApp收购LSI Engenio,其中一个重要的原因就是为了大数据。2013年,NetApp不断更新E系列产品线,推出E2700和E5500等。E5500可以支持高IOPS混合工作负载和数据库、高性能文件系统和带宽密集型流等应用,可确保数据的高可用性、完整性和安全性。

曙光XData:高度集成 贴近行业

关于大数据存储,目前业界没有一个通用的定义。曙光信息产业股份有限公司总裁助理兼存储产品线产品总监惠润海从曙光大数据平台和解决方案角度,概括出大数据存储的主要特征。

首先,大数据存储必须支持全类型数据, 包括结构化、半结构化和非结构数据,实现统一数据支持。

其次,存储性能上,一方面,大数据存储要支持海量数据,并且要在保证数据可靠性的基础之上,实现容量与性能的线性扩展;另一方面,为了实现大数据的价值,批处理和实时处理两种措施都需要高性能的数据访问获取能力。

最后,在系统达到一定规模之后,系统的易用性和可管理性也是不可或缺的。

从应用角度来说,目前中国用户在大数据存储应用中最迫切的需求,是如何真正实现用户数据的价值,如何驱动业务发展,实现决策和运营。“从系统构建层面说,要实现数据高性价比的存储和管理,同时满足数据服务的相关需求。”惠润海表示。

针对用户对大数据存储的需求, 曙光推出了像大数据一体机这样的全类型数据分析型产品,同时还基于该产品构建了基于行业的解决方案,以帮助用户实现大数据落地。

“除此之外, 我们还提供了大数据统一数据中心解决方案, 涵盖了像主攻事物处理的DS900、DS800,以及针对文件存储的Parastor等存储产品。我们基于这些存储产品构建了大数据运营管理平台。”惠润海介绍说,“曙光的优势不仅在于可以提供全面的产品支撑,更重要的是能够提供数据生命周期过程服务支持。目前,我们提供的免费维保期限为5年。”

曙光开发了针对不同行业和应用场景的大数据存储解决方案。以金融行业为例,目前国内四大行的应用系统每年产生的非结构化数据量已达到PB级,结构化数据也以百TB计。面对如此大量的数据,如何存储、管理、利用和盘活它们呢?惠润海认为,只有通过商业智能和高级分析应用解决方案才能将数据的价值最大程度地发挥出来。

针对金融行业用户的需求,曙光开发的XData大数据解决方案利用优化的大数据处理技术,对文件管理、历史数据查询和数据分析类应用等进行深入研究,为数据爆炸式增长带来的海量数据存储及分析应用提供高可靠的解决方案。

曙光金融行业XData大数据解决方案采用曙光自主研发的SN-MPP并行数据库,同时结合大数据处理事实标准Hadoop,并充分考虑了多方面的数据收集,加入ETL工具和连接驱动器,提供了类SQL的接口,还和现有金融业务系统进行对接。

篇9

AI新品,进一步落地多个行业:2017年9月12日,公司了“精准医疗”、“AI+公安大数据”、“乐享智投‘三个行业的解决方案及产品。

(1)精准医疗:

目前还处于辅劣临床诊疗阶段,iMedical8.0P、临床科研大数据分析平台、感染智能监测系统、知识图谱构建系统等实现了辅劣医生优化治疗方案和临床科研的功能;

(2)AI+公安大数据:通过人脸识别、视频检索技术等不公安系统拥有的海量数据库结合,解决了以往案件侦查过程中嫌疑人筛选的问题,大幅提高了筛选速度;

(3)乐享智投:作为一款智能投顼产品,主要向金融客户提品评测、用户画像、投资组合、投资执行、风险监控、收益分析等服务,并提供个性化的解决方案。

本次AI产品的,公司实现AI技术在医疗、安防、金融三个热点行业的落地,有望搭上AI行业高速发展的顺风车,助力公司的进一步发展。

布局AI行业多年,技术成就应用:公司于2013年开始布局人工智能领域,是国内较早投入人工智能领域研发的企业之一,先后不中科院、清华大学、北航、IBM和微软等国内外知名校企合作。经过多年研究,公司基于人像识别、车辆软件识别、目标图像提取不分析等技术,研发出智能人像服务、人像卡口等系统。本次人工智能新品的是对以往产品的进一步改进,是公司多年技术积累的结果,产品系列较为成熟、可靠,用户满意度较高。

业务行业覆盖广,公司发展空间大:公司立足数字化行业多年,服务对象涵盖金融、电力、通讯、交通运输等10余个行业,产品线主要包括行业应用软件、人工智能解决方案、大数据服务。这不仅有利于公司率先占据AI行业的有利位置,更能够使公司在数据量上存在优势。公司能够尽快实现AI产品在多个行业的落地,在AI市场还在高速发展期的今天,占据多个行业就意味着拥有更大市场规模的可能性。

除此之外,公司拥有各个行业的大量数据,能够实现不同行业数据的相互补充,有利于AI系统的自我完善。

投资建议:作为国内IT企业龙头,公司将不断完善人工智能技术,并通过数据积累,在产品线和市场应用上不断拓展,最终实现人工智能+战略。我们公司预测2017年至2019年每股收益分别为0.48、0.53和0.68元,上调评级至买入-A,6个月目标价为13.92元,相当于2017年29倍的动态市盈率。

篇10

2012年是各种机构真正开始改变IT基础架构的一年。但是与过去的PC或Web时代的IT变革不同,最终用户及其对内容和应用永无止境的强烈需求是这次变革的促进因素。

对于企业和CIO来说,如何利用大数据技术来管理并挖掘其数据的商业价值,使企业更迅速的占领市场先机,给客户带来更好的体验,是企业用户更加强劲的发展动力。

EMC高级存储事业部总裁Amitahb Srivastava表示,从技术的角度来看,IT部门将继续看到智能的转移,更多的数据中心智能会转移到软件控制平面中,而软件控制平面则利用基于Web的技术,访问作为一个整体的计算、网络和存储资源(例如软件定义的数据中心)。随着数据中心寻求更容易的技术消费方式,云计算模式的原则也将增多,除了效率和敏捷性等,还将包括简单性。厂商对此做出的反应是,提供基础架构解决方案,这类解决方案打包整合同类最佳技术,并有可能使物理地点不再重要,而通过中央控制点管理多种多样的基础架构。

由于越来越多的机构寻求以更有效的方式保留和利用非结构化数据,所以对象存储系统将迅速增加。要在企业中使用对象,具备扩展对象存储系统的能力将很重要。类似地,对于用对象建立应用的开发人员而言,支持基于云的开放接口也将是非常关键的。

投资飙升

企业在大数据领域的投资也在激增。汤森路透的数据显示,2011年,风险投资人给大数据相关的初创公司投资24.7亿美元,与2010年的15.3亿美元和2009年的11亿美元相比,有显著增长。

2013年,大数据初创公司界将会看到,仅向市场提供单点式工具而不是集成式解决方案的公司结果会很不妙。尽管这类公司能为某些客户提供价值,但是随着市场的成熟,最好的厂商将变得更大、更强,而其余的厂商恐怕只能为自己的产品举行一场大数据“庭院拍卖会”了。

大数据几乎在所有人的心目中都占有一席之地。社交和移动技术相结合产生的影响、不断需要增强竞争优势以及无处不在的分析软件和服务,都将改变厂商和最终用户消费信息的方式。基础技术已经有了。Hadoop数据生态系统的出现已经使经济实惠的存储和PB级数据处理变成了现实。富有创新精神的企业正在利用这些技术开发一类全新的、实时的、以数据为主导的应用。随着这一趋势的继续,我们将看到一群新的创新公司,对于10年前我们无法想象怎样解决的问题,他们会开发出解决方案。

安全更加重要

从广义来讲,大数据产业链贯穿了数据整个生命周期,从产生、采集到存储,这和整个链条是有点相似的,从狭义来看,大数据的产业链主要涵盖数据的管理分析、呈现和应用的环节。大数据更加容易成为网络攻击的显著目标,从近两年所发生的一些互联网公司的用户帐号的信息失窃情况来看,大数据当中数据量比较大,它的信息量也比较大,所以黑客更加乐意去攻击,因为相对来说成本是比较低的。

大数据当中加大了隐私泄漏的风险,企业在数据存储和部署的时候,有些时候容易交叉存储,把敏感信息一不小心部署到公开的或者不应该部署到服务器上,更容易加大隐私的泄漏。

大数据数据量比较大,对于现在的存储和目前安全防范措施可能提出新的挑战。同时,大数据分析技术也容易被黑客利用攻击当中去。

大数据可能成为可持续攻击的载体,APT是这两年提的比较多的词,它有一个显著特点:病毒代码非常强大,有些攻击目标病毒很难隐藏其间,对于庞大的大数据来讲,这样的恶意软件隐藏在数据词当中很难被发现。所以说有可能大数据成为高级的可持续APT的攻击载体,这一点可能是需要大家非常注意的。

一位著名的法国哲学家说过:“万变不离其宗。”这句话也可以用来反映2013年信息安全技术趋势的很多方面。现在,一种新的网络安全模式已经就绪。要提供真正的深度防御,采用智能驱动的信息安全模式比以往任何时候都更有必要。这种新模式将涉及多个方面,包括使用大数据分析方式,为来自众多数据源的大量数据提供背景信息,以及时产生可作为行动依据的信息。

篇11

荣之联在云计算方面拥有比较多的成功经验,尤其是在生物云、动漫云等方面已经是国内的佼佼者。

举例来说,荣之联帮助华大基因构建了生物云,存储容量达到20PB,计算能力达到200万亿次。由于生物学方面的数据量非常庞大,而且大多数是非结构化的数据,在过去一年中,荣之联一直探索如何在生物领域提高数据处理和分析的性能,降低复杂度。在选择与Alpine合作之前,荣之联曾经对Alpine进行了大约一年的考察。荣之联的高层也亲赴美国Alpine总部参观,同时走访了很多Alpine在美国的用户。荣之联总经理张彤表示:“与Alpine合作,荣之联可以更好地在生物学领域深耕大数据市场。双方的合作是战略性的,对于扩大双方在中国大数据市场上的份额十分有益。”

Alpine首席执行官Anderson Wong表示:“荣之联一直专注于数据中心市场,拥有良好的技术基础和客户基础,并在全国拥有近20个分支机构。这有利于Alpine迅速打开中国市场,为客户提供良好的本地化服务。”

IDC的报告显示,全球信息总量每两年就会翻一番,到2020年,全球信息总量将达到25ZB。处理复杂的海量数据需要有与之对应的创新性的解决方案。

Anderson Wong介绍说:“在美国,目前有大约150万名IT经理需要直接使用大数据分析的结果。”与已经存在了30多年的传统商业智能(BI)解决方案相比,Alpine的大数据分析解决方案是一个涉及整个数据处理流程的智能化的解决方案,可以对不断变化的信息进行实时分析,从而为商业决策提供更好的支持。

在大数据领域,一体机的理念越来越流行。Anderson Wong对大数据一体机方案表示认可。他表示:“提高大数据应用的计算能力、存储能力,还是要依靠优化的集成化硬件。在大数据领域,一体机的应用是未来的一个趋势。举例来说,Oracle公司10%的数据库用户已将应用平台转到了Exadata一体机上。”

Anderson Wong表示:“Alpine与荣之联合作,一方面,可以拓展在中国的业务市场,另一方面也可以把荣之联在生物云、动漫云等云计算方面的技术和成功经验带到美国去,可谓一举两得。”

篇12

一般,传统的渠道开拓是通过与系统厂商合作完成的,接触不到最终用户。现在,“直接面向渠道合作伙伴和最终用户”成为LSI新型渠道战略的重头戏。

据介绍,此次新型渠道战略分为五部分:一、 以用户应用为中心,LSI首次将触角延伸至最终用户,广泛覆盖中国数据量增长最快的行业,例如,金融、电信、政府、能源等;二、扩建多元化的渠道体系,致力将其产品融入不同的IT应用环境,帮助中国行业用户解决大数据时代的挑战;三、增强渠道的辐射能力,将核心合作伙伴扩大到至少50家;四、建立创新的渠道模式,本土ISV以产品组合和传统的方式销售LSI的闪存加速产品;五、组建经验丰富的渠道团队。

友情链接