时间:2023-03-14 14:51:23
引言:寻求写作上的突破?我们特意为您精选了4篇数据云存储方案范文,希望这些范文能够成为您写作时的参考,帮助您的文章更加丰富和深入。
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)07-0006-03
1 概述
近年来,随着大数据和移动互联网的发展,以及国家、大型企业信息化的大力建设,很多政府部门和企事业单位都纷纷建立了存储大量数据和媒体的应用系统[1]。1998 年图灵奖获得者 Jim Gray 曾断言:现在每18个月新增的存储量等于有史以来存储量之和。根据预测,2020年数据宇宙将达到35.2 ZB(1 ZB = 1百万PB)[5]。面对每天产生的大量数据,银行、国有企业、中大型企业等都耗费大量人力、物力、财力去建立自己的数据中心。但对于小型企业或服务短时用户来说,建立数据中心的费用是不值得去耗费或完全无法支付得起的,从而催生了一种按需收费的云存储技术。
随着云计算和软件即(SaaS)服务的兴起和发展,云存储已成为信息存储领域研究的热点话题。与传统的存储设备相比,云存储不仅仅是多个磁盘的整合,更是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等多个部分组成的系统[2-3]。云存储主要提供的是存储服务,用户通过网络将自己的数据上传至云服务提供商提供的在线存储空间中(公有云)。用户只需对自己所存储的那部分数据所占的存储空间支付费用,不必花费高昂的费用去搭建数据中心,节省了大量的费用。如果用户数据需要安全和保密,则企业或用户可根据自身条件和情况,搭建企业内部的数据中心,用来保存机密性数据,同公有云协同构成混合云来提供存储服务。
云存储是通过集群技术、分布式文件系统,将网络中大量不同类型的存储设备整合起来协同工作,共同对外提供数据存储和业务访问功能[5]。此概念一经提出,就得到众多存储厂商的广泛关注和支持。Amazon公司推出弹性块存储(EBS)技术支持数据持久性存储;Google推出在线存储服务GDrive;EMC公司收购BerkeleyDataSystems,取得该公司的Mozy在线服务软件,并开展SaaS业务;Microsoft公司推出WindowsAzure,并在美国各地建立庞大的数据中心;IBM也将云计算标准作为全球备份中心扩展方案的一部分;阿里巴巴也在世界各地逐渐建立起了庞大的数据中心Aliyun[4]。那么面对众多的云服务提供商,用户选择单云还是多云成为需要考虑的问题。对于用户来讲,不仅要满足用户对于性能和安全的要求,还应尽量地去降低成本;而对于提供商来讲,则重在考虑存储效率及服务的安全性和稳定性,保证满足用户的正常需求。
为应对云服务商垄断和单点故障问题,在学术界就有人提出多云存储架构。为更好地解决多云存储中的性能和可靠性保证,本文提出一种基于多云存储的数据放置策略方案,通过优化数据放置和副本存储方案,提高数据访问性能和存储效率。这样既可以为用户提供安全稳定的存储服务,服务商还可进一步提高存储效率。
2 基于多云存储的数据放置策略设计
2.1 云计算与云存储
云计算是在分布式处理(distributed computing)、并行处理(parallel computing)和网格计算(grid computing)等基础上进一步发展的产物,是透过网络将庞大的计算处理程序自动分拆成无数个较小的子程序,然后再交由多台服务器所组成的庞大系统经计算、分析后、将处理结果回传给用户[6]。运用该技术,将不同地区、不同类型的单一服务器或PC中的计算资源和存储资源整合,通过虚拟化技术统一到庞大的云计算系统中,达到可在数秒内处理数以万计的数据请求和访问。云计算系统不仅具备对数据进行处理和计算的功能,还具备存储大量数据的能力,由此可以把云存储理解为以数据存储和数据管理为中心的云计算系统。从三层模型分析得出,云计算和云存储的访问层、接口层相同,在基础层方面,云存储增加了数据管理和数据安全的部分相关功能。
2.2 多云存储
在The ACM Symposium on Cloud Computing (SoCC) 2010会议的“RACS: A Case for Cloud Storage Diversity”的文章中就已提出云服务商垄断的概念,即当用户要将存储的全部数据从单云中迁出时,就不得不为此付出高昂的费用和代价,这样便使得用户对某个云服务平台存在依赖与绑定。在2011年,Amazon 云平台因数据过度备份而耗尽其存储空间,从而导致Amazon云平台在短时间内出现宕机和停止服务的状况,使得多个基于Amazon平台的网站长达24小时都处在离线状态。因此为应对和解决云服务商垄断及单点故障问题,则在学术界提出多云的概念。
多云是将各种类型(public、private、hybrid clouds)和品牌(Azure、Amazon、Rackspace、Aliyun等)的云产品部署在一起。而多云存储则是将这些不同云服务提供商提供的公有云存储整合在一个统一的存储架构体系之内,用户上传的数据分散存储在不同的云存储平台上。
2.3 冗余机制
随着人们对于数据安全性及可靠性需求的不断提高,文件的单副本存储已经完全不能满足用户需求,因此就需要采用多副本进行存储,以实现数据存储的可靠性。多副本存储不仅仅在性能上可以保证数据存取的高度并行性,而且在容错上根据副本数目的不同可以提供不同层次的容错度。
当用户将数据上传至多云架构时,则需明确指出该数据的容错度、实时性需求,性能要求、数据获取的主要区域,位置控制器可根据用户数据的各项参数,决定改数据需要采用什么样的冗余机制、存储区域的选择等。例如针对于新闻来说,这类数据对于实时性要求比较高,在存储时需采用多个副本进行存储(通常为三副本存储),这样就可提供高并行存取。对于游戏数据来说,则对存取性能要求比较高,因此我们则需更高的冗余度来进行存储,以提供更优质的服务。对于国内新闻来说,超过90%以上的用户都来自国内区域,因此我们在存储数据时,则应在国内的数据中心上进行多副本冗余存储,以保证多用户的实时高并发访问。
上图(图4)为冗余机制下数据放置的结构图,当用户将需要存储的数据上传至多云平台时,首先会将数据上传至数据放置控制器,控制器根据用户设定的容错度、实时性、性能以及数据访问的区域的参数,决定数据需要采取哪种冗余机制进行存储。然后按照控制器设定的冗余要求进行冗余存储。存储数据的云平台会根据云服务商提供的区域特点,拟在每个云的不同区域(美国西部、欧洲、亚太地区、南美洲)中选取一个存储节点。然后将多个云服务商提供的存储资源进行合并,构成多节点的冗余存储架构。
图5中描述将六个文件(A、B、C、D、E、F)采用三副本冗余机制上传至多云平台架构的数据分布图。从图中可以表现出冗余机制的以下优点:(1)当用户请求文件A时,多云架构可从Azure、Amazon、Rackspace三个云存储服务中并行下载所需文件,提高用户请求访问效率,降低访问延迟。(2)解决了单云故障问题,当Amazon云平台出现故障宕机时,如用户需要获取文件B时,则可从Rackspace或Aliyun云平台进行获取,避免了单点故障问题造成的存储和访问服务中断。(3)当文件发生损坏或丢失时,可从包含该文件的两个云平台上进行快速恢复,满足用户对于容错度的需求。综上所述,引入冗余机制不仅可以满足用户对于实时信息获取的低延迟和高并发访问,避免了由于单点故障造成的数据或服务中断问题,还提供了数据丢失时的快速恢复机制,保证为用户提供可靠的数据存储和访问服务。
2.4 一致性hash算法概述
consistent hashing 算法早在 1997 年就在论文 Consistent hashing and random trees 中被提出,目前在 cache 系统中应用非常广泛。在一致性hash算法中,为了满足平衡性,引入了“虚拟节点”的概念。――“虚拟节点”( virtual node )是实际节点(机器)在 hash 空间的复制品( replica ),一实际个节点(机器)对应了若干个“虚拟节点”,这个对应个数也成为“复制个数”,“虚拟节点”在 hash 空间中以hash值排列,每个物理节点生成的虚拟节点越多,各个物理节点之间的负载越均衡,新加入的物理服务器对原有物理服务器的影响就越保持一致[7]。增加虚拟节点后,可以使得数据可以较为分散且均匀地分布在各个节点上。
上图(图6)展示了为引入虚拟节点的对象映射图,从图中可以看出当Node2节点出现故障时,object1指向了Node1节点,object2、object3、object4均指向了Node3节点,因此造成了数据分布特别不均匀;为了应对这一缺点,从而引出“虚拟节点”的概念,下图(图7)描述的是当引入虚拟节点时数据的分布情况,对比图6明显地解决了分布不均匀的问题。根据以上的分析,本文通过运用一致性hash算法到多云架构,使得上传的数据能够均匀地分布在多云架构中,缓解不同区域数据存取的访问性能和效率,提高用户体验。
2.5 场景应用
随着信息技术的发展,用户对于应用的体验要求越来越高,那么如何提高用户体验以及保证不同区域用户体验的相似性成为研究的重点话题,本文拟通过一致性hash算法来解决该问题,使得用户数据在存储时尽可能地分散均匀存储,避免数据存取的不均匀性和两极分化性。
随着应用的不断发展和普及,用户变得越来越分散,那么如何为全球各地的用户提供比较均衡的性能?因此我们提出利用一致性hash算法可以保证数据分布平衡性的特点,将此应用到多云存储架构中,保证用户体验的相对均衡,缓解不同区域用户体验的两极分化现象。例如有一款游戏,它的用户分布在全世界各地,那么我们在存储游戏本身数据和用户数据时,因为考虑到当前主流云存储服务提供商(Azure、Amazon、Rackspace等)的所有regions分布,我们会在美国西部、欧洲、亚太地区、南美洲等四个区域进行数据存储,这样既可保证处在世界各地用户的体验相差不会太大,提高应用的用户体验和评价。另一种情况,我们则会进行特殊处理。例如针对于国内新闻来讲,有可能访问该新闻数据的用户90%以上都处于国内的区域,那么我们在对数据存储时,则会将数据保存在亚太地区regions中的多个数据中心,但数据进行存取时,则应保证数据在国内区域尽可能地分散和均匀,这样不仅可保证用户集中访问的服务可靠性,还可保证全国各地的用户体验近似相同,避免出现两极分化的现象。综上所述,在对数据进行存储模式设置时,我们会根据数据的属性和情况,进行适应性地选择存储模式,在保证性能的同时,还可使得性能在不同区域中得到均衡,避免或减少两极分化的出现。
下图(图8)中描述的是对数据进行随机放置和使用一致性hash算法放置出现的情况对比。从图中上图可以看出,当我们采用随机放置策略时,有可能就会出现数据的区域聚集,导致有些区域的数据块较少。针对于图中所示情况,当美国、欧洲、亚太地区进行数据存取时,都能够较快地获取到所需数据;而当南美洲用户进行数据访问时,则有可能就会出现较大延迟,因为该区域没有存储相关数据,需要在距离较近的美国存储区域进行数据获取,但是由于距离以及网络带宽等的影响,会使得用户获取数据较慢,从而使得用户体验较差;例如当南美洲以为用户访问数据时,因为该区域未存储文件,因此用户的每一次访问都需从其他区域进行获取,那么这就导致南美洲区域的用户体验特别差;而其他三个区域包含了所有的文件,因此当这三个区域的用户访问数据时,都可以及时获取到自己所需数据,用户体验较好。这种数据放置情况下,只保证了一部分用户的较快数据访问,用户体验两极分化现象严重。图中下图表示采用一致性hash进行数据放置的情况,从中可以看出数据分布相对比较均匀,四个区域中的任何一个进行数据访问时,大多数情况都可以在自己所在区域的云上获取所需数据。当出现所需数据不在当前区域时,则可就近选择区域进行数据获取。例如当一位美国用户需要获取文件File4时,其所在区域不包含该文件,则可从距离相对较近的南美洲进行获取。由于这种情况相对较少,而且四个区域的用户出现这种情况的概率基本一致,因此在保证了用户体验较好的情况下,也进一步改善两极分化现象。
3 结论
本文针对多云存储架构下数据放置的不均衡性、用户对于信息获取实时性的需求,提出将多副本存储机制和一致性hash算法应用到多云存储架构中,多副本存储机制可以保证用户对于数据获取性能的要求,还可保证用户数据的安全性和可靠 性;一致性hash算法在保证用户对于实时信息快速获取的同时,还可保证用户体验的均衡,避免出现两极分化现象。
参考文献:
[1] 詹增荣.多云存储平台资源共享与安全架构设计[J].信息技术,2015,15:150-151.
[2] Hayes B. Cloud Computing [J].Communications of the ACM, 2008, 51(7):9-11.
[3] LIN G, DASMALCHI G, ZHU J. CloudComputing and IT as a Service:Opportun itiesand Challenges [C]//Proceedings of the IEEE6th International Conference on WebServices (ICWS’08),Sep 23-26,2008,Beijing, China. Los Alamitos, CA,USA: IEEEComputer Society, 2008:5.
[4] 周可,等.云存储技术及其应用[J].中兴通讯技术,2010,16(4):24-27.
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)31-7235-02
近年来,计算机网络技术快速发展,云计算作为一种新兴的应用领域,受到了人们的广泛关注,在多个领域中迅速流行和推广。基于云计算机的安全数据存储结构可以安全的分析、共享、广利和存储大量的复杂数据,不仅可以拓展容量,其管理成本和设备投入也较低,是未来计算机存储系统的重要发展趋势。
1 基于云计算的数据存储结构概述
1.1 云计算的基本概念
云计算是由网络计算、并行处理和分布式处理发展起来的,是一种重要的分布式计算技术,云计算的基本概念是利用计算机网络将复杂的计算程序分解成若干个独立的子程序,将这些子程序交给运算系统的多层服务器来处理,处理完成后将计算结构回传给计算机网络用户。
云计算是一种对分布式数据库、网格计算、并行处理以及分布式处理的改进计算方式,可以有效地解决复杂数据的网络计算,并且为多种计算机资源提供公用的可计量的计算,是虚拟化技术和宽带技术的一种重要发展成果。云计算可以为我们的生活、工作和学习提供多样化的服务,如MSP(管理服务)、PaaS(平台即服务)以及SaaS(软件即服务)等[1],这些服务可以帮助计算机网络用户节约系统维护成本,专注于应用系统开发,省去了很多繁琐的细节过程。
1.2 云计算的数据存储结构
1) 存储层:存储层是云计算数据存储结构最基础的层次,主要由多种网络设备和存储设备组成,在存储层还有一个最主要的存储管理系统,其主要职能就是对各种硬件设备的维护升级、状态监控以及集中管理等。
2) 管理层:管理层是云计算数据存储结构的核心部分,同时也是最复杂繁琐的部分。管理层主要采用了成熟的分布式存储系统和集群管理技术,不仅具有良好的可拓展性,还可以复杂云存储系统的容灾、备份以及数据加密等任务[2],极大地满足了用户的对数据存储性能和可用性的需求。
3) 接口层:接口层是云计算数据存储结构开发和应用云储存资源最重要的部分,云计算的数据存储供应商可以通过接口层为计算机网络用户设置统一的编程和协议接口,便于用户自主开发应用程序。
4) 访问层:云计算数据存储结构的访问层是应用程序的系统入口,计算机网络用户可以通过这个入口登陆云计算数据存储系统,共享系统的数据资源。
2 基于云计算的数据存储安全技术
2.1 数据加密技术
当前,云存储系统服务商除了提供即服务(SaaS)之外,其保护私密数据的能力非常有限,因此计算机网络用户自身要注意对数据进行加密,为了确保云存储数据的完整性和机密性,无论是个人用户还是企业用户都要提高数据安全意识,使用数据加密技术,加强密钥管理[3],提高云储存数据的安全性和利用率。
2.2 数据隔离技术
由于基于云计算的数据存储结构会将用户的数据随意摆放,很多用户的数据可能会共同存储在一个虚拟服务器上,因此用户要注意使用数据隔离技术将自己的数据和其他用户的数据隔离开来,提高云计算数据存储的安全性。
2.3 访问权限控制
计算机网络用户将数据上传到云计算数据存储系统后,访问数据的优先权由计算机网络用户转移给云计算提供商,因此用户要限制云储存服务商的访问自己数据的权限,在上传数据之前,将自己设置为访问该数据的最优先级,掌握访问该数据的权限,确保云储存系统的数据安全。
3 结束语
如今的信息化网路时代,基于云计算的数据存储结构是未来存储系统重要的发展趋势,如果有效地利用云计算的数据存储结构、如果确保云计算的数据存储安全、如何提高云计算数据存储结构的运行效率等问题逐渐成为人们关注的焦点,随着云存储系统的快速发展和广泛应用,我们相信这些问题会逐渐被解决,同时也推动基于云计算的数据存储结构的不断改善和改进。
参考文献:
二、整治范围
危险化学品储存场所(含生产、经营、运输环节的罐区、库场、堆场等),重点是构成重大危险源且涉及硝酸铵等爆炸品、有毒有害气体的储存场所,甲类、乙类易燃液体及液化气体的储存场所,尤其是单独储存经营油品或化工品的罐区。
三、整治内容
(一)储存场所未取得合法规划手续、周边安全防护距离不满足安全要求的。
(二)未经过正规设计,存在违法建设和经营、未批先建、批小建大、无证经营等违法行为的。
(三)安全生产责任体系“五落实五到位”不落实,未制定和落实安全管理制度的。
(四)专职安全管理人员配置不到位,未依法依规对从业人员开展安全教育培训,从业人员无证上岗,对本岗位涉及的危险化学品安全风险不清楚、不掌握的。
(五)未对重大危险源定期辨识、评估及备案,重大危险源安全管理制度和安全操作规程不完善,未建立安全监测监控体系或体系不稳定不可靠,未及时采取有效措施消除事故隐患,重大危险源管控不到位的。
(六)安全仪表系统设计、安装、调试、操作、维护等全生命周期管理及制度不健全或不落实;液位、温度、压力等重要运行参数监控系统运行管理不到位;油罐液位超低、超高报警和自动联锁设置及运行不完好;有毒物料储罐、低温储罐、压力球罐进出物料管道和危险化学品长输管道未设置紧急切断设施;可燃、有毒气体泄漏报警系统的配置和运行不完好;可燃、有毒气体检测仪报警时,岗位人员未及时到现场确认并采取有效控制措施等安全仪表系统管理不规范的。
(七)违反爆炸品(《危险货物分类和品名编号》〈GB 6944-2012〉中规定的1.1项、1.2项)和硝酸铵类物质的危险货物集装箱应实行直装直取、不准在港区内存放的规定,与易燃易爆、有毒有害危险化学品的安全距离不符合规定要求,存在超量储存、违规混存、超高堆放、野蛮装卸等现象的。
(八)动火、进入受限空间等特殊作业违反有关国家标准要求,未建立并严格落实特殊作业管理制度;易燃易爆危险化学品储罐区未配置避雷、防静电设施并定期检修、检测;储罐切水、倒罐、装卸过程中,未安排作业人员在作业现场看护;储罐超温、超压、超液位、管线超流速操作;在储罐或与储罐连接的管道内违规添加强氧化剂、易聚合、强腐蚀等可能发生剧烈化学反应的物质;库房内违反规定混存、混放;泄漏物料不及时处置,现场有“跑、冒、滴、漏”等现象的。
(九)未审核承包商的资质和安全生产业绩,未对承包商实施入厂前安全教育,未对承包商作业过程进行现场监督、过程监控,未有效防控作业安全风险等承包商管理不到位的。
(十)未制定符合实际需求的危险化学品事故应急预案并定期开展应急培训和演练,应急预案未与地方政府有效衔接,应急救援器材、设备、物资配备使用不到位的。
(十一)未吸取天津港“8・12”特别重大火灾爆炸等同行业事故教训,未制定并落实整改措施,排查治理隐患不全面、不彻底的。
四、工作分工
安全监管部门、交通运输部门、铁路部门按照部门职责和“谁审批、谁负责”的原则分工负责。交通运输部门和铁路部门要及时将专项整治中涉及其他管理部门职责的事项通报给同级的安全监管部门;安全监管部门要做好综合协调,及时将有关事项通报同级的相关管理部门。
五、进度安排
(一)安全风险隐患摸底及企业自查自改阶段(2016年5月至7月)。
各省级安全监管、交通运输部门和各地区铁路监督管理局要动员部署涉及危险化学品储存的企业开展专项整治。省、市、县级安全监管、交通运输部门和各地区铁路监督管理局要认真组织摸排危险化学品储存场所的底数,建立危险化学品储存场所及其安全风险的分布档案,并报同级人民政府安委会,安委会将有关信息通报相关成员单位。
涉及危险化学品储存的企业要结合《国务院安全生产委员会关于深刻吸取天津港“8・12”特别重大事故教训 集中开展危险化学品安全专项整治的通知》(安委〔2016〕4号,以下简称《通知》)要求,将危险化学品储存场所安全专项整治内容作为重点,全面开展自查工作,对检查发现的问题和隐患要建立台账并及时整改;暂时不具备整改条件的,要制定有效的风险管控措施,落实责任,限期整改;不具备安全生产条件的,必须立即停产。
(二)政府部门检查督导阶段(2016年8月至10月)。
省、市、县级安全监管、交通运输部门和各地区铁路监督管理局要组织专业力量将专项整治与执法检查、专项督查紧密结合,对重点企业、重点地区、重点单位进行全面抽查督查督导,督促涉及危险化学品储存的企业落实安全生产主体责任,排查治理消除事故隐患。国家安全监管总局、交通运输部、国家铁路局将根据专项整治开展情况,适时联合组织暗访暗查督导,及时将有关情况通报各有关部门和地方人民政府,确保专项整治取得实效。
(三)总结阶段(2016年11月)。
各省级安全监管、交通运输部门和各地区铁路监督管理局要认真总结专项整治工作进展、成效和经验并及时上报。国家安全监管总局将会同交通运输部、国家铁路局全面深入总结专项整治工作实施情况,向国务院上报总结报告。
六、有关要求
(一)各地区、各有关部门、各有关单位要高度重视专项整治工作,与落实《通知》紧密结合,加强领导,精心组织,周密部署,制定具体工作方案,分解细化任务,有序推进,务求实效,确保各项工作落实到位。
(二)有关企业要将由企业主要负责人签字的自查自改情况于2016年7月5日前分别报送市、县级安全监管、交通运输部门及各地区铁路监督管理局;每月5日前将隐患整改进展情况分别报送市、县级安全监管、交通运输部门及各地区铁路监督管理局。
其次,云的网络连接能力将是对数据云迁移操作的重要考验。企业与云数据中心之间数PB的数据的来回切换是比较困难的。根据企业数据量大小不同以及网络连接能力的高低,初次的数据迁移可能会持续相当长一段时间。这里,我建议各个机构在做数据云迁移前仔细检查本机构的网络情况并对内部网络的安全现状进行评估。虽然有些云供应商提出了用物理迁移的方法来代替网络传输数据,但是我们要看到,由于工作性质的原因,有些类似于病人病历、企业核心数据等敏感数据是不能被复制或采取物理迁移的方法带走的。鉴于此,这里我推荐两种方法:当企业的数据吞吐量较大但是数据量不是特别多,对传输延迟也没过多要求时,云供应商可以提供从企业到供应商某个存储节点之间的私人链接,方便企业迁移数据。企业可以根据自己的时间,在不影响公司正常运行的情况下做数据的转移安排;当企业的数据可以提供拷贝,那么我们可以采用sneakernet的方式,即:人工网络模式。将数据通过磁盘、移动存储设备等从企业服务器拷入到云数据中心或者从云数据中心拷贝出来,目前一些云供应商为了加快数据的转移,在给企业进行数据转移时会采取一些切实有效的人工网络模式,例如Nirvanix公司,他们在给客户进行数据转移时会提供一个配置了双千兆级以太网接口的存储服务器,当客户的数据拷贝完毕,公司就会带走服务器并将数据拷贝到云数据中心。
再者,为了将数据仓库有效地转移到云端,我们得适当结构化数据并使用正确的数据分析工具及迁移方法。目前,数据迁移主要有三种方式,即:系统切换前通过工具迁移、系统切换前采用手工录入、系统切换后通过新系统生成。结合目前各个机构的情况,我们采用“系统切换前通过工具迁移”方式居多。传统关系型数据库中的数据要转移到云端非关系型数据库需要面临很多的问题,一是要解决如何从关系型数据库中快速有效地抽取大量的数据到云文件系统和数据库,二是数据的转换问题。不管采用什么方法和策略,数据迁移后一定要对数据进行校验,检查数据的完整性、一致性等。
接下来,我们要关心数据云迁移过程中的安全性问题,制定一套安全有效的数据迁移方案对数据迁移进行安全管理是十分重要的。不管企业采用什么安全性数据转移方案,都必须注意数据的丢失和备份。对于敏感数据,很多云供应是缺乏长期处理的经验的。况且数据在云服务中采用的是共享存储的方式,这会使得原本在传统烟囱式架构中很易于实现的安全策略在云环境下变得具有风险性。这里建议企业在选择云存储服务商时应仔细评估,认真查看云供应商提供的安全防护措施和采用的标准,并结合自己的实际情况提出适当的调整和修改。再者,数据的备份工作都是必不可少的。还应该对备份的数据进行测试,确保当出现一些异常情况时备份的数据可以使用。虽然一些云供应商会做这一步操作,我们还是建议企业自己备份,企业可以利用云供应商提供的备份或数据导出功能来做这个操作。不管备份在什么地方,我们都必须确保在数据转移过程中受到严密的保护。并且要求云供应商提供监控功能,监控访问数据的人员以及对核心数据的加密。
最后,如果企业对当前云供应商提供的服务不满意需要更换服务商,如何在两个服务商的云之间转移数据?这应该是当前一个很棘手的问题。由于目前云存储还处在初级阶段,各个云供应商都采用自己的加密或传输机制以区别其它厂商。因此没有一个规范和约束的统一标准。很多云存储供应商无法直接将客户数据迁移到另一家供应商,当服务出现故障时,数据将返还给客户,然后客户要再找另一家云供应商,或者将数据存储在本地服务器。这样会无形中增加很多繁琐的工作量。这里建议各个云供应商提供一组云数据管理的应用编程接口API,可以实现不同云供应商之间的数据传输,让数据迁移更为便捷。
通过以上分析我们可以看到完善的存储和数据管理策略才会让云存储变得切实可行。这里给要采取云存储的企业几点建议,一是在迁移过程中必须确保包含了全部数据源。不能只专注某个局部数据,否则会导致数据的失真和信息量的不完整,为以后的使用埋下祸端。二是优化存储。企业在做数据迁移前必须要明确迁移数据的范围,然后再从不同的数据库中把有用的数据提取出来进行智能分析。确保能整合一些孤立的存储和低效应用的存储,把存储状态恢复到最佳状态。三是尽可能的采用“自动化转移”的方式。即我们在选择数据迁移工具时,
必须确保它能加快数据转移,减少人工干预,提高迁移数据的效率和灵活性。四是应该根据不同环境有区别的复制,这样可以尽可能的回收孤立的数据或者将他们移动到更有效的平台。