科技加速器
定义

什么是数据保护,为什么它很重要?

数据保护是保护重要信息不被破坏、泄露或丢失的过程。

随着创建和存储的数据量持续以前所未有的速度增长,数据保护的重要性也在增加。对停机时间的容忍度也很低,这可能使访问重要信息变得不可能。

因此,数据保护策略的很大一部分是确保数据在损坏或丢失后能够快速恢复。保护数据不被泄露和确保数据隐私是数据保护的其他关键组成部分。

冠状病毒大流行导致数百万员工在家工作,导致需要远程数据保护。企业必须做出调整,确保无论员工在哪里都能保护数据,从办公室的中央数据中心到家里的笔记本电脑。

在本指南中,探讨数据保护需要什么、关键策略和趋势以及遵从性需求,以应对保护关键工作负载的诸多挑战。

保障资料原则

资料保障的主要原则是在任何情况下保障和提供资料。这个词数据保护用于描述数据的操作备份以及业务连续性/灾难恢复(BCDR).数据保护策略沿着两条线发展:数据可用性和数据管理。

数据可用性确保用户拥有进行业务所需的数据,即使数据损坏或丢失。

有两个关键领域用于数据保护的数据管理:数据生命周期管理和信息生命周期管理。数据生命周期管理是一个过程关键数据的移动自动化在线和离线存储。信息生命周期管理是评估、编录和保护信息资产免受应用程序和用户错误、恶意软件和病毒攻击、机器故障或设施中断和中断的综合策略。

最近,数据管理已经包括寻找方法从休眠的数据副本中解锁业务价值,用于报告、测试/开发启用、分析和其他目的。

数据保护族谱
这张来自企业战略集团的图表描述了数据保护家族树的互补而又不同的分支。

保护资料的目的是什么?

组织可以用来保护数据的存储技术包括磁盘或磁带备份,它将指定的信息复制到基于磁盘的存储阵列或磁带匣设备,以便能够安全地存储这些信息。磁带备份是保护数据免受网络攻击的有力选择。尽管对磁带的访问可能很慢,但当磁带没有装入驱动器时,它们是可移植的,并且本质上是离线的,因此可以免受网络威胁。

组织可以使用镜像来创建一个网站或文件的精确副本,这样它们就可以从多个地方使用。

存储快照能自动生成一组指针存储在磁带或磁盘上的信息,使更快的数据恢复,而连续数据保护(CDP)备份企业中的所有数据,无论何时发生更改。

数据可移植性

数据可移植性——在不同的应用程序、计算环境或云服务之间移动数据的能力——为数据保护提出了另一组问题和解决方案。一方面,云计算使客户能够在云服务提供商之间迁移数据和应用程序。另一方面,它需要防止数据复制的保护措施。

无论哪种方式,云备份正变得越来越普遍。经常组织将备份数据转移到公共云或由备份供应商维护的云。这些备份可以替代现场的磁盘和磁带库,也可以作为额外的受保护的数据副本。

备份一直是有效的数据保护策略的关键。数据定期被复制到磁带驱动器或磁带库中,直到主数据存储出现问题。这时备份数据将被访问并用于恢复丢失或损坏的数据。

备份不再是一个独立的功能。相反,它们与其他数据保护功能相结合,以节省存储空间和降低成本。

例如,备份和归档被视为两个独立的功能。备份的目的是在出现故障后恢复数据,而归档提供数据的可搜索副本。然而,这导致了冗余的数据集。如今,有一些产品可以一次性备份、归档和索引数据。这种方法节省了组织的时间,并减少了长期存储中的数据量。

容灾与备份的融合

另一个数据保护技术融合在一起的领域是合并的备份和灾难恢复(DR)能力。虚拟化在这里发挥了重要作用,它将重点从在特定时间点复制数据转移到持续数据保护。

从历史上看,数据备份就是复制数据。另一方面,DR侧重于灾难发生时如何使用备份。

快照和复制使灾难恢复速度比过去快得多。当服务器发生故障时,备份阵列中的数据将被用于替代主存储——但只有在组织采取措施防止备份被修改的情况下才会这样做。

这些步骤涉及使用来自备份阵列的数据的快照来立即创建不同的磁盘。然后使用备份阵列的原始数据进行读操作,并将写操作定向到差异磁盘。这种方法保持原始备份数据不变。当所有这些发生时,重新构建故障服务器的存储,并将数据从备份阵列复制到故障服务器的新重建存储。复制完成后,差异磁盘的内容被合并到服务器的存储中,用户就可以重新开始工作了。

在基于磁盘的备份中,重复数据删除(Data deduplication)是一种关键技术。重复数据删除可以消除数据的冗余副本,减少备份所需的存储容量。重复数据删除可以内置在备份软件中,也可以是磁盘库中启用的软件特性。

重复数据删除应用使用指向唯一数据副本的指针来替换冗余数据块。后续备份只包括自上次备份以来已更改的数据块。重复数据删除技术最初是一种数据保护技术,现在已经作为一种有价值的关键特性进入主数据领域,以减少更昂贵的闪存介质所需的容量。

CDP在灾难恢复中起着关键作用,它可以实现备份数据的快速恢复。CDP使组织能够回滚到文件或数据库的最后一个良好副本,在数据损坏或删除的情况下减少信息丢失的数量。CDP一开始是作为一个单独的产品类别,但后来发展到现在已经内置到大多数复制和备份应用程序中。CDP还可以消除保留多个数据副本的需要。相反,组织保留单个副本,在发生变化时不断更新。

CDP响应时间
连续数据保护响应时间介于复制和备份之间。

企业数据保护策略

现代数据保护对于主存储,需要使用一个内置系统来补充或替换备份,并防止以下列出的潜在问题。

媒介失败。这里的目标是,即使存储设备发生故障,也可以使用数据。同步镜像是一种将数据同时写入本地磁盘和远程站点的方法。在从远程站点发送确认信息之前,写入不会被认为是完成的,以确保两个站点总是相同的。镜像需要100%的容量开销。

RAID保护是一种替代方案,需要更少的开销容量。使用RAID,物理驱动器被组合成一个逻辑单元,并作为一个硬盘驱动器呈现给操作系统。RAID可以将相同的数据存储在多块硬盘的不同位置。这样一来,I/O操作可以均衡重叠,提高了性能,增加了保护。

RAID保护必须计算奇偶校验,这是一种检查数据从一个存储位置移动到另一个存储位置时是否丢失或重写的技术,该计算会消耗计算资源。

从媒体故障中恢复的成本是返回到受保护状态所需的时间。镜像系统可以快速恢复到受保护状态;RAID系统需要更长的时间,因为它们必须重新计算所有奇偶校验。高级RAID控制器在进行驱动器重建时不需要读取整个驱动器来恢复数据,他们只需要重建驱动器上的数据。考虑到大多数驱动器的运行容量约为三分之一,智能RAID可以显著减少恢复时间。

擦除编码是在扩展存储环境中经常使用的高级RAID的替代方案。像RAID一样,擦除编码使用基于奇偶校验的数据保护系统,在存储节点集群中写入数据和奇偶校验。使用擦除编码,存储集群中的所有节点都可以参与到故障节点的替换中,因此重建过程不会受到cpu的限制,而且比在传统RAID阵列中更快。

复制是扩展存储的另一种数据保护替代方案,在扩展存储中,数据从一个节点镜像到另一个节点或多个节点。复制比擦除编码简单,但它消耗的容量至少是受保护数据的两倍。

擦除编码可视化
使用擦除编码,数据存储在不同的磁盘上,以防止任何单点故障。

数据损坏。当数据损坏或意外删除时,可以使用快照来纠正错误。如今,大多数存储系统可以跟踪数百个快照,而对性能没有任何显著影响。

使用快照的存储系统可以与关键应用程序(如Oracle和Microsoft SQL Server)一起工作,以便在快照发生时捕获数据的干净副本。这种方法支持可以长时间存储的频繁快照。

当数据损坏或意外删除时,可以挂载快照并将数据复制回生产卷,或者快照可以替换现有卷。用这种方法,最小的数据损失和恢复时间几乎是瞬时的。

存储系统的失败。为了防止出现多个驱动器故障或其他重大事件,数据中心依赖于建立在快照之上的复制技术。

快照复制是将主端存储系统中发生变化的数据块复制到异地的从端存储系统中。快照复制还可以将数据复制到本地的辅助存储,当主存储故障时,备用存储可以进行恢复。

数据中心故障。数据中心的丢失保护需要完整的容灾计划。与其他失败场景一样,有多个选项。快照复制是一种选择,数据复制到备用站点。然而,运行一个次要站点的成本可能是令人望而却步的。

云服务是另一种选择。组织可以使用复制以及云备份产品和服务来存储发生重大灾难时最可能需要的最新数据副本,并实例化应用程序映像。其结果是在数据中心丢失的情况下可以快速恢复。

数据保护的趋势

尽管研究表明数据保护技能差距在美国,紧跟数据保护政策和技术的最新趋势是很重要的。

Hyper-convergence。随着…的到来hyper-convergence在美国,供应商已经开始提供设备,为超融合、非超融合和混合的物理和虚拟环境提供备份和恢复。数据保护功能集成到超融合基础设施中,正在取代数据中心的一系列设备。

Cohesity, Rubrik和其他供应商提供二级存储的超收敛,提供备份、容灾、归档、复制数据管理和其他非主要存储功能。这些产品集成了软件和硬件,可以作为数据中心现有备份应用程序的备份目标。他们还可以以云为目标并为虚拟环境提供备份。

Ransomware。这种恶意软件将数据作为人质,收取勒索费,这是一个日益严重的问题。传统的备份方法用于保护数据ransomware.然而,更复杂的勒索软件正在适应和绕过传统的备份过程。

随着时间的推移,最新版本的恶意软件会慢慢渗入组织的数据,因此组织最终会在备份数据的同时备份勒索病毒。这种情况使得很难(如果不是不可能的话)回滚到数据的干净版本。

为了解决这个问题,供应商们正在努力适应备份和恢复产品和方法,阻止新的勒索软件功能

此外,企业必须确保他们保护远程存储的数据当员工变得更加脆弱,并且在不太安全的网络上操作时,勒索软件的威胁就会被放大。

复制数据管理。CDM减少了组织必须保存的数据副本的数量,减少了存储和管理数据所需的开销,并简化了数据保护。CDM可以通过自动化和集中控制加快应用程序发布周期,提高生产力和降低管理成本。

清洁发展机制的下一步是增加更多的智能。Veritas Technologies等公司正将CDM与它们的智能数据管理平台相结合。

作为服务的灾难恢复。DRaaS的使用正在扩大随着更多的选择和价格的下降。它被用于关键的业务系统,在这些系统中,需要复制越来越多的数据,而不仅仅是备份。

移动数据保护

常见的数据保护挑战在美国,移动设备的备份和恢复非常困难。很难从这些设备中提取数据,不一致的连接使调度备份变得困难——如果不是不可能的话。和移动数据保护则更加复杂因为需要将个人数据存储在移动设备上,与商业数据分开。

选择性文件同步和共享是移动设备数据保护的一种方法。虽然这不是真正的备份,但文件同步和共享产品通常使用复制将用户的文件同步到公共云中的存储库或组织网络上。然后必须备份该位置。文件同步和共享允许用户从移动设备访问他们需要的数据,同时用原始副本同步他们对数据所做的任何更改。然而,它不能保护移动设备的状态,这是快速恢复所需要的。

数据保护、安全和隐私的区别

尽管企业可能会使用这些术语数据保护、数据安全和数据隐私它们可以互换,相互连接,它们有不同的目的:

  • 数据保护通过备份和恢复保护信息不丢失。
  • 数据安全具体指为保护数据本身的完整性不受操纵和恶意软件的影响而采取的措施。它提供防御来自内部和外部的威胁。
  • 数据隐私指控制对数据的访问。组织必须确定谁可以访问数据。可以理解,侵犯隐私会导致数据安全问题
数据安全vs.隐私
数据安全是指为保护数据的完整性而采取的措施,以防止数据被篡改和恶意软件攻击,而隐私则是指控制数据的访问。

数据保护和隐私法律

数据保护和隐私的法律法规因国家而异,甚至因州而异,而且不断有新的法规出台。中国的数据隐私法于2017年6月1日生效。欧洲联盟《一般资料保护规例》(GDPR)于2018年生效。在美国,《加州消费者隐私法》支持个人有权控制自己的个人身份信息。遵守任何一套规则都是复杂和具有挑战性的。

GDPR个人资料
个人数据可以包括姓名、照片、电子邮件地址或银行账户信息、社交网站上的帖子、生物特征数据或个人电脑的IP地址。

协调所有不同的规章制度是一项艰巨的任务。不遵守规定可能意味着高额罚款和其他惩罚,包括必须停止在法律或法规涵盖的国家或地区开展业务。

对于一个全球性组织来说,专家建议制定数据保护政策它遵循业务所面临的最严格的规则集,同时使用覆盖广泛需求集的安全性和遵从性框架。有关保障资料及私隐的指引适用范围广泛,包括以下内容:

  • 维护数据;
  • 获得被收集资料的人的同意;
  • 确定适用于有关组织的规章及其收集的数据;和
  • 确保员工在数据隐私和安全的细微差别方面得到充分的培训。

符合GDPR的数据保护

欧盟更新了数据隐私法,并于2018年5月25日生效。GDPR取代了1995年的欧盟数据保护指令(EU Data Protection Directive),专注于让企业更加透明。它还扩大了有关个人数据的隐私权。

GDPR涵盖所有欧盟公民的数据,无论收集数据的组织位于哪里。它还适用于所有数据存储在欧盟内的人,无论他们是否是欧盟公民。

GDPR合规要求包括以下:

  • 禁止企业储存或使用个人资料个人身份信息未经该人的明确同意。
  • 要求公司在数据泄露后72小时内通知所有受影响的人和监管机构。
  • 对于大规模处理或监控数据的企业来说,有一个数据保护官员负责数据治理,确保公司符合GDPR。

组织必须遵守GDPR或者面临高达2,000万欧元(相当于上一财年全球营业额的4%)的罚款,具体金额取决于哪个更大。

GDPR合规的好处
GDPR可以激励企业采用提供长期竞争优势的实践。

GDPR,在独奏1他指出,保护个人资料是一项基本权利。然而,在序言4中,它说这种权利必须与其他权利相平衡。

序言1指出:“在处理个人资料方面保护自然人是一项基本权利。《欧洲联盟基本权利宪章》(《宪章》)第8(1)条和《欧洲联盟运作条约》(《TFEU》)第16(1)条规定,人人有权保护其个人资料。”

序言4说:“个人数据的处理应设计为服务人类。保障个人资料的权利并不是一项绝对权利;必须考虑到它在社会中的作用,并根据相称原则与其他基本权利相平衡。本条例方面所有基本权利和自由的原则,遵守公认的宪章的条约,尤其是尊重私人和家庭生活、家庭和通信、个人数据的保护,自由的思想,良心和宗教、言论自由和信息,经营企业的自由,获得有效补救和公平审判的权利,以及文化、宗教和语言多样性。”

这是最近更新的2021年2月

继续阅读什么是数据保护,为什么它很重要?

深入挖掘远程数据保护

搜索灾难复苏
搜索存储
搜索聚合基础设施
搜索通道
关闭
Baidu