数据衰减,指数据的老化和过时,由于数据的完整性、一致性和准确性丧失而不再可用。不再容易解读的数据无法被有效利用,因此缺乏价值。在接下来的5年中,全球预计将产生超过180ZB的数据,这意味着数据衰减肯定会以比现在更快的速度发生。
数据衰减的产生
数据衰减一般是数据管理不善的症状,多数是因为数据生命周期流程很少或没有到位,通常有几种情况会导致数据衰减。最常见的情况是客户记录(例如销售、营销和CRM数据)没有得到维护。一般情况下,任何组织都没有单一的数据源,而是跨多个平台、格式和视图的数据存储库。在不断变化和发展的业务系统中,如果维护不当,数据集的链接和完整性可能很快就会损坏和过时。
另一个导致数据衰减的是人为因素。很多情况下,在业务流程的某个节点或时间,数据是手动输入的。一旦输入错误或不正确的信息进入系统,就会发生数据不一致、数据卫生不良和衰减。当前,企业正以平均每文件12次的速度复制数据,这意味着单个错误可能会产生指数级损害的复合影响。此外,所有数据都有一个生命周期——这意味着数据被创建、使用和监控,并且在某个时候,它不再适合存储必须被安全地处理。
数据衰减的应对
我们生活在一个由数据驱动的世界,几乎每个组织都必然会发生数据衰减。老化和囤积过多的文件并不少见,从安全和监管的角度来看,企业需要采取积极措施防止损坏。
建议采用以下流程:
尽可能减少手动操作,通过自动化手段输入信息。
确保所有数据创建都发生在其源头(例如,来自客户),并通过强大的输入验证,在可能的情况下进行独立验证(例如,地址数据库、政府ID的校验和验证等)。
在所有数据存储中定期进行数据完整性检查来验证所有记录集之间强壮、安全的链接。
持续监控所有数据位置,以确保负责验证数据的人员首先知道数据位置。随着数据跨端点、服务器、电子邮件、业务应用程序、第三方和云存储使用和存储,数据衰减或数据丢失,仍然是组织面临的最大挑战之一,组织需要持续提高管理数据,并确保其机密性、完整性和可用性的能力。