在线文件的短暂性:我们的照片安全吗?| 技术

2017 年 9 月 1 日,Tuenti 这个于 2006 年上线的西班牙社交网络永久关闭,它一度是青少年的首选平台。用户上传的 60 多亿张照片也随之消失。该网络曾警告用户,并为其提供了下载相册的工具,但许多人由于健忘、粗心或没有意识到,丢失了这些照片。

任何拥有十多年互联网经验的人都能讲述一些曾经认为是永恒的数据消失在互联网中的趣闻轶事。当您停止使用电子邮件服务时,电子邮件就会消失(即使帐户没有关闭);论坛上的消息和帖子不复存在;博客在托管平台关闭时被删除;照片在公司施加新限制时被删除;迁移失败导致 5000 万首歌曲丢失。

最新的例子来自 MySpace,该公司在 2019 年宣布,哎呀,出了点问题,无法恢复 2009 年至 2015 年期间上传到该服务的那些丢失的歌曲。然而几天后,网络保存组织互联网档案馆发布了一份目录,其中包含近 50 万个音频文件。也就是说,用户失去了访问权限,MySpace 也没有制作备份,但大部分数据都托管在其他地方。在这种情况下,一个学术小组几年前下载了所有这些音乐并将其发送到互联网档案馆。但是,如果丢失照片或电子邮件的人不知道它们在其他服务器上或无法访问它们,他们会觉得自己实际上已经消失了。另一方面,这一点也不奇怪。

“我们所有的在线内容迟早都会完全消失,”奥维耶多大学计算机语言和系统领域的教授 Daniel Gayo Avello 说道。他解释说,这些内容消失需要多长时间取决于我们为保护这些内容所付出的努力。“如果我的所有照片、视频、信息和电子邮件都在某个平台上,那么它们的持久性显然取决于使用条款和平台本身的生存。例如,根据使用条款,我的内容可能会在一段时间后消失,而无需访问我的帐户(即我不相信我的 Hotmail 电子邮件还在那里)。另一方面,如果拥有该平台的公司决定这样做,那么这些内容可能会在一夜之间消失,”他详细阐述道。

相信我们在互联网不同角落上传或发布的个人故事会永远存在,这种态度有些天真。Gayo Avello 将网络比作森林。“它可以在一个地方存在几个世纪,虽然有些树可能有几百年的历史,但大多数都不是。树木会生长、变化、死亡,森林有时也会生长,但有时也会萎缩,要么是由于偶然事件,要么是由于故意行为。网络上也发生着同样的事情,一些网站出现了,另一些网站消失了,”他解释道。

以下是关于这一切的数字: 皮尤研究中心最近的一份报告 表明 2013 年至 2023 年期间存在的网站中有 25% 已不复存在。如果我们看看最古老的网站,即 2013 年的网站,消失的百分比上升到 38%。Gayo Avello 在 2022 年给出了 关于这个话题的讨论 在奥维耶多大学科技节上,以网站为例 百万美元页面这是近二十年前的遗留问题,当时它寻求“一种今天看来相当幼稚的货币化形式:以 1 美元的价格出售 1000×1000 像素横幅的每个像素。每个广告商都可以购买他们想要的部分,并链接到他们的网站。2014 年,即推出不到十年后,超过 20% 的目标网站已不复存在,”他解释道。

回到我们托管在不同服务上的个人文件,我们是否应该开始担心它们的消失?例如,我们在 Google Photos 中保存的图片是否处于危险之中?网络安全专家、卡洛斯三世大学计算机安全 Las (COSEC) 工作组成员 Lorena González Manzano 解释说:“没有什么是 100% 安全的,他们随时可以对其进行攻击。”但是,“如果服务提供商值得信赖或是一家大公司(例如 Google),我们假设其安全性是合理的。”

网络攻击可能会导致数据被删除,但通常情况下,托管这些数据的公司都有“系统来防止在发生网络攻击和服务中断时丢失用户数据”。此外,专家继续说,攻击者的目的通常不是删除数据,而只是访问数据。“然而,像 勒索软件 他指出:“他们所做的就是访问托管我们数据的服务,对数据进行加密,然后向我们或公司索要钱财,以便能够恢复数据,或者不透露数据或将其公开。”

利用消失的数据研究历史

网站和个人出版物的消失也意味着在撰写这几十年的历史时失去了非常宝贵的文献来源。为了至少保留一些网络的丰富内容,像 Archive Team 这样的组织多年来一直在存档网络内容,以免丢失:Blogger 博客(如果它们与不活跃的 Google 帐户相关联,它们可能会消失)、公开消息和 Telegram 中的相关内容、YouTube 视频……

“在数字环境中工作的主要问题是数据的短暂性,”社会人类学博士、马德里康普顿斯大学政治科学与社会学学院教授 Elisa García Mingo 表示同意。“我们意识到这一点,因为我们在调查中看到它们消失了:你关注的账户、网站……”,她指出。

很大一部分科学知识也面临风险。根据 今年早些时候发表的一项研究 调查了学术论文数字副本的存档方式(在许多情况下,不再有实体副本),三分之一的出版商似乎没有任何类型的存档活动来保存这些副本。(而且,至少有 3 个档案馆有副本,但只有不到 1% 的学术期刊出版商这样做了。)

另一方面,谈论数字短暂性并不意味着不存在相反的问题,即我们希望消失的东西并没有消失,这导致了所有关于被遗忘权的主张。研究年轻人数字性暴力行为的 García Mingo 指出,这一切都有些自相矛盾。“有时我们将数据视为永久的,但实际上它是短暂的。但另一方面,那些拥有数字社交实践的人,好像它们不会被存档,好像它们会变得不稳定,那么他们就会有更多的数字痕迹,”他保证道。“数字痕迹比青少年体验到的要永久得多。此外,即使在保存或发布时意识到它的永久性,你也会创建一个你无法控制的文件。这就像拥有一个文件,但无法控制它所在的建筑物,你甚至无法接触到管理它的工作人员。”

如何保存我们想要保存的东西

数字存档的风格几乎和人一样多。Elisa García Mingo 解释说,这有点像模拟实践中的做法。“有些人在冲洗照片时,会选择照片、整理照片,然后制作成一本非常精致的相册,而有些人只是把它们放在饼干盒里,”她指出。同样的事情也发生在数字世界中。“有些人创建档案时没有档案意识,而有些人的数字存档水平非常高。他们处于两个极端:从在一种有意识的混乱中留下的巨大痕迹到最精致的实践,所有的人每年都会制作相册、日历或视频摘要,”她解释道。

如果我们想要确保自己永远不会遇到丢失照片、电子邮件或我们想要的文件的意外情况,那么归档级别必须提高一点。“美国国会图书馆创造了一个缩写词,IDOM,有时也叫IDEOM,意思是‘识别、决定、导出、组织和复制(复印)”,丹尼尔·加约·阿韦洛表示。虽然这个想法很简单,但它需要“努力和毅力”。

专家解释这些步骤:

  • “我们必须识别我们拥有的所有数字内容及其位置(例如,照片、视频、音频、消息、网站、其他类型的数字文件等)。”
  • 决定“哪些内容是最重要的(例如,我们真的需要那次旅行中拍摄的 200 张照片吗?我需要所有电子邮件的副本吗?)”。
  • 根据内容,我们可能需要导出它:“电子邮件、WhatsApp 消息、我们的推文存档……”。
  • 组织材料,包括“为文件赋予有意义的名称,并将它们组织到目录结构中”。这一部分对于我们稍后找到所需内容至关重要(Gayo Avello 承认他跳过了这一步,但随后他花了很长时间才找到他想要的东西)。
  • 制作副本。“3-2-1 规则可在此应用:至少制作三份数据副本,使用至少两个不同的存储系统,并且在另一个物理位置至少保存一份副本。”

此外,所有这些都必须进行更新和维护,以免我们发现档案中堆满了过时格式、我们再也无处可读的文档。

从网络安全的角度看,Lorena González Manzano 建议,如果我们将非常敏感的数据存储在外部服务中,则“以某种方式对其进行加密”。另一方面,如果我们不想依赖任何服务,“我们可以购买硬盘来自己存储数据,或者更好的是,购买 NAS,这是一种高容量硬盘,即使部分数据被损坏(例如由于电流/光线丢失),也可以恢复数据。”

您可以关注 国家报科技 FacebookX 或在此注册以接收我们的 时事通讯


1718687843
#在线文件的短暂性我们的照片安全吗 #技术
2024-06-18 03:20:00

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​