在线内容是短暂的。 皮尤研究中心的一项新分析显示,2013 年至 2023 年间某个时间点存在的网站中有四分之一无法再访问。 在大多数情况下,这是由于从给定域中删除了整个网站或单个页面(然后网站的其余页面仍然可用)。 如果我们专注于较旧的内容 去除趋势更加明显:约 38%。 2013 年存在的网站已不再在线,相比之下 8% 2023 年存在的网站
皮尤研究中心的分析师将这种状态称为“数字衰退”。 他们分析了从娱乐网站到政府网站和新闻网站,以及维基百科的“脚注”部分。 结论非常有趣。
至少有一个损坏的链接
研究表明 23% 互联网上的网站至少有一个损坏的链接,这意味着至少有一个子页面无法打开。 就政府网站而言,这一比例仅略小一些,达到21%。 这些问题在地方政府的网站上最为明显,这些网站往往缺乏可以修复损坏的子页面的专家。 那里的损坏链接数量相对较多。
然而,维基百科充满了过时和损坏的内容。 皮尤研究中心报告称,多达 54% 维基百科页面的“脚注”部分至少包含一个链接,该链接指向不再存在的页面。 我们补充一下,分析包含 50,000 名随机样本。 英文维基百科页面,其中绝大多数页面 (82%) 在“脚注”部分至少包含一个链接。 所有页面上总共有超过 100 万个参考链接,典型的维基百科页面有四个这样的链接。
另请阅读《商业内幕》
有趣的是,在 54% 的情况下在 11% 的情况下,“脚注”中至少有一个链接不起作用在这种情况下,所有这些链接都不起作用。 这表明,如果接收者无法检查信息来源,不仅大量信息和资源会从互联网上消失,而且维基百科条目的可信度也会降低。
社交媒体的数字分发
如果维基百科有页面消失的问题,你可以猜到 在社交媒体中,这种现象发生得更频繁。
为了进行这项分析,皮尤研究中心收集了 2023 年 3 月 8 日至 4 月 7 日期间发布的近 500 万条推文。该组织随后监控了 2023 年 6 月 15 日之前的所有推文,每天检查它们是否仍然在 X 平台上可用(以前:推特)。 事实证明?
分析结束后发现 18% 最初时期的推文不再公开。 在大多数情况下,这是因为发布相关推文的帐户被设置为私人、暂停或完全删除。 对于其余的推文,作者的帐户仍然可见且可访问,但推文本身已被删除。
一个有趣的观察是 分析的所有土耳其语推文中近一半从互联网上消失。 因此,用这种语言发布的帖子最有可能被删除或消失。 排在第二位的是阿拉伯语条目。
被删除的推文也通常来自使用默认设置且未经验证的帐户。 这可能意味着有人只是尝试使用 Twitter,测试该平台的功能,但最终决定不想使用它并删除了他们的帖子。
分析人士还指出:
- 1% 推文发布后一小时内被删除
- 3% 白天消失
- 10% 一周之内
- 15% 一个月内
皮尤研究中心没有分析其他社交网站,但可以假设那里的许多内容在一段时间后也会永远消失。
过去十年的书页很容易消失
研究人员还从 Common Crawl 的档案中收集了随机选择的页面样本,Common Crawl 是一项互联网归档服务,可定期收集选定时间段内的互联网快照。 总共分析了近 100 万个页面。 皮尤研究中心报告称,它分析了 2013 年至 2023 年的网站,试图选择大约 90,000 个网站。 每年的页面。 然后检查这些网站是否仍在运行或是否不再可用。
事实证明 25% 2013 年至 2023 年收集的所有页面于 2023 年 10 月不再可用。 此数据适用于整个域和选定域上的各个子页面。 此外,高达 38% 2013 年的网页在短短十年后就从互联网上消失了。
互联网通常被认为是永无止境的信息来源,但研究表明 比看起来更难以捉摸。
皮尤研究中心的一项分析表明,多达 25% 2013 年至 2023 年存在的网站不再可用,这 挑战在线内容“永生”的信念。 即使是被视为知识宝库的维基百科也面临着过期链接的问题 — 54% 页面的“脚注”部分至少包含一个损坏的链接。 反过来,在 Twitter(目前为 X)等社交媒体中,18% 2023 年初发布的推文于去年 6 月中旬消失。 下次当我们在网络上看到某些内容并认为它对我们有价值时,与其将其保存到浏览器的书签中,不如进行屏幕截图。
作者:Grzegorz Kubera,《波兰商业内幕》记者