在近40%网页死亡的互联网,一张裸照如何赛博永生 99xcs.com

久久小常识(www.99xcs.com)™

“互联网有记忆吗?”

“互联网有记忆是可能的,不过互联网有记忆不太可能。”——阿诺语录互联网版。

数字信息为何难逃短命结局

分享一个让人感觉“左脑攻击右脑”的概念。虽然我们每个人都觉得“互联网是有记忆的”,但在数据层面,却有相当一部分在线内容迎来了“慢性死亡”的最终结局。

2024年,皮尤研究中心的工作人员在 Common Crawl(可以理解为互联网档案馆)中随机抽样了约100万个生于2013年-2023年的网页,并对其进行了访问性验证。结果显示,在2013年的网页样本组里,约有38%的链接已无法打开;而在2023年的网页样本组里,则有8%的链接无法打开。

久久小常识(www.99xcs.com)™

具体而言。

在本轮抽样调查中,那些流量排名前20%的新闻网站样本组,约有25%的网页里至少包含1个失效链接。而在那些流量排名后20%的网站样本组里,该数据则提升到了26%。另在失效原因层面,有16%的页面处于“网页不在,但域名仍在”的尴尬情况;9%的页面处境则更为粗暴,其域名已经消失不见。

当然,除了新闻网站,研究人员还针对性研究了维基百科、推特。他们发现前者的100万个词条参考链接里共有11%的链接无法访问,且高达54%的维基百科参考内容会至少包含1个失效链接。

至于推特,研究人员经由数据分析后则尴尬发现,在2023年3月8日-2023年4月27日抽取的500万条推文样本里,接近18%的内容会在3个月内不可见。其中60%的消失原因为账号私密、冻结、注销,40%的原因为账号运营者主动删除、隐藏了内容。

这一系列数据也让我们意识到,互联网上的信息总量并非始终处于只增不减的“屎山状态”,反而是一种“内容增量、消失量动态变化”的微妙平衡态。

消失总是与重建并存

《纽约客》上一篇名为“Can the Internet be archived?”的文章曾如此评价互联网:“网络永远生活在当下。它虚幻、短暂、不稳定、不可靠。有时候你想要访问的网页却指向了 404... 有时候你想要查询的页面已经被更新后的内容覆盖——这更麻烦,因为网页不会告诉你,你看到的内容压根儿不是你想查询的内容。”

在过去的时间里,无论是古早新闻的报道链接,还是网友们更新知识词条的参考出处、如今看来原始又粗糙的七十年代电子游戏、辣眼睛的互联网广告录屏,它们都或多或少迎来了消失的结局。

但对一些人而言,这些数字内容并不是毫无意义的垃圾。它们不仅是一个时代的见证,更承载着自己的独特记忆。在这样的背景下,1996年一位叫做Brewster Kahle的网友建立了互联网博物馆“Internet Archive”。而他的目的也即简单又有野心,那就是备份整个互联网。

从诞生那天起,Kahle所开发的搜索工具Wayback Machine就会定时抓取网上的信息,并将其备份在Internet Archive中。截止到2019年,Internet Archive已经保存了3300 亿个网页和页面快照,以及超2000万册图书、850万份音视频。

久久小常识(www.99xcs.com)™

在这里,我们不仅能找到1977年运行在Atari 2600上的初代电子游戏,还可以看到天涯社区、微博首页快照等存于中文互联网起步阶段的记忆。

从意义角度看,这类民间人士自发组织、维护的互联网档案馆。它的价值不仅在于满足人们的“复古欲”,更在于为互联网这个动态环境记录“谁说了什么”“谁做了什么”,以此在这个各路信息不断更迭、消失的时代里,为我们保留内容的“不可更改性”。

一张做到赛博永生的裸照

有意思的是,互联网上越是人们想保护的信息,越容易因为服务器关闭、载体(如U盘、光盘等)损坏而迎来消失的命运。而那些越想被当事人删除、遗忘的信息,却越容易迎来赛博永生的抽象结局。

2017年,阿根廷一男子在自家后院闲逛时,意外被谷歌街景车拍下了高清裸照及门牌号等信息。因为本起事件过于荒诞,所以相关照片、信息不仅迎来了各路媒体的轮番报道。男子本人也开始被网友们二创恶搞,就此诞生了大量meme梗图、抽象视频。在这样的背景下,尽管该男子在2025年终于赢得诉讼并获赔了1.25万美元,但上述意外造成的心理创伤却大概率会伴其一生。

久久小常识(www.99xcs.com)™

那么问题就来了。为什么那些严肃的新闻,甚至厂商耗费大量精力开发的电子游戏历经数年后就会面临“消失窘况”,而这位全力删除裸照的倒霉蛋却能轻易喜提“赛博永生”呢?

答案或许就在“人性”这两个字的身上。

网上之所以会存在大量的失效网页,就是因为人们不再关心这些内容。哪怕是那些有价值的信息,也大可能会因为服务器无人运营、维护而消失无踪。但“裸照”这种能激发人们猎奇欲、窥私欲的存在,它的储存模式却是非中心化的。人们往往会在取笑这名男子时下意识保存、转发相关信息,让它寄生在多个不同的服务器里,静待下一个吃瓜乐子人发现并传播这位阿根廷倒霉蛋的裸照。

正如识字率低下的中世纪,人们在签订契约时通常会当众鞭打一位男孩,直到在男孩、围观群众的脑子里深深刻下“小汤姆在老亚伯签合同的那天,被人抽了个半死”的信息,让双方的交易永远流传在当地的酒馆故事集里一样。

参考:

果壳:有四成网页在近十年内消失,但一张裸照能活到永远

新浪科技:在线内容难逃短命结局:研究称2013年的网页有38%当前已无法访问

极客公园:Internet Archive:记录那些被遗忘的互联网

游民星空:向经典致敬!网上游戏厅Internet Archive容纳数百款上世纪老游戏

IT之家:阿根廷警察被谷歌街景相机拍到裸照,获赔 1.25 万美元