Internet归档正在重建WATBBACK计算机以使Web历史更易于搜索

  • 发布时间:2022-12-06 17:14:01
  • 来源:

由于拨号 - 或1996年的致命日子,互联网档案一直在记录Web的演变。任何希望返回1998年的Apple主页的人员或2000年代初的纽约时报都可以简单地将所需的URL插入Warback机器,并且需要休息。

Internet归档爬行Web在间歇期间拍摄快照,作为互联网如何变化的公共记录。在撰写本文时,它已捕获近4400亿“捕获”,覆盖网页,视频和图像。但在线世界过去19年来改变了,因此,互联网档案也在发展。

以上:Apple主页:5月,1998年

基于旧金山的非营利性的非营利性获得了劳拉和约翰阿诺德基金会(LJAF)的授予,帮助重建现代时代的WATHBACK机器 - 更新旨在使WATHBACK机器更容易搜索和更多方便使用的。

“互联网档案正在帮助以变革方式保护世界的数字历史,”LJAF的风险开发副总裁Kelli Rhee说。“将WATHBACK机器置于下一个级别将使整个网络更加可靠,稳定,并为每个人都可以检索。”

整个Wayback机器代码将被重写为“提高可靠性和功能”,并且新的接口将使更容易挖掘归档的网站。这包括通过关键字查找网站 - 目前,您必须手动输入Web地址。但它不会包括每一个页面 - 只索引只有主页。

Internet Archive表示,它希望改进它已经爬出的多媒体网站,这意味着支持新格式以及支持更老的格式化以确保所谓的“比特腐败”未设置。它也与第三方合作维基百科(Wikipedia)等服务有助于修复破损的链接 - 因此,如果维基百科页面上的链接导致了现在删除的页面,例如,它将链接到Warbback机器上的存档页面。

“今天,人们的工作,以及在一定程度上,他们的生活在很大程度上在线进行,”互联网档案馆伙伴关系主任Wendy Hanamura说。“这意味着世界上的一部分文化遗产现在只住在网上。我们估计网页的平均寿命只是在改变或删除之前只有一百天。“

全新的首场机器预计将在2017年结束。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。
  • Copyright ©2014-2021 水缘网v3ujbzcqei@gmail.com All Rights Reserved