首页 资讯频道 互联频道 智能频道 网络 数据频道 安全频道 服务器频道 存储频道

乘坐“网页时光机” 寻找消失的帖子

2020-05-21 15:48:55 来源 : 互联网

最近,百度又出幺蛾子。5月13日百度贴吧开启“灭霸模式",在没有任何提前通知的情况下,百度发布了官方公告:“由于数据系统升级,贴吧2017年1月1日前的所有帖子都已被隐藏,暂时无法访问”,更让人气愤的是,就连讨论帖子消失的帖子也会消失不见。

一、如何找回百度贴吧消失的帖子?

百度贴吧,可能是大多数人学会玩论坛的第一个去处。它也是全球最大的中文社区,草根文化的舞台,兴趣的集中地,不论什么样的主题,你总能在这里找到和你志同道合的人,你在贴吧发起的提问总是总能迅速得到回应。早在初中的时候,奶酪就开始混迹于各个贴吧,见识过许多神贴和传奇人物。

百度贴吧的“精品贴”区更是查找资源的好地方,它们往往都是圈内大佬们花费几个月,甚至几年的时间精心制作的内容。当年很多精品帖子被盗用到其他地方,人们气愤不已,现在可能还要“感谢”他们,真是让人感慨不已。

如果此次事件后续没有恢复手段,这将是中国互联网史上的一次大事件。十年之功,废于一旦,一个时代的共同记忆被删除,以后的历史学术考究也将无从谈起。一个找回帖子可行的方法,是使用百度快照来查看历史记录。

1、打开高级搜索,输入要搜索的用户名、关键词、吧名(无需三个都填),获取用户的发贴记录。

2、复制贴子的链接地址,去掉链接 ? 之后的所有字符,比如 http://tieba.baidu.com/p/4430278431

3、在百度搜索引擎里搜索该链接,点击”百度快照“查看贴子内容。

二、如何找回任意一个消失的网页?

在国内网络的大环境下,由于法律政策、论坛规则、发贴人主动删除等原因,你收藏的网页很有可能在某个时间点就会打不开消失不见,贴吧是这样,其他的网站也是如此。下面介绍三个找回网页内容的方法,适用于所有网站。

方法 1:网页快照

网页快照,是搜索引擎在收录网页时,对该网页进行索引,然后存入服务器缓存里,网页快照因此也只能显示网页的最新收录结果。大多数搜索引擎都会显示”网页快照“的选项,但在网站https://2tool.top上,输入网页地址可以同时查看多个搜索引擎的网站快照

方法 2:Internet Archive

Internet Archive是一个成立于 1996 年的非营利性的数字图书馆组织,以保护数字文化遗产为使命,它会定期收录并永久保存全球的网页,就像收藏旧报纸一样收藏旧网页,直到2012年10月,其信息储量已经达到了 10PB。

使用方法很简单,只需要将网页地址输入,查询即可。右上角的黑色柱状条表明了存档的年份和数量的多少,页面中间的圆圈则表示网页存档量的多少。通过查询我们就可以知道某个网页的变化史

Internet Archive 是爬虫自动收录,不同的网站,其收录的数量和周期也不一样,大网站可能每天都会收录一次,小网站也可能会一年才收录一次,一些重要的网页,我可以手动提交保存。

方法是在 https://web.archive.org/save/ 后面加入要保存的网页地址即可

方法 3:Archive Today

由于 Internet Archive 是爬虫收录,且遵循 Robots 协议,如果网站已经声明不允许收录某个网页、目录、甚至是全站,那么将不会收录。

Archive Today是一个类似于 Internet Archive 的网站,由私人资助,采取的是主动存档策略,可以保存任意一个网页,保存速度快,而且还提供了网页打包下载。Archive Today可以说是对 Internet Archive 的补充。

相关文章

最近更新