最近,百度又出幺蛾子 。5月13日百度贴吧开启“灭霸模式\",在没有任何提前通知的情况下,百度发布了官方公告:“由于数据系统升级,贴吧2017年1月1日前的所有帖子都已被隐藏,暂时无法访问”,更让人气愤的最近,百度又出幺蛾子 。5月13日百度贴吧开启“灭霸模式\",在没有任何提前通知的情况下,百度发布了官方公告:“由于数据系统升级,贴吧2017年1月1日前的所有帖子都已被隐藏 , 暂时无法访问” , 更让人气愤的是,就连讨论帖子消失的帖子也会消失不见 。
一、如何找回百度贴吧消失的帖子?百度贴吧,可能是大多数人学会玩论坛的第一个去处 。它也是全球最大的中文社区,草根文化的舞台,兴趣的集中地,不论什么样的主题,你总能在这里找到和你志同道合的人 , 你在贴吧发起的提问总是总能迅速得到回应 。早在初中的时候,奶酪就开始混迹于各个贴吧,见识过许多神贴和传奇人物 。
百度贴吧的“精品贴”区更是查找资源的好地方,它们往往都是圈内大佬们花费几个月,甚至几年的时间精心制作的内容 。当年很多精品帖子被盗用到其他地方,人们气愤不已 , 现在可能还要“感谢”他们,真是让人感慨不已 。
文章插图
文章插图
上贴吧 找组织
如果此次事件后续没有恢复手段,这将是中国互联网史上的一次大事件 。十年之功 , 废于一旦,一个时代的共同记忆被删除 , 以后的历史学术考究也将无从谈起 。一个找回帖子可行的方法,是使用百度快照来查看历史记录 。
1、打开 高级搜索,输入要搜索的用户名、关键词、吧名(无需三个都填),获取用户的发贴记录 。
文章插图
文章插图
搜索页面
2、复制贴子的链接地址,去掉链接 ? 之后的所有字符 , 比如
http://tieba.baidu.com/p/4430278431
文章插图
文章插图
搜索
3、在百度搜索引擎里搜索该链接,点击”百度快照“查看帖子内容 。
文章插图
文章插图
二、如何找回任意一个消失的网页?在国内网络的大环境下,由于法律政策、论坛规则、发贴人主动删除等原因 , 你收藏的网页很有可能在某个时间点就会打不开消失不见,贴吧是这样 , 其他的网站也是如此 。下面介绍三个找回网页内容的方法,适用于所有网站 。
方法 1:网页快照
网页快照,是搜索引擎在收录网页时,对该网页进行索引,然后存入服务器缓存里 , 网页快照因此也只能显示网页的最新收录结果 。大多数搜索引擎都会显示”网页快照“的选项,但在网站 https://2tool.top 上,输入网页地址可以同时查看多个搜索引擎的网站快照 。
方法 2:Internet ArchiveInternet Archive 是一个成立于 1996 年的非营利性的数字图书馆组织 , 以保护数字文化遗产为使命,它会定期收录并永久保存全球的网页,就像收藏旧报纸一样收藏旧网页,直到2012年10月,其信息储量已经达到了 10PB 。
文章插图
文章插图
数字图书馆组织
使用方法很简单,只需要将网页地址输入,查询即可 。右上角的黑色柱状条表明了存档的年份和数量的多少,页面中间的圆圈则表示网页存档量的多少 。通过查询我们就可以知道某个网页的变化史,比如网传有一个叫张伟波的人800万卖掉 weibo.com,然而经过查询并没有这回事 。
文章插图
文章插图
网页的变化史
【百度找回查询记录步骤 百度浏览器清除浏览记录怎么恢复】Internet Archive 是爬虫自动收录,不同的网站,其收录的数量和周期也不一样 , 大网站可能每天都会收录一次,小网站也可能会一年才收录一次 , 一些重要的网页,我可以手动提交保存 。
方法是在
https://web.archive.org/save/ 后面加入要保存的网页地址即可 。比如 https://web.archive.org/save/https://www.runningcheese.com,也可以使用拓展或者小书签来一键保存 。
方法 3:Archive Today
由于 Internet Archive 是爬虫收录 , 且遵循 Robots 协议,如果网站已经声明不允许收录某个网页、目录、甚至是全站,那么将不会收录 。
Archive Today 是一个类似于 Internet Archive 的网站,由私人资助,采取的是主动存档策略,可以保存任意一个网页,保存速度快,而且还提供了网页打包下载 。Archive Today 可以说是对 Internet Archive 的补充 。
文章插图
文章插图
爬虫收录