第十二节 404 信息保存

第十二节 404 信息保存

Luterngun


中国网民在 GFW 内的微信、微博等平台上发布的涉及敏感事件和话题(如 2017 年的红黄蓝幼儿园事件、北京清退“低端人口”事件等)的内容往往会被管理者以“多人举报”、“违反《网络安全法》”等借口删除,即人们常说的“404”。本节内容旨在介绍几种在敏感信息被“404”将之保存下来以便二次传播的方法。



一、网页存档


在使用网页存档工具保存网页的优势在于可以基本保持网页的原貌,主要用以保存微信公众号文章以及财新网等墙内媒体的新闻报道。


(一)archive.is


archive.is 是一个私人资助的数字时间囊网站,提供抓取网页内容的服务。archive.is 还拥有 archive.li、archive.fo 等多个不同的域名,支持以“archive.today.xxx”的短链接形式转发分享。该网站已被 GFW 屏蔽。


(二)archive.org


archive.org 是一个非营利性的数字图书馆组织,同样提供网页存档服务,它的中文名称是“互联网档案馆”。虽然它的 archive.is 的域名很相像,两者在网页抓取方式上存在差别。



二、截图


长截图工具主要用于保存微博等难以直接存档的社交媒体内容,或者用以获取墙外媒体资讯分享到墙内,例如香港端传媒的客户端自身支持将文章导出为长图的功能,以便用户转发传播。


(一)网页截图/长截图


1.移动端

iOS 平台上的长截图应用有 Picsew 和 Tailor,另外图片标注应用 iMark(我的标记)与智能剪贴板应用 Pin 也提供网页截图的功能。Android 平台上的知名长截图应用有 PPIICC。


2.桌面端

  利用Chrome开发者工具进行网页长截图(Chrome版本要求:59或更高版本)


macOS:

Command + Option + I

①截取整个网页的内容

Command + Shift + P

输入命令:Capture full size screenshot

②(模拟移动设备)截取手机版网页长图

Command + Shift + M

点击右上方的扩展按钮选择“Capture full size screenshot”


Windows:

①Control + Option + F12

截取整个网页的内容

②Control + Shift + P

输入命令:Capture full size screenshot


  参见 少数派:利用 Chrome 原生工具进行网页长截图 | 一日一技  | archive


macOS 平台上的截图应用 Xnip 也支持长截图。


(二)截图拼接


 对于过长的截图,长截图工具可能无法一次性抓取,此时可以采取分页截图后再拼接的方法。iMark 提供最高支持 9 张图片的拼图功能,其生成的长图能保持高清不留痕迹,值得推荐;如果分页截图超过 9 张,还可以在生成的长图的基础上继续拼接。



三、页面存储


在 Windows 和 macOS 这样的桌面级操作系统上,可以利用浏览器提供“页面存储”功能将相关网页存储到本地。其缺点是最终得到的是一个文件,难以直接分享。(使用 macOS 的 Safari 浏览器存储的网页归档文件类型为“.webarchive”,在 Windows 上可用 IE 等浏览器打开该类文件)


在移动设备上可以将网页导出为 pdf 或 epub 文件,缺点同上。



四、Telegraph


Telegraph 是由加密即时通讯应用 Telegram 提供的匿名博客服务,用户可以将涉及敏感话题的网页内容转录到 Telegraph 后加以转发分享。



五、区块链


 将区块链用于首见于 2018 年 4 月的北大岳昕事件,有网友将她的公开信写入了以太坊 ETH 的交易信息,使之就此长存于区块链。


  你也可以选择 Steemit 等以区块链作为底层技术的平台存储信息。


参见:


Report Page