五种保存网页内容的方法分析

原创 小斯  2017-10-09 17:25  阅读 36 次 评论 0 条

浏览网页时,经常遇到一些好的内容,想把它保存下来。保存网页内容的方法很多,这里着重介绍一下自己最常使用的几种方式,并进行简单的分析。

常用的五种方法

1、直接保存网页

在浏览器上直接Ctrl+S保存网页(全部),这种方法完全原样的将网页复制下来了,网页上面的任何图片、文字等内容,包括CSS、js等样式全部保存下来。

这是完全复制式保存网页,但零碎文件太多,不好做进一步归纳整理。而且很难迁移到客户端进行阅读,比如用手机或平板上的阅读软件进行阅读。

2、直接复制到onenote

将网页内容直接复制,然后直接Ctrl+V粘贴到onenote,自由选择内容,粘贴后仍然保留原样式,而且放在onenote中,管理极其方便。个人觉得没什么缺点,这是自己最常用的一种方式。

3、生成PDF文件

生成PDF,能保留一部分样式,生成的都是文字版PDF,而且PDF在各个平台都能阅读。主要是操作也很方便,一般安装一个浏览器插件就能很方便的生成PDF。

缺点一是会丢点很多样式,页面不美观。差一点的插件甚至会把图片都给你切分到两个页面上。

缺点二是很多广告弹窗等等不需要的都变成图片保留下来了。

4、复制并制作为epub

如果有时间,有精力,将文章内容复制,并制作成epub。这种方式对于保存网页自然是最完美的,但同时也是最耗费精力的,而且需要具备一定的技能,很多人并不会制作epub。

做成epub的好处很多,首先,内容最精确,需要什么就复制什么;其次,可以将样式全部保留;最后,在各个平台进行阅读都非常方便。

但是确实太耗费精力了,除非你认为那段内容非常有收藏价值,愿意花时间去做这个事,那就靠自己去衡量了。

5、百度收藏为文章

百度收藏最大的优点是保存的都是页面的主要内容区,其他无关的部分就直接去掉了,页面看起来非常干净。

缺点一是样式变化太大,比如有些图文排版优美的网页,百度收藏后基本上丢掉了所有样式,有的表格直接把表格线都弄没了,阅读时极不方便。

缺点二是保留什么内容完全是由百度搜藏内部识别的,一般保留的都是一个页面上的主要内容(具体机制未深究),但它识别的有些时候未必是完整的,尤其是论坛这种页面,百度收藏可能仅仅会保留一楼的文章内容,而下面的楼层可能就直接忽略了,但往往下面的楼层也有很多有意义的内容是需要保留的。

总结

具体选择哪种方法,看自己的实际需求。个人经验是,五种方法各有各的好处,平时都会用到。onenote是最常用的;其次是生成PDF;然后是保存网页,然后是百度收藏;少数情况,遇到特别有价值很想收藏下来的内容会花时间做成专门的epub文件保留。

本文地址:http://cas01.com/480.html
关注我们:请关注一下我们的微信公众号:扫描二维码斯想的公众号,公众号:cas01
版权声明:本文为原创文章,版权归 小斯 所有,欢迎分享本文,转载请保留出处!
PREVIOUS:已经是最后一篇了
NEXT:已经是最新一篇了
相关文章 关键词:

发表评论

您必须 登录 才能发表留言!