电子书格式整理

电子书格式整理

黑洞资源笔记

https://t.me/tieliu

本文源于网络,如有侵权,联系删除

电子书格式,是对使用电子书时的文件编码方式,文件结构的一种约定,便于区分。如同一把钥匙开一把锁,不同的文件要用不同的方法去读,去显示,去写,去打开或运行。分为PC电子书格式、手机电子书格式和其他电子书格式(这里主要针对kindle用户),PC电子书格式包括EXE、TXT、HTML、HLP、CHM、LIT、PDF、WDL、CEB、ABM等,手机电子书格式包括UMD、JAR等,Kindle电子书格式包括MOBI,TXT,AZW3,PDF,这些电子书格式利用相应的软件工具就可以相互转换,如HTM(HTML)转TXT、PDF转TXT、JAR转TXT等。

电脑格式

EXE不需要安装专门的阅读器,下载后就可以直接打开。单击目录可以直接打开所需的内容,而PDF需要一页一页翻。 

TXT   TXT 它在电脑上是记事本的扩展名,这种现在普遍应该到电子产品中,现在最常见的就是TXT小说,不仅方便的在电脑上打开,还可以下载到的MP3和手机中,现在网上TXT小说网站也很多,比如著名的飘零书社就是专业的TXT格式小说下载网站,可以很方便的下载自己的手机或MP3中,省去很多购买书的费用。 

HLP帮助文件格式,在Windows上可直接打开;一般在程序中按F1可以打开。

 CHM同HLP文件格式一样,也是帮助文件,但其支持多种视音频格式,让电子书显得更加生动美观。

 LIT微软的文件格式,需下载Microsoft Reader软件来阅读。 

PDF  PDF是ADOBE公司开发的电子读物文件格式,是目前使用最普及的电子书格式,它可以真实地反映出原文档中的格式、字体、版式和图片,并能确保文档打印出来的效果不失真。 

WDL这是北京华康公司的文件格式,使用也很普遍。用DynaDoc免费阅读软件即可打开WDL和WDF格式。 

CEB 此格式是由北大方正公司独立开发的电子书格式,由于在文档转换过程中采用了“高保真”技术,从而可以使CEB格式的电子书最大限度地保持原来的样式。 

ABM 一种全新的数码出版物格式,这种格式最大的优点就是能把文字内容与图片、音频甚至是视频动画结合为一个有机的整体。在阅读时,能带来视觉、听觉上全方位的享受。

PDG超星公司把书籍经过扫描后存储为PDG数字格式,存放在超星数字图书馆中。如果你要想阅读这些图书,则必须使用超星阅览器(Superstar Reader),把阅览器安装完成后,打开超星阅览器,点击“资源”,我们就可以看到按照不同科目划分的图书分类,展开分类后,每一本具体的书就呈现在我们面前了。 

CAJ  CAJ 为中国学术期刊全文数据库英文缩写( China Academic Journals);CAJ是中国学术期刊全文数据库中文件的一种格式。可以使用CAJ全文浏览器来阅读。CAJ全文浏览器是中国期刊网的专用全文格式阅读器,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可以在线阅读中国期刊网的原文,也可以阅读下载到本地硬盘的中国期刊网全文。它的打印效果可以达到与原版显示一致的程度。 

CAJViewer又称为CAJ浏览器或是叫CAJ阅读器,由同方知网(北京)技术有限公司开发,用于阅读和编辑CNKI系列数据库文献的专用浏览器。CNKI一直以市场需求为导向,每一版本的CAJViewer都是经过长期需求调查,充分吸取市场上各种同类主流产品的优点研究设计而成。CAJViewer自2003年发展至今主要推出5.5、6.0、7.0三个版本。经过几年的发展,它的功能不断完善、性能不断提高,它兼容CNKI格式和PDF格式文档,可不需下载直接在线阅读原文,也可以阅读下载后的CNKI系列文献全文,并且它的打印效果与原版的效果一致,逐渐成为人们查阅学术文献不可或缺的阅读工具。 

HTML网页格式,可用网页浏览器直接打开; 

EPUB EPUB 是可重排版(reflowable直译可回流)的基于XML格式的电子书或其它数字出版物,是数字出版业商业和标准协会International Digital Publishing Forum (IDPF) 制定的标准。IDPF 于 2007年10月正式采用EPUB,随后被主流出版商和设备生产商迅速采用。有各种开放源代码或者商业的阅读软件支持几乎所有的主流操作系统。象Sony PRS之类的 e-ink 设备或者 Apple iPhone 之类的小型设备上都能阅读 EPUB 格式的电子出版物。

手机格式

UMD   CHM 该格式原先为诺基亚手机操作系统支持的一种电子书的格式,阅读该格式的电子书需要在手机上安装相关的软件。不过现在的很多JAVA手机下载阅读软件后也可以看。 

JAR  JAR 文件格式以流行的ZIP 文件格式为基础。与 ZIP 文件不同的是,JAR 文件不仅用于压缩和发布,而且还用于部署和封装库、组件和插件程序,并可被像编译器和 JVM 这样的工具直接使用。在 JAR 中包含特殊的文件,如 manifests 和部署描述符,用来指示工具如何处理特定的 JAR。

Kindle电子书格式

刚接触 Kindle 的小伙伴经常会被 txt、mobi、azw、azw3、epub 等常见的几个格式搞的很凌乱,它们都有哪些区别呢?又各有什么优缺点呢?哪个好一些呢?其实 Amazon 的电子书格式比这可多多了,完全可以单独写一篇文章来解释,但是太技术性的也没什么必要,我们只需要知道这几个常见格式的区别就可以了。笔者汇总了一些资料,为各位小伙伴们通俗地科普一下。

这几种电子书格式从本质上来说都是从 HTML 文档转换而来,大多数 HTML 标签和 CSS 样式表的特性它们都支持,它们之间的主要区别在于对排版及新特性的支持与否上,为了更方便清晰的理解,笔者将这几种格式分门别类地为各位小伙伴详细解释一下:

txt小说是指txt文本格式小说,现在一般手机,mp3,mp4等可移动设备上面都能够阅览txt小说。现在支持doc的阅读器价格不菲,如果在doc文件中遇到喜欢的内容,可以复制粘贴到txt文本文档中,这样就可以阅读了。

使用txt格式的原因:由于微软的记事本软件是每个windows系统都具备的,所以txt格式就作为最普遍的格式流传下来,因此现在的移动设备都提供最基本的txt格式支持

txt格式的优势:

1:体积小、存储简单方便

2:txt格式比较简单,

3:txt格式是电脑和很多移动设备的通用格式

txt格式的缺点:

用记事本阅读,不支持标签记录,不可以标记书签.

只能支持纯文字,不支持图像,不够生动.

移动设备支持:

TXT文本格式小说在一些手机中,会出现乱码,无法显示的情况.可按以下操作进行格式转换.

  TXT格式有四种编码:ANSI,Unicode,Unicodebigendian,UTFT-8。不知道你的手机支持哪种编码方式。不过各种编码是可以在电脑上很容易的转换的。打开TXT,文件>另存为>编码>选择。这样就另存出了一份,符合要求的编码的TXT文件了。手机自带的电子书阅读器若打开某种txt文本乱码,在电子书设置里也可更换文本编码方式以解决乱码

什么是 mobi、azw 格式

mobi 和 azw 格式的推手主要是 Amazon,这两种电子书格式的发展很大程度上依靠 Amazon 这个巨大的内容提供商及其电子书阅读器 Kindle 的流行普及。它们同属亚马逊的私有格式,没有本质的区别,可以简单的这样理解,mobi 是比较老的一种格式,而 azw 只是 mobi 的另一种形式而已,也可以理解为 mobi 加了个壳,亚马逊利用它对电子书做 DRM 版权保护。

目前市面上的 mobi 文件大部分是来自两种途径:epub、pdf 或者 txt 转换成的 mobi,从 Amazon 商店流出来的 mobi。前者没什么好说的,后者要么是 Amazon 官方制作,要么就是自出版作者通过 KDP (Kindle Direct Publishing,作者可以绕过出版社直接在 Amazon 上发售电子书 )平台发布,通过 KDP 平台发布时,作者只需要上传 Word 文档,其他的事情也是 Amazon 官方来做,从而保证了 mobi 文件的规范程度。

什么是 azw3 格式

azw3 的本质是 KF8,是随着 2011 年 Amazon 推出 Kindle Fire 平板时一起推出的。它填补了 Mobi 对于复杂排版支持的缺陷,支持很多 HTML5(目前尚不支持 HTML5 的视频和音频标签)和 CSS3 的语法,这就大大改善了原来 mobi 或 azw 内容排版上的一些缺陷,单纯从读者的角度来讲,是不输 epub 格式的。目前从 Amazon 购买的书,大部分已经是 azw3 格式了,而以前主流的 mobi 格式则越来越少,它正逐渐取代 mobi 成为 Kindle 电子书的主流格式。

什么是 epub 格式

下面是维基百科对 epub 的一段定义:

EPUB(Electronic Publication 的缩写,电子出版)是一种电子图书标准,由国际数字出版论坛(IDPF)提出;其中包括 3 种文件格式标准(文件的附文件名为 .epub),这个格式已取代了先前的 Open eBook 开放电子书标准。

epub 格式对于复杂的排版,图表,公式等元素的兼容性比 mobi 格式好很多,在脚本,公式,矢量图形的支持方面也强过 mobi 格式,现阶段 epub 格式的优势体现在图文混排、图片嵌入字体等,未来可预测的优势是 epub 格式对于声音,影像等多媒体内容互动的支持上。

epub 格式是开放标准,所以在开发工具上也会有更大的选择,像 Sigil、Calibre、Jutoh 等软件都可以让用户自助制作 epub 格式电子书,但因为良莠不齐的制作也导致一个问题:大量的 epub 文件其实是不符合标准,无法保证在所有支持 epub 的硬件和软件上都可以顺利阅读,这就和 iOS 系统和 Android 系统的区别有些相似。

亚马逊为什么不采用开放标准的 epub 格式呢?

为什么亚马逊不选择 epub 这种竞争对手(如 Google、苹果)和图书馆普遍采用的标准电子书格式呢?亚马逊解释说他们的创新速度很快,采用它们自己的标准格式,能够将创新成果迅速结合到产品中去。例如,Whispersync 技术(该技术通过无线接入互联网,将电子书阅读进度信息同步到各种阅读器上)以及字号放大缩小的技术。采用其他格式的电子书阅读器,以后也能把这些功能结合进来。但是,我们在提高产品性能上动作十分迅速。采用自己的格式是非常有利的,因为不用等第三方格式跟进之后再动手。

对于我们普通读者来说,其实只需要知道越新的格式其支持的特性多,更能改善、提升我们的阅读体验就可以了。

各软件间文字的转换

HTM(HTML)转TXT

所需软件:HTML2TXT.exe[2]

说明:启动软件,单击“添加文件”按钮找到需要转换的HTML文件;选择一个输出文件夹,然后单击“开始”按钮即可得到反编译后的HTM文件。

CHM转TXT

所需软件:CHM Encoder

说明:启动软件,单击“打开”按钮,找到需要转换的CHM文件;选择一个输出文件夹,然后单击“开始”按钮,即可得到反编译后的HTM文件。接下来执行上面讲过的HTM(HTML)转TXT的步骤,即可得到TXT文件。

PDF转TXT

所需软件:PDF Text Converter

说明:启动软件后,先在左上方的浏览器窗口内找到PDF文件所在的文件夹,此时左下方的文件列表窗口中会显示出该文件夹中的PDF文件,选中欲转换的文件,单击工具栏上的“添加文件”按钮,即会在右上方的窗口中列出等待转换的文件,添加完成后,单击齿轮形状的“转换”按钮,即可完成转换,转换好的TXT文件保存在源文件所在文件夹内。

JAR转TXT

所需软件:WinRAR

WinRAR

说明:只要你的电脑上安装了WinRAR,即可右击JAR文件,直接将其解压缩。此时你需要做的,就是将这些没有扩展名的文件加上TXT的扩展名并合并。

UMD转TXT

所需软件:XBookMaker

说明:启动软件后,单击左上方的“Open folder”按钮,定位到包含UMD电子书的文件夹,此时会在左边的的“Files”窗口列出该文件夹内包含的所有UMD格式的电子书,点击一个UMD文件,左下方的“Chapters”窗口中即会显示该电子书中所包含的章节。单击任意一个章节,即可在右边的窗口中看到该章节的内容。现在你只需将其复制并将其粘贴到记事本中,保存为TXT即可。

EXE转TXT

所需软件:miniKillEBook

说明:先打开想要转换的EXE电子书,再启动miniKillEBook,勾选“以文本方式保存”复选框,拖动图中的图标到电子书窗口中,单击“开始”按钮,软件即会自动将电子书“逐页翻过”并将每一页的内容存为TXT文本。

4 格式比较

TXT电子书,其实就是未做任何加工的电子文本,是最简单的展现文本,它的编码分为ansi、unicode、unicode big endian、utf-8,这几种代码电脑中都可以正常浏览,我们电脑中常规用的是ansi编码,但手机就不同了,手机一般默认的是unicode编码,编码不认的情况下会出现乱码,当然随着手机的逐渐发展这种情况会有所改善,简而言之,txt电子书最制作最简单的,将常规编码的电子资料“另存为”的时候将编码改成unicode编码形式的即可。

EXE电子书,众多电子书格式中制作起来算是最复杂的一种,但也是最美观,功能最多的一种,它的过程是先将txt格式的内容文本,按章节分开多个TXT文本,再分别制成一个html的集合(页面插图及电子书封面),最后通过电子书的封装软件,制成一个后缀为.exe的电子书文件。

PDF电子书,一般是用Foxit PDF Editor来制作的,基本分为两种一种是文字版的,另一种更直接将纸质书籍文字全版影印成图片,集合一下便是pdf电子书。

JAR电子书,其实就是将txt电子文本,转码成unicod编码,然后通过手机电子书制作软件,再次将功能实用性提升了一下,基本相当于txt电子书的升级版。

优势劣势

TXT电子书的优势:为体积小,是各种电子书的原始载质。劣势:没有功能,不美观。

EXE电子书的优势:美观漂亮,功能多,可实现章节目录,翻页滚屏,排版整齐,不需要借助任何阅读软件。缺点:体积相对txt大,目前不能在手机上阅览。

PDF电子书的优势:直观,有章节目录,美观度一般,功能一般,比如:ADOBE ACROBAT PROFESSIONAL软件可以极为方便的添加(标注、文字、图片等)注释。劣势:在所有电子书格式中pdf电子书体积最大,不能在手机阅览 (目前在安卓、苹果等智能机通过第三方软件可打开阅览)。

PDF转换器

JAR电子书的优势:功能相对txt而言,加入了书签分节功能。劣势:仅限于在手机上观看,体积比txt格式稍大,不能在电脑中阅览。

EPUB电子书的优势:有章节目录,文字显示大小可选,排版自由,适合比例屏幕阅读。劣势:PC上使用,体积比txt格式稍大,不能添加备注等,不过如果只是阅读且兼顾文件大小的话epub是个不错的选择。

哪种格式的电子书好?

其实任何事物无所谓绝对的好与坏,没有最好,只有更适合,如果你喜欢在电脑中看电子书,不讲究美观的建议你看TXT或PDF格式电子书,如果讲究赏心悦目那选择EXE电子书,如果你只喜欢在手机上观看电子书,建议你选TXT或者JAR,如果想更细致一点,那就选择JAR格式的。如果你是一个电子书发烧友,那仍然建议你选择EXE电子书。以上各种电子书网络都中都不乏见,TXT的更是多如牛毛像起点中文网,红袖添香等都不少,EXE格式的相对较少点例如58L电子书,或者无忧都挺不错的,随着时代的发展,我们的手机将会如电脑一样,或者说,手机与电脑基本相当于小电脑与大电脑的差别,相信到了那时候,所谓的任何形式的电子书的展现将会是一马平川,不存在介质的障碍。

5 相关资料 

PDF

日本电子式格式的发展共识

日本各大图书出版商及数字出版公司日前达成共识,将选用EPUB 3.0标准作为电子书出版格式。

EPUB是一种电子图书标准,由国际数字出版论坛(IDPF)提出,是一个自由的开放标准,包括3种文件格式标准(文件的附档名为.epub)。目前EPUB在欧美已被广泛使用,取代了先前的Open eBook开放电子书标准。

目前,电子书的出版已成为科技界和图书出版界的热门话题。分析师预计,日本的这一决定将对全球电子书市场格局产生重要影响。


Report Page