PortableDocumentFormat文件结构
的有关信息介绍如下:Portable Document Format (PDF) 文件的结构可以拆分为以下几个关键部分:
1. 首部:当你用文本编辑器打开PDF文件时,你会看到类似"%PDF-1.4"这样的标识,其中最后一位数字代表PDF文件的版本号。值得注意的是,软件的版本通常会高于文件格式版本,例如Read 5能打开的PDF文件格式是4。
2. 文件体:由多个OBJ对象组成,每个OBJ都有自己的顺序号,如"30979 0 obj",序号用于在xref中定位。OBJ后面通常跟着一个0,接着是关键字"obj",接下来的行表示属性,以"/关键字 值"的形式呈现。
3. 索引表(XRef):用于索引文档中每个OBJ的位置,格式为"0 211",表示XRef的起始和终止序号。XRef中的行包含起始位置(10位字符,用于定位),一个区分字符(通常为0),以及状态标记(f代表删除,n表示有效)。
4. 文件尾(Trailer):包含文档的摘要信息,如总OBJ数量("Size 211"),根节点("Root 2 0 R")和元数据("Info 1 0 R")等。"ID"字段用于文件的唯一标识,便于检索工具识别。
在解析PDF时,这些部分协同工作,确保文件的结构完整性和一致性。例如,软件会从"startxref"开始,根据索引表(XRef)找到每个OBJ的起始位置,然后解析文件内容。"trailer"部分为整个文档提供了一个结构化的概览,使得读取和处理PDF文件更加高效。
PDF(PortableDocumentFormat)是目前出版业最重要的技术发展之一,特别在自动化流程管理和远传输出应用上,欧美地区已经普遍接受为标准。在实际应用方面PDF也确实是一个有效和稳定的方案。PDF势将在中、日文市场起飞。InDesign对 PDF有极广泛的支持,无论输出和输入PDF档案都准确便捷,因此在配合PDF的普及发展下,InDesign具有明显优势。InDesign可以直接存储PDF格式,而不需要通过像Acrobat Distiller一样的中间程序;利用PDF输出令发排的速度更快,减低出错机会;并且可以控制图片压缩、字体转换和颜色变化的关键设置。