2 PDF的结构 2.1 PDF文件结构 PDF的文件结构(即物理结构)包括四个部分:文件头、文件体、交叉引用表和文件尾,参见图1。 文件头指明了该文件所遵从PDF规范的版本号,它出现在PDF文件的第一行。如%PDF-1.2 表示该文件格式符合PDF1.2规范。 文件体由一系列的PDF间接对象(inDirectob Ject)组成。这些间接对象构成了PDF文件的具体内容如字体、页面、图像等等。 交叉引用表则是为了能对间接对象进行随机存取而设立的一个间接对象地址索引表。 文件尾声明了交叉引用表的地址,指明文件体的根对象(catalong),还保存了加密等安全信息。 根据文件尾提供的信息,PDF的应用程序可以找到交叉引用表和整个PDF文件的根对象,从而控制整个PDF文件。 |