SEO
首先解释一下什么是SEO,做网站的人都应该知道。SEO就是搜索引擎优化(Search Engine Optimization)是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。自从PDF作为单独的一个文件被搜索引擎收录以来,对PDF文件的SEO就显得非常重要了,本文就一些简单常见的情况对这方面做一介绍。
一、PDF文件优化第一部分:
1、PDF文件可被索引; 2、PDF文件为什么会获得高权重; 3、搜索引擎能够识别PDF文件中的链接。 早在03年车东在Google搜索排名优化-面向搜索引擎的网站设计中就写道PDF可被索引,并说明了为什么PDF、DOC(word)、PPT(power point)等文档会受搜索引擎青睐而获得高权重。引用原文内容: 文件类型因素:Google有对PDF, Word(Power Point, Excel), PS文档的索引能力,由于这种文档的内容比一般的HTML经过了更多的整理,学术价值一般比较高,其中不少是论文,文章,白皮书,电子书,说明书,技巧等。所以这些类型的文档天生就比一般的HTML类型的文档 PageRank要高。因此,对于比较重要的文档:技术白皮书,FAQ,安装文档等建议使用PDF PS等高级格式存取,这样在搜索结果中也能获得比较靠前的位置。 由于PDF文件所具备的高权重,不由得就想到对PDF文件优化获得高排名。而Bansi关注PDF文件优化则是在去年看到很多PDF、DOC文件在搜索引擎中排名有良好的表现,并且发现很多文件还获得了很高的PR值,当时有个想法:如何将PDF、DOC文件的PR值传递一些出来。想到过301转向,但那样PDF文件将没办法访问,后来则发现原来PDF文件中也是可以添加链接的,进而我的兴趣被吸引到:搜索引擎是否可以识别PDF中的链接,假如可以识别,那么该链接的价值有多大?是否比普通的HTML文档中的链接更高质。
先说明下文件优化跟内容优化的区别。文件优化即对文件名,以及PDF文件属性中的标题、作者、描述等进行优化。去年我研究PDF文件优化的时候曾自以为是最早的,后来才发现人家国外老早就研究了,而国内却很少去研究这么细节的东西。 转一个国外翻译过来的教程:七个PDF文件优化的技巧(教程里使用的PDF软件是Adobe Reader,我使过其他的PDF阅读软件好象是不带文档属性那些功能的):
1. 确定你的PDF文件是基于文本的,所以扫描件最好少用,否则用其他程序打开PDF文件可能会发生一些问题。 2. 优化PDF文件属性中的title标题一项(文件>>文档属性)。属性中的标题title(不是文件名称)会变成title标签,并且在搜索引擎的搜索结果页面也会显示这个标题。 3. 不要忘记可用性。你要知道不是每个人使用的都是Adobe Reader的最新版本,所以你要尽量将你的PDF文件保存为低的版本。 4. 指定阅读顺序。这可以让搜索引擎知道哪部分文字是最重要的。 5. 放置链接指向PDF文件,并确保链接是(被搜索引擎蜘蛛)可以跟随的。 6. 放置PDF文件的位置要尽量靠近网站的根目录。 7. 链向PDF的超文本链接中要包含关键字。 内容优化思路: 在Google中搜索结果中,如果是PDF、DOC等文件。下面会有字样:文件格式: PDF/Adobe Acrobat - HTML 版。由于搜索引擎索引的是PDF转化为HTML以后的内容,那么只要掌握好PDF转换成HTML的规律则可以在PDF文件制作的时候做到内容的相关优化。这部分的规律有做一个比较杂的记录,有两三页的长度,我为了方便制作弄成了DOC文件。 |