对于包含文本图像的 PDF,Google 使用光学字符识别 (OCR)技术将文本图像转换为文本。PDF 中的图像也会在图像搜索结果中建立索引。 如果 PDF 重复,Google 将选择该页面而不是 PDF。当您拥有具有相同内容的页面和 PDF 时,Google倾向于优先考虑内容的页面版本作为重复集群中的主要版本。这意味着该信号已集成到页面的版本中,即显示在搜索结果中的版本。 我们不知道 Google 是否会对嵌入其他页面的 PDF 建立索引。许多人希望这样做来跟踪 PDF 点击次数。有更好的方法,我们将在本文后面解释。 我使用“object”标签和 <iframe> 运行了一些测试,将 PDF 嵌入 卢森堡手机号码列表 到网页中。至少 Google Search Console 的 URL 检查工具没有显示任何屏幕截图或渲染的 HTML 内容。然而,这可能只是 URL 检查工具的一个怪癖。它通常不适用于 HTML 以外的其他类型的内容。也有可能渲染器处理 PDF 的部分没有在检查测试中运行,并且 Google 实际上对嵌入的 PDF 进行了索引,但我们希望在信任它之前对其进行进一步测试。 为什么 PDF 不适合 SEO 尽管 Google 会对 PDF 进行索引,有时
也会对 PDF 进行排名,但与网页相比,这种格式有一些缺点。 不适合移动设备。创建的 PDF 是为了在不同设备上看起来一致。换句话说,不存在适合移动设备的 PDF。 缺乏导航。大多数 PDF 不包含导航元素,这使得探索其他内容变得更加困难。 缺少一些 SEO 属性。尽管 PDF 文件具有许多 SEO 元素的等效版本,但也存在许多缺失元素,例如nofollow 、UGC 和赞助等单个链接属性。 可能不会被频繁抓取。由于 PDF 不经常更改,因此对它们进行爬网的频率往往低于更新频繁的页面。 追踪变得更加困难。大多数常见的跟踪器在网页上运行 JavaScript,并且不适用于 PDF 文件。 也就是说,我们理解在某些情况下您可能别无选择,只能使用 PDF 来保存您的内容。如果是这样,请继续阅读以了解如何优化 PDF 以进行搜索。 如何优化 PDF 您习惯在 HTML 中看到的大多数页面 SEO元素在 PDF 中都有等效版本,并且使用方式与以前相同。许多都是出于可访问性的原因。那么我们来谈谈一些优化 PDF 进行 SEO 的方法。 1.写好内容 Google 的企业使命是整合
全球信息。好内容 就是好内容,即使它不是网页。我们在 PDF 中看到了很多精彩内容,包括技术文档和白皮书。网络上的一些最佳信息都隐藏在 PDF 中。 2.添加优化标题 正如网页有标题标签一样,PDF 也有标题。请注意,许多搜索引擎使用标题来描述搜索结果中的文档。如果 PDF 没有标题,则文件名将显示在SERP中。 以下介绍了如何在 Adobe Acrobat Pro 中编辑 PDF 标题。 3.添加优化描述 就像网页的元描述一样,它不是排名因素,而是一种控制搜索结果中出现的文本的方法。 单击文件 > 属性 单击“其他元数据” 编辑描述 4.使用相关的文件名 PDF 文件名成为URL的一部分。这会影响搜索结果中显示的 URL,并且是排名的一个小因素。 单击文件 > 另存为 编辑文件名 5. 包含图像 alt 属性 您可以向 PDF 中的图像添加替代文本 ,以帮助搜索引擎了解图像的内容。