Screaming Frog教程:索引状态、Meta文案、失效链接等四大项目

Screaming Frog报表操作与分析:

Screaming Frog(尖叫青蛙)是一套运行于本机端的SEO网站分析工具,安装完成后输入你想分析的网站 / 网址,它的爬虫-Screaming Frog Spider就会开始爬取网站内容、进行众多on page的SEO分析,例:

  • Page Title、Meta Description的文案分析

  • 是否存在失效的内 / 外部链接,可找出下架的导购链接

  • 是否存在过大的图档

  • 是否有错误的noindex、canonical tag设置

这篇Screaming Frog教学文讲的是报表的操作与分析,不会讲到爬取设置(教学文章)。它可分析的项目应有尽有,以下只会介绍我比较常用的,然后….建议先看看它的设置教学文章,以免跑出来的资料不如预期。文章目录:

  • UI简介

  • 检查索引状态:转向、noindex、Canonical Tag

  • 检查Page Title / Meta Description

  • 检查内部链接

  • 找出失效的外部链接

  • 检查图片:图档大小、失效图档

以下内容对应的软件版本是Screaming Frog 14.1(发布日期:2020 / 12 / 7)、付费版,并没有免费版的诸多限制。关于付费与免费的差别请参考官网说明,免费版只能爬取500个网址、无法调整Configuration!

UI简介:

Screaming Frog的报表分成上层跟下层,各有对应的页签、栏位,不同的页签显示的栏位会有差异。上层报表会列出各网址爬取完之后的重要资讯,例如Status Code、图片大小、Page Title的长度等等;下层报表会显示更多细节,方便加快修正速度。

另一个常用功能是选定网址后按右键,可复制内容、于浏览器开启等等,没好用的!

橘色是上层报表、蓝色是下层报表

上层报表有下列四个功能,善加利用可以加快处理速度,如果用错很可能找不到资料。下层报表也有相关功能但我很少用,就不介绍了。

  • 调整显示的页签:Screaming Frog的上层报表有很多页签,例如Internal、External、URL等等,可以调整要显示哪些页签

  • 调整想搜索的栏位:可以设置输入搜索字串时要系统搜索哪些栏位,有时候找不到资料并不是资料不存在,而是系统没搜索某些栏位的资讯

  • 选择要套用的筛选器:每个页签能用的筛选器不一样,这是非常方便的功能

  • 调整显示的栏位:每一种资料类型都有对应的栏位,可以视情况调整来简化报表,没看到想看的栏位可以去检查这个设置

选择显示的页签

选择要搜索哪些栏位

选择筛选器

选择要显示的栏位

检查索引状态:

顾名思义,就是检查网站是否存在404页面、错误的转向、noindex或Canonical Tag等等跟索引相关的设置。

检查转向:

  • 页签:Internal

  • 筛选器:HTML

  • 检查对象:“Status Code”是“301”的Address

  • 检查事项:“Address”对应的“Redirect URL”是否正确,前者是原始网址、后者是它被转去哪

  • 补充:更多的Status Code可看官网说明,也可用来检查暂时性转向(302)或页面不存在(404)

检查转向设置是否正确

检查noindex

  • 页签:Internal

  • 筛选器:HTML

  • 检查对象:“Indexability Status”是“noindex”的Address

  • 检查事项:确认是否有不该被加上“noindex”的页面,或者你预期有却没出现在这边

页面被noindex不代表错误,甚至有些最好设置noindex

检查Canonical Tag:

  • 页签:Canonicals

  • 筛选器:Canonicalised(页面有Canonical Tag,且不是指向自己)

  • 检查事项:

    • “Address”对应的“Canonical Link Element”是否正确

    • “Occurrences”是否为“1”,“0”代表页面没有Canonical Tag、大于“1”代表页面存在多个Canonical Tag,这些都需修正

  • 注意事项:有时候只是因为网址多了“/”就被判定为Canonicalised,检查没问题就不用理它

Canonical Tag的正确性是检查重点

检查Page Title / Meta Description:

这边的Page Title指的是源码的Title Tag,对应到搜索结果页的标题;Meta Description指的的源码的“meta name=”description””,对应到搜索结果页的描述。

文案过长 / 过短的共通性问题就是Google很可能自行改写,而过长的文案会让搜索结果页截断部分内容、过短的文案代表提供的资讯量过少。

找出过长 / 过短的文案:

以Screaming Frog的页签搭配筛选器(例:Over 554 Pixels)可以轻易找出长度有问题的文案:

检查项目Page TitleMeta Description
页签Page TitlesMeta Description
过长Over 554 PixelsOver 1005 Pixels
过短Below 200 PixelsBelow 400 Pixels

Page Title的长度也是检查重点

注意事项:

  • 桌机SERP显示的Page Title / Meta Description的长度会略短于手机,上述的标准是桌机。我的建议是重要资讯要能在桌机搜索结果页完整呈现,但整体而言长一点无妨

  • 这个修正量力而为,我也没修正全部过长的内容,但是主力页面会仔细检查

  • Page Title / Meta Description过短也很容易导致Google自行调整,还是要看一下

  • 在主选单“Configuration”-“Spider”-“Preferences”可调整过长 / 过短的定义

顺带一提,在上层报表选定网址之后,在下层报表的“SERP Snippet”页签可观看它在SERP的模拟显示,还可切换桌机跟手机!

这是SERP的模拟器

找出过期年份的文案:

如果有在Page Title / Meta Description置放年份,在年度交替时要记得检查一下文案,可使用Screaming Frog的搜索功能快速找到需要调整的页面:

检查项目Page TitleMeta Description
页签Page TitlesMeta Description
搜索栏位TitleMeta Description

每年年底要记得检查Page Title中的年份!

顺带一提,如果你也会在文章名称(就是给USER看的标题)加上年份,那也要顺便检查页签“H1”中的文案是否包含过期年份。通常文章名称对应的HTML标题架构是H1,如果你的网站是H2,那就看H2吧!

检查出现次数:

Page Title跟Meta Description的出现次数也是一个检查重点,两者正确的次数皆为“1”,“0”代表阙漏这些栏位、大于1代表重复出现,皆需要修正。

检查项目Page TitleMeta Description
页签Page TitlesMeta Description
栏位OccurrencesOccurrences
正确次数

即使使用WordPress也要检查,一来原生的WordPress主程序并没有在Meta资讯加上Meta Description,二来即使安装SEO插件,没正确设置还是可能导致Meta资讯没加上Meta Description(参考文章:Yoast SEO教学)。

这是我的测试站,即使安装了Yoast SEO还是要再调整设置,才能让所有的页面都有Meta Description

检查内部链接:

在撰写文章时通常会手动置入内部链接,建议将它纳入检查项目,原因:

  • 修正内部链接的锚文字,例如存在过期的年份

  • 移除已经不存在的内部链接

  • 置换主推文章:我们针对同一个主题写了新文章,想在相关文章主推这篇,但需要保留旧的,这时候便可找出有在哪些页面置入这个旧文章

  • 置换网址:这个是指我们已经在其他页面手动置入一个文章,但该文章被转向到另一篇文章,想在其他页面置换网址

总之,找出特定网址被置放在哪些页面是很常见的操作方式,上面是我比较常遇到的状况,就算遇到也不代表一定要处理(第四项就可忽略)。进行这件是的方式很简单:

  • 先在上层报表“Internal”页签的“Address”点击有问题的网址(例:链接A)

  • 观看下层报表的“Inlinks”页签:该页签会显示有哪些页面上有置放你在上层报表选定的链接

    • 栏位“From”:有置放链接A的页面

    • 栏位“Anchor Text”:链接A的锚文字

    • 修改方式:可能是修正锚文字、移除链接,或者置换成新链接,看你想处理什么问题

以上指的是编辑内容时手动置入的内部链接,如果是位于网站模组或小工具上的内部链接,通常会即时反应系统变动,至少WordPress上是这样。

下层报表的“Inlinks”是我超常使用的报表

找出失效的外部链接:

顾名思义,就是检查网站是否存在回应404的外部链接,并修正错误。先由上层报表找到这些链接:

  • 页签:External

  • 筛选器:HTML

  • 检查转向:

    • 检查对象:“Status Code”是“404”的Address

    • 检查方式:在链接上按右键在点“Open in Browser”,确认是否真的有问题

修正方式:在上层报表选定失效的链接后,观看下层报表的“Inlinks”页签,From”是有置放该链接的网页,看要移除还是更新!

失效的外部链接也是修正重点

就我的经验….真正困难的不是修正“404”页面,而是找出已经下架却不是“404”的页面。以导购来说,电商平台将产品下架之后可能会将该网址转到其他网址(首页或相关的分类页),但对站主来说会希望USER可以连到相关商品页(范例网址:羊角村一日游),这时候就需要:

  1. 找出哪些电商平台页面是下架后转到首页或分类页

  2. 去电商平台搜索是否有替代商品

  3. 在相关页面更新或删除电商平台链接

要进行这件事建议用Redirect Chain的报表来分析,我会另文说明。

检查图片:

  • 筛选器:Images

  • 页签:Internal

  • 检查建议:

    • 特色图片:400kb

    • 内文图片:2ookb

    • Status Code:是否存在404(图片被删除,显示在前端就是破图)

    • Size:是否存在图档过大,我的标准:

用这方式可以快速找出有问题的图片

找到这些有问题的图片之后,在上面报表区块点击该图片的Address,在下层报表就可以看到更多详细资料:

  • 页签:Image Details

  • From:哪些网页有使用这张图片,一张图用在多个网页很正常,上传修正好的图片后,这些网页都要调整。如果“From”没显示资料,可能代表该图片没用在任何页面

  • Alt Text:该图片有无附加的Alt Text,是否修正看自己….并不是每张图片都需要有

  • 最右边会出现缩图,可以快速判断到底是哪张图有问题

找到须修正的图片后,要搭配下层报表的资讯来调整

其他报表:

以上报表跟分析方式是我常用的,有时间的话也可看看下面报表(页签):

  • 上层报表-H1与H2:检查网页是否存在H1跟H2。以WordPress来说,商品或文章应该都要有,分类页或标签页要看版型设计,有问题也不是很好调整

  • 上层报表 – Content:会统计内容字数,可找出Thin Content

  • 下层报表-URL Details:可查看上层报表选定URL的更多细节,蛮值得一看得

  • 下层报表-Outlinks:可查看上层报表选定的URL其页面有置放哪些网址链接(就是它可以连去哪!)

心得:

要善用这篇Screaming Frog教学分享的报表与分析有两个前提:有基础的SEO知识、知道自己想达成怎样的结果。有些分析没有一定的对错(例:页面被加上noindex不代表一定有问题),端看你希望达成怎样的结果。若不清楚自己的目标是什么,其实强大的网站分析工具如Screaming Frog也帮不上忙。

老话一句….爬取的设置很重要,建议先看看这一篇文章,然后….完成爬取后可由主选单“File”-“Save As”储存爬取结果,留待之后慢慢分析。若是用来爬取公司网站,开始前建议跟网管人员沟通一下,以免突然间有爬虫爬取大量网页他们却不知道发生何事。