尖叫青蛙 screaming frog seo spider 中文使用设置教程

你可能知道 SEO 搜索引擎优化对网站与营销非常重要,但你的网站是否适合 SEO 呢?

优化网站是一个持续的过程,需要不断查看,并在必要时候进行更改或修复。然而,这是一件苦差事,借助分析工具将会是非常省力的一种捷径,透过 SEO 分析工具能更快速找到网站不足之处,进而改善网站弱点。

但是,这几乎会跟预算有关系,很多人不想为此付出代价,对吧。没关系,我有一个好消息要给你…你可以完全免费使用一套 SEO 分析工具来检测自己的网站,当然也能用于分析对手网站。

你的网站上有多少破损的超链接?有多少失效的图片?哪些网页缺少 Meta?有缺少 H1 标签吗?

要了解以上这些问题的答案,可以通过手动检查网站,或者可以使用接下来页介绍的 Screaming Frog 为你处理这个繁琐的过程,它会自动生成报告以便让你快速找到错误。换句话说,假如你担心网站可能有 SEO 方面的问题,那么你应该尝试 Screaming Frog。

Screaming Frog 简介

Screaming Frog-https://www.screamingfrog.co.uk/seo-spider/

Screaming Frog 像是一个爬虫机器,会在整个网站中分析与寻找问题。以下我会介绍如何使用它,以便让你决定是否适合你和实际操作。这是一套需要安装在电脑中的 SEO 分析软件,Windows 与 Mac 电脑都有支援,这是相对麻烦的地方,因为你无法直接用手机进行检测分析。

此外,Screaming Frog 就像许多其他营销工具一样,可以免费试用,而且没有试用的时间限制。不过使用免费版本,将被限制只能抓取 500 个页面数量。500 个页面数量并不等于 500 个网页,它包括所有图片以及网站上的任何其他文件。

虽然你无法从免费版本中获得完整的功能,但这对许多网站来说已经够用了;假设你的网站属于中大型规模,则需要付费升级到付费版本。

Screaming Frog 优点和缺点

与任何其他数码工具一样,它不是完美的,以下是我认为这个工具的优缺点:

优点:

・易于理解的操作界面
・抓取网站资讯非常快速
・可以输出分析数据
・有免费版本可以使用

缺点:

・需要下载软件才能使用
・数据呈现的方式不够友好
・免费版本功能有限制

安装 Screaming Frog

到首页点选 Download 按钮,接着将会自动侦测你的电脑系统,并弹跳下载软件的视窗。

完成安装并开启软件之后,只需输入网站的网址,软件就会自动开始抓取每个页面。

标签重点介绍

一旦 Screaming Frog 完成网页抓取,有许多资讯可以查看,它全部归类并放入个别的标签选单中。在接下来我将介绍重点标签选项。

►Internal

Internal 提供有关网站的所有详细资讯,每一行代表一个单独的网页网址。

对于每个网址而言,你可以看到重要资讯,例如:状态码(200表示成功没问题)、页面标题、Meta 描述、h1h2、图片和字数。这是最好的分析起点,这就是为什么它也是第一标签。

►External

不出所料,External 将显示有关外部网址的资讯。虽然无法像在 Internal 那样看到有关外部网址的详细资讯,但仍然可以获得有用的资讯,例如:内容类型、状态码以及指向网址的链接数量。

►Protocol

这会显示哪些页面使用 https 安全传输协议,哪些页面使用 http。每行还会显示已抓取的网址的状态码和内容类型。

►Response Codes

Response Codes 可以快速查看网站上哪些页面是良好响应状态(200),是 404 代码则是找不到;有时候也会显示 301 重定向和服务器错误 5XX。

►URL

URL 标签包括与 URL 相关的数据,也包含有关每个 URL 的资讯

►Page Titles

页面标题对 SEO 效益有很高的重要性,这个标签会包含每个网址的标题资讯,也会显示缺少标题、重复标题和标题字数。

►Meta Description

在 Meta 描述标签中,你会看到页面上 Meta 描述内容和长度,也会显示缺少 Meta 描述与重复的页面。

►Meta Keyword

Google 现在忽略了 Meta 关键字,所以基本上你可以忽略此标签,但某些情况下它可能可以帮助你了解是否有不必要存在的。

►H1、H2

H1 标签是站内 SEO 的另一个重要部分,在这里可以知道是否有设置 H1,以及了解那些页面有缺失 H1、重复 H1。而 H2 标签跟H1标签是一样的功能,只是针对的是 H2。

►Images

Screaming Frog不只是抓取文字内容,它也会抓取图片,这部分可以了解哪些图片是不是过大、缺少 alt 以及是否能被索引。

►hreflang

如果你的网站具有不同语系,hreflang 将会很有价值,它会显示每个页面上 hreflang 属性的详细资讯,否则你可以忽略它。

以下是官方的操作展示影片,你会发现检测速度非常快,操作上完全不复杂。

Spider的设置:

设置路径:主选单“Configuration”-“Spider”。

这是很重要的设置,建议开始爬取前要先调整好。这边列出的设置是我会特别注意的,并不是全部功能,完整的功能请参考官方文件。

Crawal:

这边分成是否爬取跟是否储存,我会注意的地方:

Images:

是否爬取、储存图片?如果你只是要爬取Title、Meta描述等资料,其实可以不用爬取图片,节省处理时间,这时候可以勾选。但它只会排除<img src=””>中的图片连结,如图片是放在背景或者是<img src set=””>,就还是会被爬取,等等会说明如何排除

Follow External “nofollow”:建议勾选

如果没勾取这个设置,加上rel=”nofollow”的外部连结会被Spider忽略,这会导致你的外部连结资料不完整。以我为例,Booking.com的导购连结都被我加上nofollow,如果没勾选这选项,Spider就不会爬取这些连结,我便不会知道这些连结是否有问题!

这两个建议勾选,以免忽略了被加上rel=”nofollow”的连结

Extraction:

这边的意思就是撷取哪些资料显示在报告,通常H1、H2、Meta Description、Page Title、Indexability是必要的,Meta Keywords、Hash Value则可以忽略。但还是要看情况,例如….想知道哪些网页塞了早就被弃用的Meta Keywords,就要撷取这个资讯。

Advanced:

Always Follow Redirects:建议勾选

这个建议勾选,这样Spider遇到网页被转向时,才会一路爬下去看这个网址被转几次、被转去哪、最后的response code是什么、是否造成redirect loop。简而言之,就是转向设置是否有误、需要修正,需要搭配Redirection Chains的报告来判断。

Always Follow Canonicals:建议勾选

意义同上述的“Always Follow Redirects”,只是这是用来判断Canonical(标准网址)的设置。正常来说如果A是某个网页的标准网址,它的标准网址也要是自己才对,如果A是B的标准网址,但A的标准网址是C,这时候应该要将B的标准网址设置为C,而不是A。更惨的是….B的标准网址是A、A的标准网址是B,变成一个无限回圈。

建议勾选这个设置再搭配Canonical Chains的报告来判断。

建议勾选这两个功能,后续才好进行Redirection Chains跟Canonical Chains的分析

爬取时排除特定网址:

设置路径:主选单“Configuration”-“Exclude”。

前面有提到如果只是想分析Page Title、Meta Description等文字资料,可以不要爬取图片,减轻系统负担、加快处理速度。而上述说明排除图片的设置有所限制,所以呢….就可由这功能处理!

  • 排除图档:.*jpg$

  • 排除特定资料夹

    • 以排除WordPress的/wp-content/目录为例:https://www.wpandseo.tw/wp-content/.*(网域请替换成你想爬取的目标)

    • 若想爬取的网站是以WordPress架站,你只想分析Page Title、Meta Description等文字资料,可用这方式加快处理速度

  • 更多运用方式请参考官方文件

这功能非常好用!

爬取模式:

设置路径:主选单的“Mode”,分成“Spider”、“List”、“SERP”,详情请看官方文件(最下方的“Mode”)。

  • Spider:预设的模式,会爬取网站所有网址,也可爬取根网域或子目录,请参考官方文件

  • List:只爬取特定网址,需手动输入网址或上传档案,蛮好用的

    • 先取得外部连结清单再用这模式爬取,然后看Redirection Chains报表。爬取时要注意前面提到的“Always Follow Redirects”设置

    • 官方文件写得很清楚,值得一看!

    • 应用 2 -确认特定外部连结是否失效:

    • 应用 1 – 爬取特定网页生成XML Sitemap:可先用List模式爬取,再使用生成XML Sitemap的功能(为何要做这件事?请参考这一篇文章)

  • SERP:我没用过

上面是Spider模式,下面是List

生成XML Sitemap:

设置路径:主选单的“Sitemaps”,除了一般网址的XML Sitemap,也提供图片的。

我是使用WordPress架站,很少使用这功能,除非….我需要生成一份只含特定连结的XML Sitemap(实际案例)。注意事项:

  • 须先完成爬取才能生成XML Sitemap

  • 生成XML Sitemap之后要上传到主机空间再提交到Google Search Console(相关教学)

  • Screaming Frog的XML Sitemap并不会伴随网站自动更新,网站有变动就需要再执行一次,所以….这只是应急的做法!

我用Screaming Frog产生的XML Sitemap

其他设置:

这篇Screaming Frog教学无法讲完所有的设置,太多了!下列功能也蛮有趣的,可以看一下:

  • Storage Mode:预设是Memory Storage,如果爬取大量网页可能会出问题,可考虑切换到Database Storage(官方说明)

  • 封锁Screaming Frog的爬虫:如果你的网站不想被Screaming Frog爬取,可在Robots.txt加上设置,想爬取时要记得修改(官方说明)

储存设置档:

Screaming Frog可设置的功能很多,每次使用都要重新设置会很烦人,所以它提供了储存设置档的功能,有两种:

主选单“File”-“Configuration”-“Save As”

这个功能会将你在主选单“Configuration”中调整的设置,包含上述的Spider设置、排除网址等等,存成一个设置档,之后想使用时要“开启”这个档案。除了节省调整设置的时间,Screaming Frog的排程功能(Scheduling)也需要这个设置档,时间到了它才知道该怎样爬取网站,可参考官网说明。

主选单“File”-“Configuration”-“Save Current Configuration as Default”

这个功能会将你在主选单“Configuration”中调整的设置,包含上述的Spider设置、排除网址等等,设置为“预设值”,之后开启Screaming Frog就会自动套用该设置,不用像上面方式还需要开启设置档。想清除该预设值就点主选单“File”-“Configuration”-“Clear Default Configuration”。

这两种方式各有优缺,第一个的缺点当然就是需要手动开启设置档,好处是可以储存很多个设置档供不同情境下套用,而且Screaming Frog的排程功能(Scheduling)也需要这个设置档,时间到了它才知道该怎样爬取网站(官网说明)。

第二个方式的好处就是快速、不用多一个开启设置档的动作,坏处就是….预设值只能有一个,而且排程功能一定要搭配一个设置档,无法使用预设值。

所以比较好的方式就是将最常用的设置指定为预设值、将其他会重复使用的设置存为设置档,如果你的排程想要套用预设值,也要将它存为设置档。

设置档是建立Screaming Frog排程的必要档案!

其他应用补充

►查找非安全网页

对于非安全页面会影响搜索引擎与受众对你的信任度,Screaming Frog 可以导出糗含所有非安全页面的所有资料。只需到Reports并选择Insecure Content。

导出后你需要对非安全网页进行修复,确保都是 https 而不是 http,或者避免混合内容。假如你想了解更多 https 的资讯,可以参考这篇文章:为什么网站需要 https?

►制作网站地图

网站地图可以让搜索引擎机器人更好地抓取网站资料,Screaming Frog也可以帮助创建网站地图。

在选单中选择Sitemap和Create XML sitemap(保留预设设置),再点击Next就可以创建XML网站地图。完成后再将其上传或更新到网站,当然这一项功能不是必用的,是针对网站功能缺乏而提供的。

►找到速度缓慢页面

网站加载速度是 SEO 搜索排名因素之一,也会影响转化率。Screaming Frog 可以告诉伺服服器是否存在问题,可以从 Response Time 进行了解,以便将焦点放在需要帮助加快载入速度的页面上。

最后我想说的是……

Screaming Frog 不是全能的 SEO 分析工具,但它确实在分析页面资讯上非常便捷快速,而且还是免费就足够堪用的小帮手。虽然市场上还有其他类似的工具,但 Screaming Frog 我认为是该领域佼佼者,以及我个人的使用偏好。

重要的是它有付费版本,所以有资源可以维护相对来说更能跟上行业的所有变化,无论选择使用免费版本还是付费版本,Screaming Frog 都是不可或缺的 SEO 分析工具之一。

除了知道如何使用这套软件之外,更重要的是适时调整、修改网站的意愿与能力,否则就算找出问题也没有任何帮助呢。