自定义Hugo的RSS模板
Hugo在生成网站时会默认为用户生成对应的RSS文件,然而Hugo默认生成的RSS订阅源中包含文章的全部内容。虽然这样能极大程度上得给用户提供便捷,但同时会增加文章被爬虫盗取导致版权问题的风险。
因此本文的主要内容是介绍如何自定义Hugo的RSS模板。
RSS简介
RSS全称为Really Simple Syndication,是一种简单易用的为用户提供信息聚合方式的规范。其语法相对简单且受到的支持较为广泛,因此非常适合于博客、新闻等网站。
RSS的语法在此就不再赘述,想要具体了解的读者可以查看我的另一篇文章RSS语法简介。
Hugo默认的RSS模板
根据每个人选择的主题的不同,RSS代码可能略有不同,但殊途同归一通百通。
我目前使用的是Academic主题,Academic主题中的RSS模板位于themes/academic/layouts/_default/rss.xml
,模板内容如下所示:
{{- /* Generate RSS v2 with full page content. */ -}}
{{- /* Upstream Hugo bug - RSS dates can be in future: https://github.com/gohugoio/hugo/issues/3918 */ -}}
{{- $page_context := cond .IsHome site . -}}
{{- $pages := $page_context.RegularPages -}}
{{- $limit := site.Config.Services.RSS.Limit -}}
{{- if ge $limit 1 -}}
{{- $pages = $pages | first $limit -}}
{{- end -}}
{{- printf "<?xml version=\"1.0\" encoding=\"utf-8\" standalone=\"yes\" ?>" | safeHTML }}
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
<channel>
<title>{{ if ne .Title site.Title }}{{ with .Title }}{{.}} | {{ end }}{{end}}{{ site.Title }}</title>
<link>{{ .Permalink }}</link>
{{- with .OutputFormats.Get "RSS" }}
{{ printf "<atom:link href=%q rel=\"self\" type=%q />" .Permalink .MediaType | safeHTML }}
{{ end -}}
<description>{{ .Title | default site.Title }}</description>
<generator>Source Themes Academic (https://sourcethemes.com/academic/)</generator>
{{- with site.LanguageCode }}<language>{{.}}</language>{{end -}}
{{- with site.Copyright }}<copyright>{{ replace (replace . "{year}" now.Year) "©" "©" | plainify }}</copyright>{{end -}}
{{- if not .Date.IsZero }}<lastBuildDate>{{ .Date.Format "Mon, 02 Jan 2006 15:04:05 -0700" | safeHTML }}</lastBuildDate>{{ end -}}
{{- if .Scratch.Get "og_image" }}
<image>
<url>{{ .Scratch.Get "og_image" }}</url>
<title>{{ .Title | default site.Title }}</title>
<link>{{ .Permalink }}</link>
</image>
{{end -}}
{{ range $pages }}
<item>
<title>{{ .Title }}</title>
<link>{{ .Permalink }}</link>
<pubDate>{{ .Date.Format "Mon, 02 Jan 2006 15:04:05 -0700" | safeHTML }}</pubDate>
<guid>{{ .Permalink }}</guid>
<description>{{ .Content | html }}</description>
</item>
{{ end }}
</channel>
</rss>
可以看到其中就是较为清晰明了的RSS文件格式。为了防止爬虫通过RSS盗取文章内容,我希望将RSS中的正文替换为摘要部分,并为读者增加跳转到原文的链接。
RSS模板的修改
自定义模板的路径
在Hugo官网上我们可以了解到Hugo在生成RSS文件时模板的查询顺序如下所示:
[layouts/index.rss.xml layouts/home.rss.xml layouts/rss.xml layouts/list.rss.xml layouts/index.xml layouts/home.xml layouts/list.xml layouts/_default/index.rss.xml layouts/_default/home.rss.xml layouts/_default/rss.xml layouts/_default/list.rss.xml layouts/_default/index.xml layouts/_default/home.xml layouts/_default/list.xml layouts/_internal/_default/rss.xml]
因此我们只要在项目路径下的layouts/_default
文件夹(如不存在该文件夹则按照路径创建即可)中新建一个rss.xml
文件,并写入我们希望的模板即可。
编写自定义模板
通过对Academic默认RSS模板代码的阅读我们可以发现,在每一个<item>
中,其<description>
代码为:
<description>{{ .Content | html }}</description>
可以看到其默认状态下放入的为文章的内容,我们只需将.Content
替换为.Summary
即可只在RSS中加入摘要。
同时我们为了令读者能轻松便捷地阅读全文,还应加入一个阅读原文的链接。原文的链接可以通过.Permalink
进行获取。
然而由于我的博客是一个双语博客,“阅读全文”的提示应该能根据语言进行变化,而不能仅仅将其写为字符串。好在Hugo支持多语言,因此我们可以通过此实现多语言提示。
在Academic主题默认的i18n文件中正好有id为more_pages
的一项对应“查看全部”,因此可以直接在模板中使用这一项。在Hugo中只要使用{{i18n "more_pages"}}
即可代表此处是id为more_pages
的值。
综合以上多种修改,我们只需将
<description>{{ .Content | html }}</description>
改为
<description>{{ .Summary | html }}{{ printf "<br />" }}{{i18n "more_pages"}}: {{ .Permalink }}</description>
即可。
后记
RSS本应是一种为读者提供方便的信息聚合的方式。然而由于爬虫的泛滥,使得人们不得不对RSS的内容进行保护,也因此不得不在一定程度上损伤了读者的便利性。其中的平衡还需不断进行调整。
本文首发于我的个人博客wangchucheng.com。
原文链接:https://wangchucheng.com/zh/posts/hugo-rss-template/
本博客文章除特别声明外均为原创,采用CC BY-NC-SA 4.0 许可协议进行许可。超出CC BY-NC-SA 4.0 许可协议的使用请联系作者获得授权。