前言
我们个人的博客网站,每发布一篇新的文章。当然是希望各大搜索引擎能尽快进行收录。
因为只有收录了才有希望能够被网友们搜索到。
下面主要介绍一下,国内的几个搜索平台的收录(ps:神马搜索一直无法认证,我也无语了)
关于收录平台我有一篇文章介绍过,不太了解的话可以看看:自建网站,必须了解的各搜索网站的收录平台,以及seo概念的通俗解释 (zinyan.com)
介绍
我们要提高搜索引擎对我们的收录,就不能坐等爬虫爬取。否则速度比较慢。
这个时候我们需要主动将最新的文章的链接提供给各大搜索平台。
这个操作就是所谓的链接收录了。
1. 百度收录 :https://ziyuan.baidu.com/
百度主要有两种:快速收录和普通收录。
如果要开通快速收录,我们需要建立一个百度小程序,否则百度不给你权限。
而普通收录主要分为:
- API 提交:需要我们进行接口开发,如果不太了解后台开发的小伙伴。使用起来有点麻烦
- sitemap提交:方式简单,我们在自己的官网上放一个txt或xml文件。然后手动操作
- 手动提交:最简单方法,直接复制你的链接进行提交收录。
上面的方法也是逐步降低使用门槛的。但是后果就是繁琐,需要我们主动进行维护和提交。
1.1 使用sitemap
我们在自己的博客存储一个sitemap文件。然后将该文件的链接告诉给百度。每一段时间更新一下该文档。
可以实现批量的收录导入功能。
百度会周期性的抓取检查我们提交的Sitemap文件,对其中的链接进行处理,但收录速度慢于API推送。
sitemap的文档格式主要有txt和xml 。也就是说我们在服务器上创建一个xxx.txt或xml 文件然后将文件访问地址告诉百度
就可实现sitemap收录了。
txt文本格式:
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html
xml文本格式:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->
<url>
<!--必填,URL链接地址,长度不得超过256字节-->
<loc>http://www.yoursite.com/yoursite.html</loc>
<!--可以不提交该标签,用来指定该链接的最后更新时间-->
<lastmod>2009-12-14</lastmod>
<!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->
<changefreq>daily</changefreq>
<!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->
<priority>0.8</priority>
</url>
<url>
<loc>http://www.yoursite.com/yoursite2.html</loc>
<lastmod>2010-05-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
- 每个sitemap文件包含的网址不能超过5万条
- 每个文件大小不能超过10MB
其他的细节就不说了。
1.2.使用百度统计js,自动提交收录
其实sitemap只是适用于已有大量网站,但是未进行收录的情况。
我们不能每写一条文章发表,就弄一个sitemap文件吧。那也太复杂了。
针对这种需求,百度统计JS实现了自动收录功能。也就是说我们网站如果使用的百度js。那么当我们的页面被访问的时候
会自动推送到百度收录库中等待百度进行收录。
我现在使用的joe2 的主题也支持了自动提交收录,采用的是api提交方式。
我们如果使用api收录,然后再使用统计js进行收录。两种重复提交不会有影响。我们可以放心使用。
2. 360收录:https://zhanzhang.so.com/
就我个人在360收录上的使用来看,没有百度收录快。也许连搜狗搜索的收录速度都比不上。
在它的站长平台上也有三种收录,
- sitemap提交:参考上面的百度的sitemap收录。过程是一样的,也是访问我们自己网站的sitemap文件进行收录。
- URL收录:我们主动添加url链接然后进行收录。每次5条(不好用)
- 自动收录:这个方法是通过内置js到我们的网页中,当网页被访问的时候。自动收录(官方说已经停止维护了。)
我们能用的也就是sitemap收录了。
2.1 sitemap
使用sitemap 的要求是:
- 单个Sitemap文件:大小不超过10MB,且包含不超过5万个网址。如果网站所包含的网址超过5万个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中
- 单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口
- 您可以采用如下三种格式的文件向360搜索提交Sitemap,文件编码可以是UTF-8或GBK:
1)标准的XML格式文件
2)文本格式文件
3)Sitemap索引文件(可同时包含多个Sitemap文件)
其实和百度的sitemap文件的要求差不多。
xml文档格式:
<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
<!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->
<url>
<!--必填,URL长度限制在256字节内-->
<loc>http://www.xxxxxx.html/000000.html</loc>
<!--更新时间标签,非必填,用来表示最后更新时间 -->
<lastmod>2012-12-01</lastmod>
<!--更新频率标签,非必填,用来告知引擎页面的更新频率有效值为:always、hourly、daily、weekly、monthly、yearly、never -->
<changefreq>daily</changefreq>
<!--优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级-->
<priority>0.8</priority>
</url>
<url>
<loc>http://www.xxxxxx.html/000001.html</loc>
<lastmod>2012-12-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
txt文件格式:
http://www.xxxxxx.html/101562698_5230191316.html
http://www.xxxxxx.html/101586283_5230215075.html
http://www.xxxxxx.html/101639435_5230310576.html
索引文件格式:(适用于数据较多的情况下。)
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex>
<sitemap>
<loc>http://www.example.com/1.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/2.xml</loc>
<lastmod>2012-12-01</lastmod>
</sitemap>
</sitemapindex>
上面的loc 是其他的sitempa文件对象。因为上面已经说了一个文件不能超过10M。5万条数据。
3. 搜狗收录:https://zhanzhang.sogou.com/index.php/site/index
搜狗搜索收录就更简陋了。它默认不支持sitemap收录。需要我们自己主动收录。
也就是说我们需要手动在它的管理台上填写url进行收录。
除非你的网站权重高,主动找官方给你开通sitemap收录。否则现在是没有的。
然后我们在上面主动提交链接的话,每天只能提交20条url。
直接将我们的url 复制上去就可以了。
到这里,我们的收录就提交完毕了。剩下的就是等待搜索平台审核链接了。
之后需要慢慢等待了,注意更新你的网站内容。否则搜索引擎会判断网站质量不行减少收录。
我们提交的链接也不一定会全部进行收录。搜索引擎的算法会过滤和检测我们的链接指向的网站资源。如果内容质量太差或者已经网上已经存在了大量的相同的资料,那么就会被搜索算法抛弃掉。
参考资料
百度统计升级网页实时推送至搜索引擎功能,提升网页抓取速度!【吧】_百度贴吧 (baidu.com)
评论区