侧边栏壁纸
博主头像
Z同学博主等级

工作磨平激情前,坚持技术的热忱。 欢迎光临Z同学的技术小站。 分享最新的互联网知识。

  • 累计撰写 290 篇文章
  • 累计创建 57 个标签
  • 累计收到 98 条评论

个人网站收录数据提交,360,百度,搜狗

Z同学
2022-01-18 / 0 评论 / 1 点赞 / 646 阅读 / 4,363 字
温馨提示:
本文最后更新于 2022-01-22,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

前言

我们个人的博客网站,每发布一篇新的文章。当然是希望各大搜索引擎能尽快进行收录。

因为只有收录了才有希望能够被网友们搜索到。

下面主要介绍一下,国内的几个搜索平台的收录(ps:神马搜索一直无法认证,我也无语了)

关于收录平台我有一篇文章介绍过,不太了解的话可以看看:自建网站,必须了解的各搜索网站的收录平台,以及seo概念的通俗解释 (zinyan.com)

介绍

我们要提高搜索引擎对我们的收录,就不能坐等爬虫爬取。否则速度比较慢。

这个时候我们需要主动将最新的文章的链接提供给各大搜索平台。

这个操作就是所谓的链接收录了。

1. 百度收录 :https://ziyuan.baidu.com/

百度主要有两种:快速收录和普通收录。

如果要开通快速收录,我们需要建立一个百度小程序,否则百度不给你权限。

image-20220118141317944

而普通收录主要分为:

  • API 提交:需要我们进行接口开发,如果不太了解后台开发的小伙伴。使用起来有点麻烦
  • sitemap提交:方式简单,我们在自己的官网上放一个txt或xml文件。然后手动操作
  • 手动提交:最简单方法,直接复制你的链接进行提交收录。

上面的方法也是逐步降低使用门槛的。但是后果就是繁琐,需要我们主动进行维护和提交。

1.1 使用sitemap

我们在自己的博客存储一个sitemap文件。然后将该文件的链接告诉给百度。每一段时间更新一下该文档。

可以实现批量的收录导入功能。

百度会周期性的抓取检查我们提交的Sitemap文件,对其中的链接进行处理,但收录速度慢于API推送

sitemap的文档格式主要有txt和xml 。也就是说我们在服务器上创建一个xxx.txt或xml 文件然后将文件访问地址告诉百度

就可实现sitemap收录了。

txt文本格式:

http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html  

xml文本格式:

<?xml version="1.0" encoding="utf-8"?>
<!-- XML文件需以utf-8编码-->
<urlset>
 <!--必填标签,这是具体某一个链接的定义入口,每一条数据都要用<url>和</url>包含在里面,这是必须的 -->
    <url>
       <!--必填,URL链接地址,长度不得超过256字节-->
        <loc>http://www.yoursite.com/yoursite.html</loc>
        <!--可以不提交该标签,用来指定该链接的最后更新时间-->
        <lastmod>2009-12-14</lastmod>
        <!--可以不提交该标签,用这个标签告诉此链接可能会出现的更新频率 -->
        <changefreq>daily</changefreq>
         <!--可以不提交该标签,用来指定此链接相对于其他链接的优先权比值,此值定于0.0-1.0之间-->
        <priority>0.8</priority>
    </url>
    <url>
        <loc>http://www.yoursite.com/yoursite2.html</loc>
        <lastmod>2010-05-01</lastmod>
        <changefreq>daily</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>
  • 每个sitemap文件包含的网址不能超过5万条
  • 每个文件大小不能超过10MB

其他的细节就不说了。

1.2.使用百度统计js,自动提交收录

其实sitemap只是适用于已有大量网站,但是未进行收录的情况。

我们不能每写一条文章发表,就弄一个sitemap文件吧。那也太复杂了。

针对这种需求,百度统计JS实现了自动收录功能。也就是说我们网站如果使用的百度js。那么当我们的页面被访问的时候

会自动推送到百度收录库中等待百度进行收录。

image-20220118120012814

我现在使用的joe2 的主题也支持了自动提交收录,采用的是api提交方式。

我们如果使用api收录,然后再使用统计js进行收录。两种重复提交不会有影响。我们可以放心使用。

2. 360收录:https://zhanzhang.so.com/

就我个人在360收录上的使用来看,没有百度收录快。也许连搜狗搜索的收录速度都比不上。

image-20220118141252988

在它的站长平台上也有三种收录,

  • sitemap提交:参考上面的百度的sitemap收录。过程是一样的,也是访问我们自己网站的sitemap文件进行收录。
  • URL收录:我们主动添加url链接然后进行收录。每次5条(不好用)
  • 自动收录:这个方法是通过内置js到我们的网页中,当网页被访问的时候。自动收录(官方说已经停止维护了。)

image-20220118141447009

我们能用的也就是sitemap收录了。

2.1 sitemap

使用sitemap 的要求是:

  1. 单个Sitemap文件:大小不超过10MB,且包含不超过5万个网址。如果网站所包含的网址超过5万个,则可将列表分割成多个Sitemap文件,放在Sitemap索引中
  2. 单个Sitemap索引文件:大小不能超过500M,如果超过请提交多个Sitemap索引文件接口
  3. 您可以采用如下三种格式的文件向360搜索提交Sitemap,文件编码可以是UTF-8或GBK:
    1)标准的XML格式文件
    2)文本格式文件
    3)Sitemap索引文件(可同时包含多个Sitemap文件)

其实和百度的sitemap文件的要求差不多。

xml文档格式:

   <?xml version="1.0" encoding="utf-8"?>
   <!-- XML文件需以utf-8编码-->
   <urlset>
        <!--必填,定义某一个链接的入口,每一条数据必须要用<url>和</url>来标示 -->
       <url>
           <!--必填,URL长度限制在256字节内-->
           <loc>http://www.xxxxxx.html/000000.html</loc>
		  <!--更新时间标签,非必填,用来表示最后更新时间 -->
           <lastmod>2012-12-01</lastmod>
           <!--更新频率标签,非必填,用来告知引擎页面的更新频率有效值为:always、hourly、daily、weekly、monthly、yearly、never -->
           <changefreq>daily</changefreq>
           <!--优先权标签,优先权值0.0-1.0,用来告知引擎该条url的优先级-->
           <priority>0.8</priority>
       </url>
       <url>
           <loc>http://www.xxxxxx.html/000001.html</loc>
           <lastmod>2012-12-01</lastmod>
           <changefreq>daily</changefreq>
           <priority>0.8</priority>
       </url>
   </urlset>

txt文件格式:

http://www.xxxxxx.html/101562698_5230191316.html
http://www.xxxxxx.html/101586283_5230215075.html
http://www.xxxxxx.html/101639435_5230310576.html  

索引文件格式:(适用于数据较多的情况下。)

   <?xml version="1.0" encoding="UTF-8"?>
   <sitemapindex>
     <sitemap>
       <loc>http://www.example.com/1.xml</loc>
       <lastmod>2012-12-01</lastmod>
     </sitemap>
     <sitemap>
       <loc>http://www.example.com/2.xml</loc>
       <lastmod>2012-12-01</lastmod>
     </sitemap>
   </sitemapindex>

上面的loc 是其他的sitempa文件对象。因为上面已经说了一个文件不能超过10M。5万条数据。

3. 搜狗收录:https://zhanzhang.sogou.com/index.php/site/index

搜狗搜索收录就更简陋了。它默认不支持sitemap收录。需要我们自己主动收录。

也就是说我们需要手动在它的管理台上填写url进行收录。

image-20220118142553700

除非你的网站权重高,主动找官方给你开通sitemap收录。否则现在是没有的。

然后我们在上面主动提交链接的话,每天只能提交20条url。

image-20220118142706849

直接将我们的url 复制上去就可以了。

到这里,我们的收录就提交完毕了。剩下的就是等待搜索平台审核链接了。

之后需要慢慢等待了,注意更新你的网站内容。否则搜索引擎会判断网站质量不行减少收录。

我们提交的链接也不一定会全部进行收录。搜索引擎的算法会过滤和检测我们的链接指向的网站资源。如果内容质量太差或者已经网上已经存在了大量的相同的资料,那么就会被搜索算法抛弃掉。

参考资料

百度统计升级网页实时推送至搜索引擎功能,提升网页抓取速度!【吧】_百度贴吧 (baidu.com)

平台工具使用手册_普通收录_搜索学堂_百度搜索资源平台 (baidu.com)

主动收录中的自动推送出错且影响到首页打开速度了_360社区

360自动收录的代码还有用吗?_360社区

sitemap提交_360搜索使用帮助 (so.com)

1

评论区