欢迎光临
我们一直在努力

WordPress禁止SemrushBot蜘蛛爬取网站

用WordPress做了一个搜索记录功能,用于搜集用户的喜好,结果作者发现经常有莫名其妙的搜索记录,每天大概有1000多次的搜索量,WordPress自带的搜索非常耗资源,打开网站日志发现,发现很来自国外的垃圾营销蜘蛛SemrushBot的搜索,在宝塔防火墙中屏蔽IP也无效,网上找了一下,现成的代码:

#禁止垃圾蜘蛛抓取
if ($http_user_agent ~* (SemrushBot|python|Linespider|crawler|DingTalkBot|simplecrawler|ZoominfoBot|zoombot|Neevabot|coccocbot|Facebot|YandexBot|Adsbot|DotBot|Applebot|DataForSeoBot|MJ12bot|BLEXBot|trendictionbot0|trendictionbot|AhrefsBot|hubspot|opensiteexplorer|leiki|webmeup)) { return 444;}

以宝塔为例,将上代码加到站点配置文件,最后一个”}“前面,当这些垃圾蜘蛛访问网站,只能得到444 没有任何数据。

再加个当链接中包含/search/重定向到其它页面。

代码添加到主题函数模板中:

// 当URL包含 /search/重定向
add_action('template_redirect', 'custom_search_redirect');
function custom_search_redirect() {
  // 获取当前请求的URL
  $request_url = $_SERVER['REQUEST_URI'];    
  // 检查当前URL是否包含 /search/
  if (strpos($request_url, '/search/') !== false) {
    // 如果是,则进行重定向到其他页面
    wp_redirect('https://www.baidu.com/');
    //wp_redirect(home_url('/new-page/'), 301);
    exit();
  }
}

作者说观察一段再说吧,估计还是不能完全拦截。

上一篇:WordPress禁止用户访问sitemap,只允许搜索引擎蜘蛛访问方法
下一篇:返回列表

WordPress禁止SemrushBot蜘蛛爬取网站插图虚位以待

WordPress禁止SemrushBot蜘蛛爬取网站插图1虚位以待
虚位以待

WordPress禁止SemrushBot蜘蛛爬取网站插图赞助
WordPress禁止SemrushBot蜘蛛爬取网站插图2虚位以待
最新更新
  • 01

    WordPress禁止SemrushBot蜘蛛爬取网站
    2周前

  • 02

    WordPress禁止用户访问sitemap,只允许搜索引擎蜘蛛访问方法
    2个月前

  • 03

    WordPress外部链接自动加nofollow标签函数分享
    4个月前

  • 04

    wordpress定时采集发布知乎《每天60秒》
    4个月前

  • 05

    WordPress评论必须中文+禁止外链方法
    4个月前

热门推荐
  • 01

    如何关闭WordPress顶部工具栏方法
    796热度

  • 02

    wordpress教程手记:自定网站登出链接
    404热度

  • 03

    wordpress深度优化禁用不常用功能加速网站
    400热度

  • 04

    谈谈WordPress的优缺点有哪些
    394热度

  • 05

    WordPress火车头发布规则教程
    358热度

赞(0)
未经允许不得转载:桔子博客 » WordPress禁止SemrushBot蜘蛛爬取网站
分享到: 更多 (0)

相关推荐

  • 暂无文章

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址