蜗牛789
主机测评与优惠

WordPress添加屏蔽搜索引擎按钮 可指定文章不被搜索引擎抓取

文章目录

WordPress由于是开源的博客程序,所以很多功能一些高手直接用几段代码就能解决问题。蜗牛个人不太喜欢使用插件,关注蜗牛789的朋友都知道,蜗牛每次分享的WordPress小技巧基本都是代码实现修改的。相信很多朋友和蜗牛一样虽然不懂代码,但是别人修改的现成代码添加总还是会的。在此文章中将为大家分享一个小技巧,就是为自己WordPress撰写新文章页面添加一个屏蔽搜索引擎按钮 ,可以自定义某篇文章不被搜索引擎抓取。相信很多朋友有些东西(你懂得)是不想分享给大众的,只想给自己博客(网站)的网友所知道,那么使用蜗牛介绍的小方法可以实现如下图效果。

一、设置方法

方法依然很简单,几段代码就实现了。我们在自己主题文件中找到“functions.php”文件,蜗牛使用的大前端DUX主题是“functions-theme.php”文件,不保证每个主题文件名称都完全一致,但是绝大多数是的。然后把下面代码添加到functions.php”文件中。提示:如果你的WordPress站点开启了页面缓存,此功能无效!!

// 站点开启了页面缓存,此功能无效 蜗牛789 www.wn789.com

function ludouse_add_custom_box() {
 if (function_exists('add_meta_box')) { 
 add_meta_box('ludou_allow_se', '搜索引擎', 'ludou_allow_se', 'post', 'side', 'low');
 add_meta_box('ludou_allow_se', '搜索引擎', 'ludou_allow_se', 'page', 'side', 'low');
 }
}
add_action('add_meta_boxes', 'ludouse_add_custom_box');

function ludou_allow_se() {
 global $post;
 
 //添加验证字段
 wp_nonce_field('ludou_allow_se', 'ludou_allow_se_nonce');
 
 $meta_value = get_post_meta($post->ID, 'ludou_allow_se', true);
 if($meta_value)
 echo '<input name="ludou-allow-se" type="checkbox" checked="checked" value="1" /> 屏蔽搜索引擎';
 else
 echo '<input name="ludou-allow-se" type="checkbox" value="1" /> 屏蔽搜索引擎';
}

// 保存选项设置
function ludouse_save_postdata($post_id) {
 // 验证
 if ( !isset( $_POST['ludou_allow_se_nonce']))
 return $post_id;

$nonce = $_POST['ludou_allow_se_nonce'];

// 验证字段是否合法
 if (!wp_verify_nonce( $nonce, 'ludou_allow_se'))
 return $post_id;

// 判断是否自动保存
 if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE) 
 return $post_id;

// 验证用户权限 蜗牛789 www.wn789.com
 if ('page' == $_POST['post_type']) {
 if ( !current_user_can('edit_page', $post_id))
 return $post_id;
 }
 else {
 if (!current_user_can('edit_post', $post_id))
 return $post_id;
 }
 
 // 更新设置
 if(!empty($_POST['ludou-allow-se']))
 update_post_meta($post_id, 'ludou_allow_se', '1');
 else
 update_post_meta($post_id, 'ludou_allow_se', '0');
}
add_action('save_post', 'ludouse_save_postdata');

// 对于设置不允许抓取文章和页面
// 禁止搜索引擎抓取,返回404
function do_ludou_allow_se() {
 // 本功能只对文章和页面有效
 if(is_singular()) {
 global $post;
 $is_robots = 0;
 $ludou_allow_se = get_post_meta($post->ID, 'ludou_allow_se', true);

if(!empty($ludou_allow_se)) {
 // 下面是爬虫Agent判断关键字数组
 // 有点简单,自己优化一下吧
 $bots = array(
 'spider',
 'bot',
 'crawl',
 'Slurp',
 'yahoo-blogs',
 'Yandex',
 'Yeti',
 'blogsearch',
 'ia_archive',
 'Google',
 'baidu'
 );
 
 $useragent = $_SERVER['HTTP_USER_AGENT'];
 
 if(!empty($useragent)) {
 foreach ($bots as $lookfor) {
 if (stristr($useragent, $lookfor) !== false) {
 $is_robots = 1;
 break;
 }
 }
 }

// 如果当前文章/页面禁止搜索引擎抓取,返回404
 // 当然你可以改成403
 if($is_robots) {
 status_header(404);
 exit;
 }
 }
 }
}
add_action('wp', 'do_ludou_allow_se');

二、优化方法

当我们把上面代码添加到主题“functions.php”后,在WordPress后台的文章编辑页面就会出现一个文件屏蔽搜索引擎按钮,如果你想某篇文章不被搜索引擎抓取勾选即可。但上面的代码是当勾选后,勾选的文章被搜索引擎访问时返回的状态是404,如果你担心返回404死链会影响SEO,那么我们可以使用下面代码。但前提你先在主题文件的“header.php”中添加meta声明告诉搜索引擎不要收录本页面。

<meta name="robots" content="noindex,noarchive" />

并且你主题header.php文件中必须有以下代码:

wp_head();

然后再在主题“functions.php”文件中添加下面优化代码。当然如果出现问题的话,我们可以不选择使用优化代码,因为你设置不要收录的页面绝对是极少数的,所以对搜索引擎也起不了多大的影响。

// 站点开启了页面缓存,此功能无效 蜗牛789 www.wn789.com

function ludouse_add_custom_box() {
 if (function_exists('add_meta_box')) { 
 add_meta_box('ludou_allow_se', '搜索引擎', 'ludou_allow_se', 'post', 'side', 'low');
 add_meta_box('ludou_allow_se', '搜索引擎', 'ludou_allow_se', 'page', 'side', 'low');
 }
}
add_action('add_meta_boxes', 'ludouse_add_custom_box');

function ludou_allow_se() {
 global $post;
 
 //添加验证字段
 wp_nonce_field('ludou_allow_se', 'ludou_allow_se_nonce');
 
 $meta_value = get_post_meta($post->ID, 'ludou_allow_se', true);
 if($meta_value)
 echo '<input name="ludou-allow-se" type="checkbox" checked="checked" value="1" /> 屏蔽搜索引擎';
 else
 echo '<input name="ludou-allow-se" type="checkbox" value="1" /> 屏蔽搜索引擎';
}

// 保存选项设置
function ludouse_save_postdata($post_id) {
 // 验证
 if ( !isset( $_POST['ludou_allow_se_nonce']))
 return $post_id;

$nonce = $_POST['ludou_allow_se_nonce'];

// 验证字段是否合法
 if (!wp_verify_nonce( $nonce, 'ludou_allow_se'))
 return $post_id;

// 判断是否自动保存
 if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE) 
 return $post_id;

// 验证用户权限 蜗牛789 www.wn789.com
 if ('page' == $_POST['post_type']) {
 if ( !current_user_can('edit_page', $post_id))
 return $post_id;
 }
 else {
 if (!current_user_can('edit_post', $post_id))
 return $post_id;
 }
 
 // 更新设置
 if(!empty($_POST['ludou-allow-se']))
 update_post_meta($post_id, 'ludou_allow_se', '1');
 else
 update_post_meta($post_id, 'ludou_allow_se', '0');
}
add_action('save_post', 'ludouse_save_postdata');

// 对于设置不允许抓取文章和页面
// 禁止搜索引擎抓取,返回404
function do_ludou_allow_se() {
 // 本功能只对文章和页面有效
 if(is_singular()) {
 global $post;
 $is_robots = 0;
 $ludou_allow_se = get_post_meta($post->ID, 'ludou_allow_se', true);

if(!empty($ludou_allow_se)) {
 // 下面是爬虫Agent判断关键字数组
 // 有点简单,自己优化一下吧
 $bots = array(
 'spider',
 'bot',
 'crawl',
 'Slurp',
 'yahoo-blogs',
 'Yandex',
 'Yeti',
 'blogsearch',
 'ia_archive',
 'Google',
 'baidu'
 );
 
 $useragent = $_SERVER['HTTP_USER_AGENT'];
 
 if(!empty($useragent)) {
 foreach ($bots as $lookfor) {
 if (stristr($useragent, $lookfor) !== false) {
 $is_robots = 1;
 break;
 }
 }
 }

// 如果当前文章/页面禁止搜索引擎抓取,返回404
 // 当然你可以改成403
 if($is_robots) {
 echo "<meta name="robots" content="noindex,noarchive" />\n";
 }
 }
 }
}
add_action('wp_head', 'do_ludou_allow_se');

DUX无限制版下载方法

蜗牛789博客DUX无限制版本下载方案,使用微信扫描下面二维码关注蜗牛789微信公众号。注意是关注微信公众号, 微信公众号每天晚上推送当日热门促销活动。然后在微信公众号回复“DUX主题”即可获取下载链接。100%服务器下载版本,绿色无毒。

About 蜗牛

【声明】:本博客不参与任何交易,也非中介,仅记录个人感兴趣的主机测评结果和优惠活动,内容均不作直接、间接、法定、约定的保证。访问本博客请务必遵守有关互联网的相关法律、规定与规则。一旦您访问本博客,即表示您已经知晓并接受了此声明通告。





评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址