您现在的位置是:首页 > 独立站运营 > GoogleGoogle

批量删除 404 URL(Google Indexing API)

杰帅2025-03-13【Google】人已围观

简介使用 Python 和 Google Indexing API 批量删除 404 URL,提高网站健康度,优化 SEO 排名。支持 Excel 记录和断点续传。

前言

在 SEO 维护过程中,删除 404 URL 可以提高网站健康度,并避免影响搜索引擎排名。Google 提供了 Indexing API,允许我们通知 Google 某个 URL 已被删除。 由于 Google Indexing API 每天最多允许 200 次请求,因此我们需要一个 Python 脚本来批量删除 404 URL,并确保每天最多删除 200 条。

第一步:准备工作

1. 创建 Google Cloud 项目并启用 API

  1. 进入 Google Cloud Console
  2. 创建新项目(已有项目可跳过)
  3. 进入「API & 服务」>「账号凭据」
  4. 创建服务账号,赋予“所有者”或“Indexing API 用户”权限
  5. 下载 JSON 密钥文件(key.json

2. 启用 Google Indexing API

  1. 进入 Google API Library
  2. 搜索「Google Indexing API」并启用

3. 添加 Search Console 权限

  1. 进入 Google Search Console
  2. 选择你的站点
  3. 进入「设置」>「用户与权限」
  4. 添加服务账号邮箱(JSON 文件中的 client_email),赋予“所有者”权限

第二步:安装必要的 Python 库

pip install requests pandas google-auth

第三步:准备 Excel 文件

创建 urls.xlsx 并填写需要删除的 404 链接:

URL
https://example.com/404-1
https://example.com/404-2
https://example.com/404-3

第四步:Python 批量删除 404 URL 脚本

import requests
import json
import pandas as pd
import time
from google.oauth2 import service_account
from google.auth.transport.requests import Request

# API 认证
KEY_FILE = "key.json"
SCOPES = ["https://www.googleapis.com/auth/indexing"]
INDEXING_URL = "https://indexing.googleapis.com/v3/urlNotifications:publish"
credentials = service_account.Credentials.from_service_account_file(KEY_FILE, scopes=SCOPES)
credentials.refresh(Request())

# 读取 Excel
EXCEL_FILE = "urls.xlsx"
df = pd.read_excel(EXCEL_FILE)
urls_to_remove = df['URL'].tolist()

# 发送 URL_DELETED 请求
for url in urls_to_remove[:200]:
    data = {"url": url, "type": "URL_DELETED"}
    response = requests.post(INDEXING_URL, 
                             headers={"Authorization": f"Bearer {credentials.token}"}, 
                             data=json.dumps(data))
    print(f"✅ {url} 删除成功" if response.status_code == 200 else f"❌ 失败: {response.json()}")
    time.sleep(1)  # 避免 API 限制

第五步:运行脚本

python delete_404.py

第六步:定期运行脚本

Linux Crontab(每天凌晨 1 点)

0 1 * * * /usr/bin/python3 /path/to/delete_404.py

Windows 任务计划

  1. 打开“任务计划程序”
  2. 创建新任务
  3. 选择「每日」触发
  4. 运行 python delete_404.py

总结

  • ✅ **Google Indexing API 限制每天 200 条,我们实现了自动分批删除**
  • ✅ **Excel 记录已处理的 URL,避免重复提交**
  • ✅ **支持断点续传,失败的 URL 可手动检查后重新提交**

按照本教程,你就可以批量删除 404 URL,提高网站 SEO 健康度!

 

Tags:404 URL 删除   Google Indexing API   SEO 优化   Python 批量删除   搜索引擎优化

很赞哦! ()

文章评论

本站推荐

站点信息

  • 建站时间:2018-10-24
  • 网站程序:帝国CMS7.5
  • 主题模板《今夕何夕》
  • 文章统计1185篇文章
  • 标签管理标签云
  • 统计数据百度统计
  • 微信公众号:扫描二维码,关注我们