买一个域名,通常会让人觉得是在重新开始。你会检查拼写、看 TLD、比价格。但有一个关键因素,很多人都会忽略:它的历史。
我就是吃了这个亏。我买下了一个最早注册于 2000 年的域名,一开始看起来像是捡到了宝——直到服务器日志开始被各种奇怪请求塞满。
第一天:机器人入侵
网站刚上线没多久,我的流量日志就突然飙升。但那并不是真实用户,而是指向新站根本不存在的 URL 的每天 1000 多次请求。
后来才发现,问题来自一大群机器人,它们在疯狂扫描这个域名很多年前曾经存在过的页面。它们在追踪这个域名过去的痕迹,于是制造出了一个几乎没有任何互动的异常直接流量高峰。
为什么这会伤害 SEO
问题不只是服务器负载。真正麻烦的是,搜索引擎会如何理解这些噪音。
因为这些机器人持续不断地撞向那些早已失效的 URL,Yandex 开始把它们当成“也许仍然重要”的页面处理。它的爬虫反复、激进地回访这些幽灵路径,最终一次次撞上 404 (未找到) 错误。仅仅一夜之间,我的 Webmaster Tools 面板里就多出了 900 多个错误。
解决方案:404 还是 410
很多开发者对丢失页面直接返回标准 404。但在这个案例里,这远远不够。对搜索引擎来说,404 往往更像是在说:“我现在没找到,也许以后还会再来看看。”
为了真正把问题按住,我不得不切换到 Status 410 (Gone)。
410 是一个明确且终结性的信号。它是在告诉爬虫:“这个页面已经永久消失,不要继续留在索引里了。”
针对这些旧路径定向返回 410,是唯一真正让机器人安静下来、并把我的 SEO 状态清理干净的方法。如果你打算买一个老域名,不要只是把新网站上线——也要把旧网站留下的痕迹查清楚,并且从第一天起就准备好自己的 410 策略。