記錄與總結網站第三次被 Bing 撤除索引的過程
在上週四,也就是 2025 年 8 月 28 日,我們的網站第三次被 Bing 搜尋引擎撤除索引,特此記錄下來作為反思與總結。
至於被撤除索引的原因,我認為可能還是低估了自己認為「微小」的修改,在搜尋引擎眼中卻可能被視為全站級別的重大變更。以下內容可作為一個反面教材供參考。
在前一天(8 月 27 日),我查看了網站的 Ahrefs 分數,發現出現大量 HTML 語言標籤不匹配的錯誤(如下圖所示,約發生在 8 月 24 日前後)。當時網站正逐步進行多語言適配,但我並未意識到 HTML 的語言標籤(lang
)是根據使用者語言動態設定的。結果導致 Bing 搜尋引擎看到的所有頁面語言,實際上都是我設定的 fallback 回退語言(即便是中文文章,其 HTML 語言標示也為 en
)。而我在那幾天反覆修改語言設定,從 zh
→ en
→ zh
→ en
,短短幾天內多次變更。
大約在 8 月 26 日前後,我對文章內容進行了一次全面替換,刪除了一些我認為不必要的提示訊息,也沒有使用搜尋引擎的主動推送功能。
8 月 27 日,我重新撰寫了導航頁面以支援更多語言。過程中發現英文頁面的導航描述(meta description)竟全是中文內容,我意識到這可能是先前疏忽所致,便乾脆將所有英文頁面的描述全部刪除,打算日後再補上。
8 月 28 日前一天晚上喝了一杯奶茶,當天清晨五點多醒來,心想既然早起,不如趁機修復 HTML 的 lang
問題。隨後發布了公告、更新了下載資源,並開始處理資料庫緩存,計劃盡快將多個站點的 API 獨立開來,讓 yinyuee.com 能夠啟用獨立的登入與下載功能。
大約下午三點多接近完成時,我拿起手機查看,發現從兩點多開始就沒有人再關注公眾號了。我懷疑是不是伺服器掛了,或是重定向伺服器出了問題,但初步檢查後並未發現異常,自己測試登入與下載也都正常。於是轉而查看百度統計數據……
嗯……情況不太對。接著我嘗試搜尋網站關鍵字,發現已經完全搜不到我們的站點了。許多關鍵字原本已排到第一頁,日點擊量接近上千,微信公眾號每日新增關注人數也在穩定成長,結果瞬間歸零。如下圖所示,雖然部分曝光量來自 360 瀏覽器和 360 安全衛士帶來的流量,但這些關鍵字實際上並無點擊。
當然,以上僅是我認為的主要問題。實際上還存在其他多項錯誤,以下簡單列舉幾項:
robots.txt 存在錯誤
我原本認為 robots.txt 只是小問題,但實際上 Bing 與 Yandex 在技術與資料上存在部分共用機制,一旦被其中一方封鎖,往往會連帶影響另一方。
我於 8 月 24 日註冊並驗證了 Yandex,結果在 8 月 28 日(週四)下午 14:12 收到一封來自 Yandex 的郵件通知:robots.txt存在錯誤 網站地圖(sitemap)指向錯誤
在推送 sitemap 時因環境變數設定錯誤,生成了指向changjiu365.cn
的網站地圖。然而,該域名早在數個月前就已被搜尋引擎封鎖。雖然之前也曾發現此問題,但我一直未予重視。網站地圖連結到已被封鎖的網站 網站頻繁進行全站級別變更
七月底我曾進行一次全面性改版,自此之後 Google Search Console 就無法正常抓取與更新索引,直到今天(9 月 4 日)才恢復正常,推測是搜尋引擎觀察了整整一個月後才重新信任網站。網站全面變更記錄 1 網站全面變更記錄 2
這些問題在過去幾天我都陸續修復完成。接下來,就讓我們重新出發吧~
評論