當前位置:首頁 > 網站建設

怎樣用百度排查已收錄頁面網址的異常?

時間:2019-06-02 03:42:05來源:網站建設作者:seo實驗室小編閱讀:115次「手機版」
 

布谷網

頁面被百度收錄了成千上萬,排名不可觀,天天嚷嚷百度不公平,原創都不收錄,被人家轉載還排名杠杠的,但是你知道收錄的這些頁面有多少是錯誤頁面嘛?有多少頁面打不開嘛?你花時間去整理錯誤頁面了嘛?捫心自問這些問題在大部分網站上面都會出現,只是站長們都去注重網站排名去了,不在意這些細節問題,從不找自身的原因,反而去怪罪百度。

小問題也需要大智慧,處理網站錯誤頁面是百度在網頁優化白皮書提出的重點項目,作為站長的我們應該去發現這些重點,然后根據網站自身的問題去改進問題,提高網頁在百度收錄時遇到錯誤頁面而給與負面影響,同時也給用戶留下好的印象,提升網頁的用戶體驗。作為菜鳥的我給大家總結了從那些方面來找出收錄頁面在百度中的錯誤。

1.服務器錯誤

服務器錯誤最主要的問題就是百度蜘蛛發起抓取網頁的時候,httpcode返回的都是5XX狀態碼,這樣會造成百度抓取不到規范的網頁。造成服務器錯誤的原因有多種:網站處于正在進行維護;該網站有程序出現批量錯誤。最好的解決辦法就是找出程序的錯誤并做出適當的修改,如果是網站正在進行維護,請采用百度站長平臺的閉站保護進行規范后然后再進行操作。

2.訪問被拒絕

訪問被拒絕最主要的問題就是百度蜘蛛發起抓取網頁的時候,httpcode返回的都是403狀態碼,這樣同樣會造成百度蜘蛛抓取不到規范的網頁。造成訪問被拒絕的原因也有多種:網站權限受限制;IP地址被拒絕;服務器流量超負荷。這幾種錯誤原因解決辦法也很容易,找出網頁所在目錄給與百度蜘蛛足夠的權限去抓取頁面,查看百度蜘蛛的IP地址是否被封禁,服務器流量過大的話那就升級服務器。

3.找不到頁面

找不到頁面最主要的問題就是百度蜘蛛發起抓取網頁的時候,httpcode返回的都是404狀態碼,這種錯誤是網頁最主要的,幾乎所有的網站都有這種頁面存在。造成找不到頁面的原因可以列舉一大把:過期的團購網頁;誤刪數據庫;論壇垃圾帖子刪除。其實這些問題能夠輕而易舉的就解決了,建立合適的404頁面,遇到404狀態碼就返回404頁面。

4.其他錯誤

其他錯誤包括的項目就比較多了,但問題大概還是差不多的,就是百度蜘蛛抓起網頁的時候httpcode返回的4XX狀態碼,除了403和404之外的其他狀態碼。這種問題的來源也是蠻多的:請求的URL太長【參數太多】;要求驗證身份;不支持的媒體類型;瀏覽器不接收所請求的頁面。解決這些問題比較復雜,URL過長的話需要解決參數的排序位置,身份驗證的就要從部分網站權限控制和其他程序問題來控制了,媒體類型盡量做到每個類型就覆蓋到自己的網站。

總之,運用好百度站長平臺的抓取異常這個欄目選項,你就能找到百度蜘蛛在抓取網頁的時候遇到的瓶頸,解決掉這些對蜘蛛爬取的有阻攔的問題,你就能把所有在百度已經收錄的頁面統計出來,然后根據不同的問題解決掉就可以了。網站抓取問題解決了,百度收錄量就會duang,duang,duang的瘋漲了。老板再也不擔心我的網站收錄數據差了。

本文有米大白首發原創,轉載請注明來源布谷網www.buugg.com

相關閱讀

新網站文章如何快速收錄

在剛建設好網站后,文章頁面收錄很慢還有今天收錄明天掉,這個問題讓很多站長困惑接下來筆者分享一下新站文章快速收錄的方法。1、把

網站SEO之巧用百度下拉框引流量

百度下拉框這個功能,一直受到很多企業老板或者新手追捧,因為搜索某個關鍵詞的時候,就會在搜索框上出現刷出來的現象詞,對于這些詞我們

百度域名收錄

目錄一、百度域名收錄1、提交域名2、驗證域名3、24小時驗證一、百度域名收錄 1、提交域名 -》 進入百度搜索你的域名:前面加site:si

新網站怎么加快被百度收錄

相信有很多人新站長在做完網站都會面臨一個問題:新網站如何被百度收錄?新網站被百度收錄的問題是seo中重要的問題。其實谷歌收錄新

站長們應該如何應對網站收錄下降

作為專業SEO人員,會經常關注網站的收錄情況。對于大多數站長而言,可能都抱著一種心態:網站收錄越多越好,甚至會認為收錄為王、外鏈為

分享到:

欄目導航

推薦閱讀

熱門閱讀

疯狂麻将试玩
贵州微乐捉鸡麻将下 能赚钱的回合制网游 辽宁11选5开桨结果 目前股票大盘走势 血流麻将胡牌牌型图解 3分彩是正规的吗 天津11选5 吉林体彩11选5平台 宁夏11选5平台 湖南麻将单机版 五分彩上可以撤回所有钱么 足球大赢家比分 山西快乐十分图走势百控 澳洲幸运5技巧打法 哈灵江苏麻将官方下载 无限金币版捕鱼