網站不收錄是怎們回事你知道嗎,在内蒙古網絡推廣中,網站優化(huà)很重要的(de)就是網站抓取,但是網站抓取異常你知道是什(shén)麽原因嗎?快(kuài)跟著(zhe)搜搜網絡小編來(lái)看看!
爬取異常的(de)原因是什(shén)麽?
爬取異常的(de)原因主要分(fēn)爲兩類,一類是網站異常,一類是鏈接異常。在哪裏看,在搜索資源平台(https://ziyuan.baidu.com)中添加數據統計後——在那裏抓取異常。
一、網站異常的(de)原因:
1.DNS異常
當蜘蛛(Baiduspider)無法解析您網站的(de)IP時(shí),就會出現DNS異常。可(kě)能是你的(de)網站IP地址錯誤,或者你的(de)域名服務商屏蔽了(le)Baiduspider。您可(kě)以使用(yòng) WHOIS 或 host 來(lái)檢查您網站的(de) IP 地址是否正确,是否可(kě)以解析。如果不正确或無法解析,請聯系域名注冊商更新網站IP地址。
2.連接超時(shí)
獲取請求的(de)連接超時(shí)。可(kě)能的(de)原因是:服務器過載或網絡不穩定。
3. 抓取超時(shí)
爬取請求連接建立後,頁面下(xià)載速度過慢(màn),導緻超時(shí)。可(kě)能的(de)原因是服務器過載,帶寬不足。
4.連接錯誤
建立連接後無法連接或其他(tā)服務器拒絕。
2、鏈接異常的(de)原因:
1.訪問被拒絕
爬蟲發起爬取,httpcode返回碼爲403。
2. 找不到頁面
爬蟲發起爬取,httpcode返回碼爲404。
3.服務器錯誤
爬蟲發起爬取,httpcode返回碼爲5XX
4.其他(tā)錯誤
爬蟲發起爬取,httpcode返回碼爲4XX,不包括403和(hé)404。
3、網站爬取異常的(de)原因有哪些
網站爬取異常的(de)原因主要包括以下(xià)五個(gè)方面:
1.服務器異常
不正常的(de)服務器連接可(kě)能是網站服務器太大(dà),超載,通(tōng)過檢查浏覽器輸入輸入您的(de)域名以進行正常訪問。服務器異常會導緻爬蟲無法連接到網站服務器,導緻爬取失敗。
2.域名過期
域名過期的(de)網站無法訪問,域名解析無效。如果出現這(zhè)種情況,你可(kě)以聯系你的(de)域名注冊商,看看有沒有被搶注或者可(kě)以續費。
3.網絡運營商異常
電信和(hé)中國聯通(tōng)都是屬于網絡運營商的(de)網站,蜘蛛無法訪問。
如果電信或中國聯通(tōng)網絡運營商出現問題,請聯系網絡服務運營商或購(gòu)買CDN服務。
4.robots.txt文件設置問題
robots.txt的(de)主要作用(yòng)是屏蔽一些不重要的(de)文件,告訴搜索引擎這(zhè)些頁面可(kě)能不會被抓取,但也(yě)可(kě)能有重要的(de)頁面需要屏蔽。 ,您可(kě)以檢查機器人(rén)文件設置。