現在做網站優化的越來越多,要想做好網站SEO優化,網站的收錄是非常重要的,這是很多站長關心的問題,網站要想獲得好的排名,很多細節是需要我們注意的,首先就要解決網站收錄的問題,今天一起來了解一下影響網站收錄的原因。
爬蟲抓取的可識別性
在爬蟲抓取網頁時,如果根本不知道你的網頁內容是什么,那基本上是不會被百度收錄的。所以讓爬蟲識別到我們網頁的內容也是較為關鍵的一個問題。
1、robots協議的封禁
robots是一個txt文件,放置于網站的根目錄下。可以通過www.xxx.com/robots.txt進行訪問打開。如果你的robots文件封禁了百度爬蟲,那么收錄簡直是不可能的。
因為robots協議文件是搜索引擎與網站之間的協議文件。是網站告知搜索引擎爬蟲,哪些內容你可以抓取,哪些內容你是不可以抓取。所以你都告訴爬蟲不讓它抓取了,他還怎么會抓取呢?
2、影響網站收錄的ajax技術
js的ajax技術,其實很多做SEO的都知道不能使用js,但這并不完全是。因為爬蟲抓取的是網頁源代碼,只要你源代碼中有這些內容就是可以的。但通過js實現異步加載的內容就不行了。
這里解釋一下什么是異步加載,就是當前網頁源代碼沒有的內容。通過觸發網頁某個事件,js通過ajax技術動態加載出來的內容。例如典型的瀑布流網頁,當你鼠標滾動到最底部,然后地步就會出現更多新的內容。多數是采用這個ajax技術。
那被異步加載出來的內容爬蟲是看不到的。
3、圖片、導航、ALT
圖片類型的導航,現在基本很少見了。但這里還是要說一下,如果你的導航(主導航)使用圖片,在這個寸土寸金的位置上,搜索引擎根本不知道你說了什么,所以這時候需要我們使用alt標簽進行設置。
alt嚴格來說是img標簽的一個屬性值,是在當圖片加載失敗時的提示文字
4、網站訪問速度慢
如果你的網站打開速度很慢的話,也會很大程度上的影響收錄。我們舉個例子,爬蟲每天抓取你網站就給10分鐘時間,你的網站訪問一次需要1秒鐘,和需要100毫秒。這完全是兩個層次上的結果。
內容質量對收錄的影響。
內容的原創性
你的內容本身是不是原創的,原創內容更有機會被收錄這個是眾所周知的。本文不討論怎么寫原創文章,所以原創怎么搞,在這里只能說自己弄明白了,然后用自己的語言組織一下寫出來。
內容的可讀性
你的網頁是不是會對用戶造成一定的體驗影響,例如廣告遮擋主體內容。主要的內容沒有在電腦首評出現。字體大小、字體顏色與背景色過于接近等。
內容的需求滿足度
標題和內容是不是提問相符的。且真正解決了用戶的需求。并不是掛羊頭賣狗肉,或者語句不通順等行為。
如何確定網站是否被降權
爬蟲抓取量突然下降
觀察至少兩周時間,看看搜索引擎爬蟲的抓取量能不能回來,可以鎖定是網站質量被下調,導致抓取量急劇減少,注意是突然極具下降,而不是浮動。
索引量斷崖式下跌
搜索引擎索引量突然斷崖式的下降,這也不一定是降權,因為索引庫中存著數以億億的內容存儲,有很多內容在今天可能都過時了。
搜索引擎排名大幅下降
隨著索引量的斷崖式下降,你通過5118工具查看自己網站的排名也大幅度下降。例如之前排名在前50名有100個詞,現在只有5個了。那肯定說明你是被降權了。
但如果只有很小的詞減少,還有一些詞上升。那也說明不了什么,建議持續觀察一周時間,再做決策。
SEO來源流量減少較多
SEO來源流量,指的就是通過搜索引擎點擊進入我們網站的流量數據,例如uv(獨立訪客)這個指標突然大幅度下跌。上面的幾項都可以不用看可以直接斷定網站確實是被降權了。
但搜索引擎本身也有一些審查機制,審查也就是意味著如果他們檢索出自己錯誤的判斷了你的網站,導致降權會很快進行恢復。所以一般這種情況下也建議你觀察至少3天。