一、 分析網(wǎng)站日志,看是否有被蜘蛛爬過
作為站長一定要學會網(wǎng)站日志的分析,網(wǎng)站日志里面可以告訴我們表面看不到的隱藏問題。
1)、如果未被收錄的頁面未被蜘蛛爬行
頁面沒有被Baiduspider爬行,那么你可以適當?shù)慕o該頁面做一些外鏈來引導蜘蛛過來爬行,也可以給搜索引擎提交該頁面。
2)、如果頁面已經(jīng)被Baiduspider爬行過了
頁面被爬行也沒被收錄,那么就可能存在的因素:
1、 第一次被Baiduspider爬行,從百度的綜合算法來看該頁面的價值性極低,再考核要不要創(chuàng)建索引。
2、 第二次被Baiduspider爬行,該頁面從始至終都未有任何的變動,決定對此頁面暫停分析。
3、 第三次被Baiduspider爬行,該頁面還是沒變動,并且這么長時間也未出現(xiàn)其它的附加價值(附加價值:評論,分享,被轉(zhuǎn)發(fā)等等),決定不予收錄。
要知道Baiduspider也是很忙的,沒有那么多的閑工夫天天來爬行你這些未收錄的頁面,所以,當出現(xiàn)頁面長時間都不被百度收錄的話,那么就要適當?shù)慕o該頁面增加一些附加價值或者對該頁面進行重新的進行修改。你可以對文本新增一些圖片,視頻或者內(nèi)容,也可以對標題進行再次編輯?傊,要讓Baiduspider再次過來爬行的時候,返回的狀態(tài)碼不是一個無變化的狀態(tài),這樣你的頁面被收錄的幾率就大大的提升了。
第二、 是否robots設(shè)置錯誤,主動屏蔽Baiduspider
Robots的設(shè)置也是非常重要的,這個很多人可能對這些還不了解。建議大家可以到百度站長工具資訊里面看,那里面有詳細的教程。若是自己robots設(shè)置的問題,那么自己進行糾正后,再在百度站長工具后臺里面進行更新robots這樣的話好讓百度蜘蛛重新更改狀態(tài)。
第三、 網(wǎng)站頁面是否存在敏感詞
如今越來越多的詞對搜索引擎來說都有一定的敏感,敏感詞很有可能造成你的頁面不被收錄,有時候也會造成網(wǎng)站被將去或被k。所以站長們再建設(shè)內(nèi)容的時候一定要注意不要在文中出現(xiàn)敏感詞。
第四、 你的頁面內(nèi)容是否是采集的
百度老大之前有表明過,數(shù)據(jù)庫里面肯定會存在完完全全的重復的內(nèi)容。但是也會有一定的限制。比如一篇文章上限被收錄20篇,那么當已經(jīng)被收錄20篇了,那么無論是你還是他人在轉(zhuǎn)載更新的話也不會被收錄。