解決網站重複性內容頁面的6種方法
當你的網站許多頁面被標記為彼此重複時,你該如何解決?本質上,重複內容是出現在Internet上多個位置的內容。太相似的內容,即使不完全相同,也可能被視為彼此重複。
重複內容髮生在以下兩種情況:
一是訪問者在訪問您的網站並比較兩個頁面時看到的內容;
二是搜索引擎和搜尋器訪問這些頁面時看到的內容和源代碼,如果該代碼過於相似,則搜尋器可能會認為它正在查看同一頁面的兩個版本。
負面影響是搜索引擎可能無法弄清楚應該對哪個頁面進行排名,排除哪個頁面,或者對不正確的頁面進行排名,也不知道要將定向鏈接指標(信任,權限,錨文本,鏈接等)定向到一個頁面,或將其分隔在多個版本之間。
解決商城重複性內容的6種方式:
1. 301重定向
這個是比較基礎的方法應用於解決重複頁面,可以將頁面的舊版本重定向到新的更新版本。這與子域或協議更改以及內容更新有關。
2. Rel=規範
兩個頁面重複度較高時,可以在其中一個不打算給予排名的頁面代碼頭部加上rel = canonicals選項,告知搜尋器哪個是最重要的頁面,但不影響用戶對兩個頁面的訪問。
這類似於出售兩種顏色不同的商品。您希望訪客能夠看到和訪問這兩種顏色,但是您將使用規範的標籤來告訴爬蟲哪些是最相關的頁面。
格式為: (在html的
部分)rel = canonical屬性應添加到頁面的每個重複版本的HTML頭中,上面的“ URL OF ORIGINAL PAGE”部分應替換為指向原始(規範)頁面的鏈接。 (請確保保留引號。)該屬性傳遞的鏈接公平性(排名能力)與301重定向大致相同,並且由於它是在頁面(而不是服務器)級別實現的,因此通常只需較少的開發時間即可實行。
3. 元索引
如果同一個主題內容有兩個頁面A,B版本,你更推薦B是最新且最相關的,但希望A版本仍然是可以閱讀的,那可以選擇將A頁面標記為meta noindex。
元noindex標記告訴抓取工具可以抓取重複的頁面,但不應將其包含在索引中。這可以幫助解決由於分頁等原因造成的重複內容問題。
格式為:(在html的
部分,對重複的頁面加上這段代碼)meta robots標籤允許搜索引擎抓取頁面上的鏈接,但阻止它們將這些鏈接包括在索引中。但您即使告訴Google不要對其進行索引,仍然要保障他們可以對重複頁面進行爬網,因為Google明確警告不要限制對網站上重複內容的爬網訪問。
4. 添加內容
如果兩個頁面涉及不同的主題,但卻被判斷為重複頁面,這種情況,可以選擇向這些頁面中的每個頁面添加更多內容,使不同的主題都可以脫穎而出。
這類似於說在一個紙杯蛋糕上撒些巧克力和櫻桃,而在另一個紙杯蛋糕上添加另一種顏色的糖霜。
5. URL變體
URL參數(例如點擊跟踪和一些分析代碼)可能會導致重複的內容問題。不僅由參數本身引起,而且還由這些參數在URL本身中出現的順序引起的問題。
支持打印的內容頁面也可能會造成重複頁面:
解決方法:避免添加URL參數或URL的備用版本,通常可以通過腳本傳遞這些信息。
6. HTTP與HTTPS或WWW與非WWW頁面
如果”www.site.com” 和”site.com”上具有單獨的版本,http:// 和https:// 版本的網站版本都是實時的並且對搜索引擎可見,則可能會遇到重複的內容問題。
解決方法是保持域名的唯一性,https://www.site.com/ 的唯一,其他的版本都跳轉到這裡。