對于站點(diǎn)范圍內(nèi)的重復(fù)內(nèi)容,這可能是最大的罪魁禍?zhǔn)?。無論我們的內(nèi)部路徑錯誤還是吸引了指向錯誤URL的鏈接提及,我們都為URL的“www”版本和非www(根域名)版本建立了索引。在大多數(shù)情況下,301重定向是我們的最佳選擇。這是一個常見的問題,對于這種情況,G
1、“www”與非www
對于站點(diǎn)范圍內(nèi)的重復(fù)內(nèi)容,這可能是**的罪魁禍?zhǔn)住o論我們的內(nèi)部路徑錯誤還是吸引了指向錯誤URL的鏈接提及,我們都為URL的“www”版本和非www(根域名)版本建立了索引。在大多數(shù)情況下,301重定向是我們的**選擇。這是一個常見的問題,對于這種情況,Google擅長執(zhí)行重定向。我們可能還需要在Google網(wǎng)站站長工具中設(shè)置我們的**地址。在站點(diǎn)配置>設(shè)置下,我們應(yīng)該看到一個名為“**域名”的部分(百度這邊一般我們會通過根目錄或則服務(wù)器來做好重定向進(jìn)行提交)。我們需要為網(wǎng)站的“www”和非www版本創(chuàng)建GWT配置文件才能設(shè)置**域名。如果我們遇到主要的規(guī)范化問題,建議我們這樣來操作。如果不是,那么我們可以任由其任,讓Google確定**域名。
2、登陸服務(wù)器
盡管不如根域名重定向常見,但此問題通常也是由子域引起的。在典型情況下,我們正在設(shè)計(jì)新網(wǎng)站以進(jìn)行重新啟動,網(wǎng)站設(shè)計(jì)人員會為新網(wǎng)站設(shè)置了一個子域,而他們無意中將其開放給抓取工具。我們*終得到的是兩組索引化的URLS。這樣我們**的選擇是通過使用Robots.txt阻止登陸站點(diǎn)來防止此問題發(fā)生。但是,如果我們發(fā)現(xiàn)登陸站點(diǎn)已建立索引,則可能需要對這些頁面進(jìn)行301重定向或?qū)λ鼈冞M(jìn)行Meta Noindex。
3、尾部斜杠(“/”)
盡管這不是搜索引擎優(yōu)化問題,但是它曾經(jīng)是一個人們經(jīng)常會質(zhì)疑的問題。從技術(shù)上講,在原始的HTTP協(xié)議中,帶斜杠的URL和不帶斜杠的URL是不同的URL?,F(xiàn)在幾乎所有瀏覽器都會在幕后自動添加斜線并以相同方式解析兩個版本。
4、安全(https)頁面
如果我們的站點(diǎn)具有安全頁面由“https:”協(xié)議指定,則可能會發(fā)現(xiàn)安全版本和非安全版本都已建立索引。當(dāng)來自安全頁面的導(dǎo)航鏈接也由于*終路徑相對安全而*終被保護(hù)時(shí)。理想情況下,這些問題可以由站點(diǎn)體系結(jié)構(gòu)本身解決。在許多情況下,**使用Noindex安全頁面在搜索索引中沒有位置。不過,我們**的選擇是301重定向,要謹(jǐn)慎對待所有站點(diǎn)范圍的解決方案。如果我們將所有“https:”頁面301重定向到其“http:”版本,則*終可能會完全取消安全性。
5、主頁重復(fù)項(xiàng)
雖然問題前三種形式都可以創(chuàng)建主頁重復(fù)項(xiàng),但是主頁有一些獨(dú)特的問題。*典型的問題是根域和實(shí)際的首頁文檔名稱都會被索引。盡管可以使用301重定向解決此問題,但通常**在首頁上放置一個規(guī)范標(biāo)簽。主頁受到重復(fù)的**影響,而主動的規(guī)范標(biāo)簽可以防止很多問題。當(dāng)然,也要與我們的內(nèi)部路徑保持一致,這一點(diǎn)很重要。如果我們希望網(wǎng)址的根版本是規(guī)范的,但隨后鏈接到導(dǎo)航中的“/index.htm”,則每次爬網(wǎng)程序訪問時(shí),我們都會向Google發(fā)送混合信號。
6、會話ID
一些網(wǎng)站尤其是電子商務(wù)平臺使用跟蹤參數(shù)標(biāo)記每個新用戶。有時(shí),該參數(shù)*終出現(xiàn)在URL中并被索引,實(shí)際上,我們可以為每個建立索引的會話ID和頁面組合添加一個副本。URL中的會話ID可以輕松將1000個重復(fù)的頁面添加到索引中。如果可能,在我們的網(wǎng)站/平臺上,**的選擇是從URL中完全刪除會話ID,并將其存儲在Cookie中。創(chuàng)建這些URL的理由很少,也沒有讓機(jī)器人抓取它們的理由。如果這樣做不可行,那么**在整個網(wǎng)站上實(shí)施規(guī)范代碼。如果我們確實(shí)遇到問題,可以在Google網(wǎng)站管理員工具中阻止該參數(shù)。
7、復(fù)制路徑
網(wǎng)站頁面上有重復(fù)的路徑是完全可以的,但是當(dāng)重復(fù)的路徑生成重復(fù)的URL時(shí),就會出現(xiàn)問題。在這里,可以通過類別欄目和一個用戶生成的標(biāo)簽來訪問產(chǎn)品頁面。用戶生成的標(biāo)簽尤其成問題,因?yàn)樗鼈冊诶碚撋峡梢援a(chǎn)生頁面的無限版本。我們則完全不應(yīng)創(chuàng)建這些基于路徑的URL。無論頁面被導(dǎo)航到哪個頁面,它僅應(yīng)具有一個用于SEO的URL?;蛟S有朋友會說,在URL中包含導(dǎo)航路徑對于站點(diǎn)用戶來說是一個積極的提示,但是即使是具有可用性背景的人,我們認(rèn)為此處的缺點(diǎn)幾乎總是比缺點(diǎn)更重要。如果我們已經(jīng)為變體建立了索引,那么301重定向或規(guī)范標(biāo)記可能是我們的**選擇。在很多情況下,實(shí)現(xiàn)規(guī)范標(biāo)簽會更加容易,因?yàn)榭赡軙刑嗟淖兓鵁o法輕松重定向。從長遠(yuǎn)來看,我們需要重新評估我們的網(wǎng)站架構(gòu)。
8、功能參數(shù)
功能參數(shù)是URL參數(shù),它們會稍微改變頁面,但沒有搜索價(jià)值,實(shí)際上是重復(fù)的。我們**的選擇是根本不使用Meta Noindex之類的索引,但也可以使用規(guī)范標(biāo)記合并這些頁面。
9、國際重復(fù)
當(dāng)我們擁有共享同一語言的不同**/地區(qū)的內(nèi)容時(shí),這些重復(fù)項(xiàng)就會出現(xiàn),所有內(nèi)容都托管在同一根域名當(dāng)然也可能是子文件夾或子域名中。這時(shí)候Google會很好地處理它,并在適當(dāng)?shù)?*/地區(qū)對適當(dāng)?shù)膬?nèi)容進(jìn)行排名。在其他情況下,即使采用適當(dāng)?shù)牡乩砦恢枚ㄎ唬麄円膊粫@樣做。定位語言本身通常要比針對**/地區(qū)更好,但是出于合理的原因,可以將針對特定**/地區(qū)的內(nèi)容分開。如果我們的國際內(nèi)容確實(shí)被視為重復(fù)內(nèi)容,則沒有簡單的答案。如果我們進(jìn)行301重定向,則會丟失用戶頁面。如果我們使用規(guī)范標(biāo)簽,則Google只會對頁面的一種版本進(jìn)行排名。正確的解決方案可能是非常情況的,并且實(shí)際上取決于風(fēng)險(xiǎn)與收益的權(quán)衡。
10、搜索類別
到目前為止,我們例舉的所有形式都是真實(shí)的存在于網(wǎng)絡(luò)的網(wǎng)站案例。
石家莊網(wǎng)站建設(shè)想介紹一些接近重復(fù)的示例,因?yàn)樵摳拍钣悬c(diǎn)模糊。內(nèi)部搜索引擎會彈出一些常見示例,這些示例往往會衍生出許多變體-可排序結(jié)果,過濾器和分頁結(jié)果是*常見的問題。每當(dāng)排序創(chuàng)建單獨(dú)的URL時(shí),都會彈出搜索排序重復(fù)項(xiàng)。盡管兩個排序的結(jié)果在技術(shù)上是不同的頁面,但它們不會為搜索索引增加任何附加值,并且包含相同的內(nèi)容,只是順序不同。在大多數(shù)情況下,**是完全阻止可排序的版本,通常是在有該參數(shù)的網(wǎng)頁上選擇性地添加Meta Noindex。緊急情況下,我們可以在Google Webmaster Tools中阻止sort參數(shù)。
11、搜索過濾器
搜索過濾器用于縮小內(nèi)部搜索范圍可以是價(jià)格,顏色,功能等。過濾器在銷售各種產(chǎn)品的電子商務(wù)網(wǎng)站上非常普遍。在許多情況下,搜索過濾器網(wǎng)址看起來很像搜索排序,那么我們就不要索引過濾器。只要Google擁有明確的產(chǎn)品途徑,索引每個變體通常會弊大于利。
12、搜索分頁
頁面分頁是一個容易描述的問題,并且是一個難以解決的難題。每次將內(nèi)部搜索結(jié)果分成單獨(dú)的頁面時(shí),我們都具有分頁內(nèi)容。盡管結(jié)果本身有所不同,但頁面的許多重要功能標(biāo)題,元描述,標(biāo)題,副本,模板等都是相同的。此外,Google并不是搜索內(nèi)搜索的忠實(shí)擁護(hù)者。Google曾說過讓他們對分頁進(jìn)行分類,可問題是他們做得還不夠好。之后Google推出了Rel= Prev和Rel=Next,*初的數(shù)據(jù)表明這些標(biāo)簽有效,但是我們沒有太多數(shù)據(jù)來證實(shí)它的有效性。