重複內容(Duplicate Content)是 SEO 的重大問題之一,這點已經由 Google 官方親口證實,因此是所有 SEO 人員必學的項目。重複內容的類型多樣,其中又分為站內重複內容與站外重複內容,每一種重複內容的解決方法也不一樣。
重複內容是什麼?
普遍的重複內容通常是指:
- 你的網站抄襲、複製他人網站的內容
這樣很容易被爬蟲判定為劣質的重複網頁,被判定成這種類型的網頁會受到懲罰,排名通常會一蹶不振。如果你網站上的每個頁面都是原創內容,那你可能不需要擔心上述情形。
但是,即使你的網站全都是原創內容,還是有可能出現重複內容,例如:
- 在不同的 URL 上,創建了同一內容頁的多個版本
- EX:衣服-紅色款、衣服-藍色款
- 同一頁面的 URL 後面追加了參數
- EX:Google 內建的 utm 參數工具
- 你授權你的原創內容給其他平台分享,但卻被反客為主,你網站上的內容反而被爬蟲當作抄襲者
- EX:新聞網、LINE TODAY…等大型網站。本身網站權重過強,反而變成原創者
- 你的內容被內容農場型網站抄襲,導致被判定為重複內容
重複內容會使爬蟲混亂,搞不清楚哪個網頁才是本體。同時影響到權重的累積,損害你網站的整體排名。所以值得你花時間尋找並修復。
我將告訴你如何找到那些重複網頁,並且有效率地修復它。
使用 SEO 工具查找重複內容
◆ 站內重複內容
有兩種工具在查找重複內容和精簡內容方面做得很好。
第一個是 Raven Tools – Site Auditor。
它會掃描你的站點以查找重複的內容(或稀薄的內容)。並讓你知道哪些頁面需要更新。
第二個是 Semrush – Site Audit。
進入 Site Audit 後,它有一個「問題」頁面,可以顯示你的網站有哪些問題,當中就包含重複內容網頁。點擊連結後即可顯示那些網頁的標題及網址。

以上工具是專注於內部網站上的重複內容。
◆ 站外重複內容
「重複內容」也包括你從其他外部網站複製過來的內容,中文網站目前還沒有強力的工具可以直接全站分析,要尋找站外重複內容就只能仰賴搜尋引擎直接查詢。
如果你找到顯示在另一個網站上的文字片段,想知道你是否被當成原創作者,請在搜尋引擎搜索該文字。如果 Google 在結果中顯示你的頁面是第一名,代表他們認為你是該頁面/內容的原始作者。
但如果是英文內容的話,國外倒是有款厲害工具 Copyscape 。使用它的「批量搜索」功能,你就可以上傳 URL,並查看該頁面上的內容在網路上的所有顯示位置,非常給力。
期待它能盡早支援中文市場阿!

如何解決重複內容問題
◆ 添加 noindex 標籤
大多數網站都會有一些重複內容的頁面。這是沒關係的。
但當那些重複的內容頁面被索引時,這會成為一個問題,因為你的爬取額度被浪費掉了。
解決方案很簡單,將「noindex」標籤添加到這些頁面。noindex 標籤會告訴 Google 和其他搜索引擎不要索引此頁面。
▼ noindex 標籤語法

▼ 添加完後,你可以使用 Google Search Console 中的「測試線上網址」功能,立即檢查該網頁的 noindex 標籤是否設置正確。

▼ 如果 Google 仍將該頁面編入索引,你會看到「Google 可為網址建立索引」的訊息。這意味著你的 noindex 標籤設置不正確。

▼ 如果你看到“被 ‘noindex’ 標記排除”消息,那麼 noindex 標記正在發揮作用。

▼ 根據你網站的抓取預算,Google 可能需要幾天~幾週的時間、才能重新抓取你不想編入索引的網頁。因此,我建議檢查覆蓋率報告中的「已排除」選項,以確保你的未編入索引的頁面已從索引中刪除。

◆ 添加 Canonical 標籤
除了 noindex 標籤、還有一個很棒的做法,就是:Canonical 標籤
Canonical 標籤很適合用在內容非常相似的頁面。例如,你經營一個帽子的電商網站,你有一個專為牛仔帽設置的產品頁面。根據你網站的設置方式,每種尺寸、顏色和變化都可能導致產生不同的 URL,導致你的網頁權重被分散的亂七八糟。

幸運的是:你可以使用 Canonical 標籤、讓 Google 知道你的哪個頁面才是「本尊」,所有其他的都是變體(分身)。

◆ 內容轉型
前面提到的兩個方式,本質上都是利用技術 SEO 來保留唯一的本尊網頁,從而讓分身的權重完整集中到本尊身上,這個做法本身是很OK的。
但常有客戶會問我一個兩難題:「當他發現網站有重複內容時,卻發現兩個網頁都已經有了不錯的 SEO 排名,手心手背都是肉阿!讓他難以取捨。」
遇到這種問題,如果你無法割捨掉任一個網頁,那我給你的建議就是:「內容轉型」。「內容轉型」並不是什麼高深的技術 SEO,而是一種「關鍵字策略」。
舉例來說:
- 你發現有2個一模一樣的資深網頁、各自都有吃到 A/B/C/D/E 這5個不錯的關鍵字,因此無論放棄哪個都讓你心痛。
- 這時你可以調出近一年的數據,分析一下這2個網頁的流量分佈有何差異(畢竟即使內容相同,排名&流量也不可能完全一樣)。
- 分析下來你可能發現:第一個網頁的 A/B/C 關鍵字排名較強;第二個網頁則是 D/E 更好
- 此時你可以重新規劃內容,把第一個網頁的 D/E 部分刪除、擴充 A/B/C 這3組關鍵字的內容豐富度;同理,第二個網頁則是刪除 A/B/C、強化 D/E 的關鍵字內容
- 如此一來,轉型後的兩個網頁就能建立在原本累積的 SEO 權重上,持續專精在各自本來排名就比較好的關鍵字。未來也不用擔心哪天被 Google 懲罰重複內容了!

番外篇-外部內容重複
◆ 內容農場
現在太多爬蟲網站會去每天自動盜竊內容、只要你的內容還不賴,這些內容網站就有很高機會偷走你的文章,幾乎是避無可避。要想解決除了跟網站主聯繫;不然就是訴諸法律途徑了。
通常我會建議,除非那些內容網站的排名超越了你這個原作者,並嚴重影響到你的流量(甚至收益),你再花時間去處理這些不速之客;否則就無視他吧,處理起來 CP 值太低了!
◆ 大型網站授權
另一種情形則是授權分享的網站反而被 Google 以為是作者。這個情形比較常出現專欄作家身上,由於個人部落格 vs 授權網站的權重差距過大,導致 Google 誤判。
目前實務上暫時無解,小寫手只能想辦法讓自己網站的文章、與分享給大網站的文章做出差異化;或是斟酌未來要給大網站的文章數量。
以上,就是今天跟大家分享的「重複內容」解法了。眼尖的朋友可能會發現、解決方案我都是 FOCUS 在「站內重複內容」。原因是因為「站外重複內容」實務上很難處理,建議大家還是優先處理站內重複內容,待優化完成後,行有餘力再去處理外部重複內容