Duplicate content – cách sửa lỗi Duplicate content

Duplicate content là gì?

Duplicate content ( Trùng lặp nội dung ), là sự trùng lặp nội dung trên một website hay nhiều website. Các SE ( search engine ) muốn hiển thị nội dung đa dạng và phong phú, để người dùng có nhiều sự lựa chọn khác nhau. Vì vậy các SE chỉ hiển thị một nội dung duy nhất trong kết quả tìm kiếm.

Cách khắc Duplicate content:
– Bạn không lên trỏ nhiều tên miền về một website, hay nhiều Link khác nhau cùng trỏ về một nội dung trong trang website của bạn( Post một bài nhưng nhiều lần trong một website ).
– Tránh các trường hợp copy nội dung của các website khác về trang của mình.
– Sử dụng meta tags, thuộc tính “ nofollow ”, robots.txt để kiểm soát nội dung của mình.
– Khi bạn muốn thay đổi cấu trúc bài viết, nên redirect 301 URL cũ đến URL mới.

Những phương pháp giúp bạn có thể sửa lỗi duplicate content một cách hiệu quả

Nếu bạn muốn khách hàng của mình luôn hài lòng với những thông tin mà họ có thể tìm được trên website hãy đảm bảo chỉnh sửa các lỗi duplicate content xấu.

1) 404 (Not Found)

Nếu bạn cảm thấy nội dung dung trùng lặp thực sự không đem lại lợi ích cho người tìm kiếm hay nó không đem lại cho bạn những liên kết hay traffic cách đơn giản là cứ xóa nó đi và để lỗi 404.

2) Redirect 301

Khi sử dụng chuyển hướng 301 đồng nghĩa với việc bạn thông báo cho cả người dùng và bọ tìm kiếm rằng trang web mà họ trang truy cập đã chuyển đến một địa chỉ khác. Và công cụ này sẽ chuyển hướng người dùng đến một url mới. Đây là một cách làm tốt nếu nội dung trùng lặp đó nằm trên URL gắn thẻ canonical.

3) Robot.txt

Đây là phương pháp được dùng khi bạn muốn nội dung trùng lặp hiển thị với người dùng nhưng ngăn chặn không cho bọ tìm kiếm thu thập thông tin. Điều này được thực hiện khá đơn giản. Tuy nhiên nó chỉ hiệu quả với các trang chưa index , còn với các trang đã được index thì nó vô tác dụng.

4) Meta Robots Tag

Cách này được áp dụng nếu bạn muốn điều hướng khả năng tìm kiếm thông tin của bots tại trang. Nó sẽ thông báo cho bots tìm kiếm không index trang này hoặc các liên kết trong đó. Cái này được khá nhiều công ty SEO áp dụng và làm cho trang thân thiện hơn với search engine so với sử dụng Robot.txt

5) Rel=canonical

Hay được gọi với cái tên “Rel-Canonical” hoặc là “canonical Tag”, cách làm này giúp webmaster có thể tạo ra canonical cho bất kỳ trang nào. Vì vậy, khi bots tìm kiếm thu thập thông tin trên một trang có gắn thẻ canonical nó sẽ hiểu và loại bỏ nội dung trùng lặp trên URL đó.

Thẻ này cực kỳ đơn giản trong việc thiết kế website chuẩn SEO, tuy nhiên đây cũng là kẻ hở cực lớn để cho đối thủ khai thác triệt để quá trình làm SEO của ta và dưa ta vào lỗi trùng lặp nội dung

6) Google URL Removal

Cách làm này theo tôi là phương pháp cuối cùng nếu phải thực hiện việc xóa bỏ các nội dung trùng lặp. Nó được sử dụng trong google webmaster tool. Để làm được bạn làm theo các bước sau : Vô google webmaster tool rồi Click vào “Site Configuration” => click tiếp “Crawler Access” . Sau bước này bạn sẽ thấy hiển thị ra 3 tab. Hãy click vào cái thứ 3 “Remove URL” .
Tuy nhiên bạn sẽ cần làm một số việc trước để có thể thực hiện xóa là với trang cần xóa bạn cần 404, Robots.txt blog hay thẻ meta Noindex.

Trên đây là bài viết theo ý kiến riêng. Có thể nó đúng hoặc sai tại một số điểm, các bạn có thể bổ sung ý kiến để bài viết hoàn thiện hơn nhé.

 

duplicate-content

Be the first to comment

Leave a Reply