Cách Khắc Phục Trùng Lặp Nội Dung trên WordPress
17 Nov, 2021 admin
Bất cứ khi nào chúng ta nói về SEO, thì trùng lặp nội dung là một điều mà mọi chuyên gia SEO đều sẽ khuyên bạn nên tránh. Vấn đề trùng lặp nội dung phát sinh từ rất nhiều vấn đề. Hôm nay, chúng ta sẽ cùng tìm hiểu một số lý do cơ bản và sẽ cố gắng khắc phục từng cái một.
Mỗi khi chúng ta nói đến WordPress, một bình luận phổ biến nhất mà bạn sẽ luộn nhận được là “Wordpress đã được tối ưu hóa cho SEO”. Đó là sự thật nhưng không phải hoàn toàn đúng. Bạn có thể bắt đầu một trang web trên WordPress và mong đợi nó có thứ hạng dần tốt hơn. WordPress là một sự lựa chọn khôn ngoan nhưng đó không phải là tất cả. Có rất nhiều thứ mà bạn cần phải làm từ những ngày đầu tiên khi bạn bắt đầu sử dụng WordPress. Để biết chi tiết hơn hãy tham khảo 10 việc cần làm trước khi đưa trang WordPress vào hoạt động
Vậy thì vấn đề trùng lặp nội dung WordPress thực sự là gì?
Nội dung là một nhưng có thể truy cập bằng hai URL. Điều này có thể xảy ra trong blog của bạn hoặc cũng có thể xảy ra trên một blog copy-paste nào đó. Ví dụ, trên một blog được tối ưu hóa một cách hời hợt, một bài viết có thể được truy cập vào bằng:
- http://www.domain.com/SEO-optimization
- http://domain.com/SEO-optimization
- http://domain.com/tag/SEO
- http://www.domain.com/tag/SEO
- http://domain.com/category/SEO
- http://www.domain.com/Category/SEO
- http://domain23.com/SEO-post (External website)
Bạn sẽ nhìn thấy một cách rõ ràng, bạn đã tạo ra sáu bản sao chép cho nội dung của mình một cách mà không hề biết điều đó và Google sẽ bối rối không biết link nào mà họ nên đưa ra. Một cách chính xác họ sẽ chọn bất cứ link nào trong số chúng và số còn lại sẽ bị dấu khỏi các tìm kiếm trên Google. Điều này có thể là một vấn đề vì Google sẽ crawl blog của bạn một cách từ từ vì quá nhiều các nội dung bị trùng lặp. Giờ thì, câu hỏi phổ biến nhất là việc trùng lặp nội dung trên WordPress là gì và làm thế nào để khắc phục điều đó.
Tại đây tôi sẽ trình bày một sốlỗi khiến nội dung bị trùng lặp thường gặp trên WordPress mà bạn đang tạo ra trên blog của mình và làm thế nào để sửa lỗi này.
Làm thế nào để tìm ra một nội dung trùng lặp trên WordPress?
Hãy cùng bàn về nội dung trùng lặp trong WordPress blog của bạn. Đây là nơi đầu tiên để bắt đầu và bằng việc khắc phục điều này, bạn sẽ có thể để ý đến 40% các vấn đề của blog SEO.
Hãy đi đến Google.com và tìm kiếm tên trang của bạn trong định dạng này:
site:dieuhau.com
Hãy xem tất cả các đường link và duyệt đến trang cuối cùng và xem các kết quả được đưa ra với các kết quả bị bỏ qua. Bạn sẽ thấy tất cả các đường link mà Google đã liệt kê ra từ blog của mình, và phân tích đường link nào trên Google không nên xuất hiện. Một phần phổ biến mà các bots tìm kiến không nên chỉ ra là các tags, các thể loại, tác giả, các lưu trữ, tìm kiếm, và tương tự như vậy. Nếu bạn thấy bất cứ cái nào trong số các kết quả trên, đây là lúc để làm việc với blog và làm cho nó trở nên tốt hơn.
Ngăn chặn index cho các Tag
Đây là nơi đầu tiên bạn nên bắt đầu. Nếu bạn đang hiển thị bài viết theo Tag và cho phép các công cụ tìm kiếm index chúng, thì bạn đang tạo ra nội dung trùng lặp cho blog của mình. Lời khuyên của tôi là hãy ẩn hoặc chặn index các bài viết ở đây. Bạn có thể các plugins như Yoast SEO để nhanh chóng thiết lập việc này. Tham khảo thêm 10 chức năng quan trọng nhất của Yoast SEO để tối ưu hóa website WordPress
Tác giả & lưu trữ:
Trong WordPress, bạn luôn có thể tìm tác giả hoặc lữu trữ từ các tháng trước đó. Đây là một tính năng có thể sử dụng và hữu ích cho độc giả của bạn. Nhưng với các công cụ tìm kiếm, đó chỉ là những trang khác, và không có lý do gì mà bot nên index chúng.
URL đính kèm hình ảnh:
Đây là một vấn đề nhỏ nhưng có rất nhiều người không nhận ra nó cho đến khi bạn thật sự gặp phải nó. Khi chúng ta đính kèm hình ảnh với bài đăng trong WordPress, nó sẽ thêm các hình ảnh như các URL đính kèm, và khi người đọc click vào hình ảnh, nó sẽ đưa họ đến trang của hình ảnh được đính kèm.
Vậy URL của bạn sẽ như thế này:
- www.domain.com/1/
- www.domain.com/1/SEOImage
Giờ thì có rất nhiều vấn đề liên qua đến điều này. Đầu tiên, các vấn đề trùng lặp nội dung hoặc các trang web thật sự vô ích sẽ được index trên Google – điều mà không có giá trị gì. Trong công cụ Google Webmaster, bạn sẽ thấy những link như vậy được liệt kê tại các tags mô tả và điều đó cũng không thực sự hữu dụng.
Làm thế nào để khắc phục các vấn đề về URL có đính kèm hình ảnh?
Một cách nhanh nhất là bằng cách sử dụng phần cài đặt Permalink của Yoast SEO plugin. Bạn sẽ thấy một lựa chọn như này “Redirect attachment URL’s to parent post URL”. Hãy để lựa chọn đó được đánh dấu, và điều này sẽ xử lý vấn đề của bạn.
Nếu không bạn đang tải lên hình ảnh cho bài đăng của mình, bạn luôn có thể kết nối nó một cách trực tiếp đến hình ảnh hoặc không.
Vấn đề ReplytoCom:
Sau khi Google Panda được tung ra, đây là một trong những vấn đề thường gặp nhất mà tôi từng thấy trên trang của mình và của những người khác do ảnh hưởng đến thứ hạng tìm kiếm. Đặc biệt là khi DieuHau chạm phải Panda, đây là một trong số các lý do chính cho cùng việc đó. Bạn có thể tự kiểm tra cho blog của mình bằng việc tìm kiếm trên Google với cấu câu lệnh
site:domain.com replytocom
Nếu bạn thấy các link đến replytocom, đây là lúc bạn cần nhanh chóng cài đặt các thông số URL từ công cụ Google Webmaster là index.
Canonical URL là một trong những khía cạnh quan trọng nhất của On-page SEO. Một URL có thể được truy cập từ:
- http://tenmien.com/1
- http://tenmien.com/1/
- htttp://www.tenmien.com/1
- http://www.tenmien.com/1/
Bây giờ tất cả các URL đều chỉ đến cùng một bài đăng và như vậy một lần nữa tạo ra nội dung trùng lặp cho bạn. Bằng việc thiết lập canonical URL, bạn đang định hướng các robots tìm kiếm đến link mà chúng nên chỉ mục đến. Đây là một trong những điều đầu tiên mà bạn nên nhìn vào blog của bạn.
Trong WordPress 2.9+, đây là một tính năng mặc định của WordPress hoặc không thì bạn có thể sử dụng một plugin như tính năng inbuilt SEO By Yoast để nhanh chóng thêm canonical vào trang blog của bạn. Hơn nữa, nếu bạn thấy comment-page-1 và những vấn đề như vậy, nó cũng sẽ có thể được sửa bằng việc sử dụng canonical URL.
Giờ thì tất cả các vấn đề trùng lặp trên WordPress được nêu trên là những vấn đề mà bạn phải xử lý trực tiếp trên blog. Điều tồi tệ nhất cho việc trùng lặp nội dung là khi bạn bị phạt bởi vì hành động của người khác. Ví dụ, blogger nào đó sao chép bài đăng blog của bạn và được xếp thứ hạng cao hơn. Đây là khi bạn cần sự giúp đỡ của Google DMCA. Google DMCA rất hữu ích cho các bloggers và webmasters để nộp đơn khiếu nại về bất cứ những nội dung như vậy trên mạng mà được sao chép từ blog của bạn. Nếu nó là một blog trong Blogspot, Google sẽ ngay lập tức xóa bài đăng này và nếu nó là một blog self-hosted hoặc một trang tĩnh, Google sẽ gỡ bỏ trang web đó khỏi kết quả tìm kiếm.
Một vài điều quan trọng mà bạn nên biết về trùng lặp nội dung:
Trong phần lớn các trường hợp bất cứ giao diện WordPress tốt nào cũng sẽ quan tâm đến các vấn đề trùng lặp. Ví dụ, Genesis và nhiều giao diện khác giao diện tối ưu hóa SEO và đó chính là điểm khác biệt so với các giao diện WordPress miễn phí. Tuy vậy, bạn có thể cân nhắc việc sử dụng giao diện Genesis hoặc bạn có thể đơn giản chỉnh lại giao diện đang tồn tại của mình với sự giúp đỡ của các đoạn code và plugin để làm nó không bị trùng lặp nội dung.
Hãy cho chúng tôi biết những vấn đề trùng lặp nội dung WordPress nào khác mà bạn đang phải đối mặt cho đến bây giờ và bạn đang làm những gì để khắc phục vấn đề đó trên trang web của mình? Các bạn có thể tham khảo thêm bài viết cách khắc phục lỗi estavlishing database connection trong wordpress.