Lượng trang index bởi Google giảm mạnh, nguyên nhân nào?

Posted on 30/05/2009

0


 

Mấy ngày qua “có dịp” được nghiên cứu đề tài này, tổng kết được nhiều điều hay ho và quan trọng. Chia sẻ với bà con! 

 

Lịch sử của vấn đề:

Theo cuộc “truy lùng” của tôi bằng chính Google về vấn đề này thì thấy rằng chuyện tuột index từ mấy chục K xuống thậm chí còn vài chục xảy ra nhan nhản từ hồi Google ‘khai thiên lập địa’ đến giờ làm cho bà con webmaster cứ phải lên máu, có người còn tuyệt vọng đến nỗi … khóc trên diễn đàn . Nghĩ lại thấy Google cũng thiệt là … ác! Chung qui có 1 số nguyên nhân cơ bản sau:

 

Các nguyên nhân

1/ Duplicate content

 

2/ Những lần Google thay đổi thuật toán: đặc biệt là có 1 đợt thay đổi lớn năm 2006 gây ‘sóng gió’ một thời làm cho ‘người người oán than’, ‘nhà tan cửa nát’ (xem bài viết đầy bức xúc này về Google sẽ rõ!)

 

3/ Site của bạn còn quá mới, chỉ số index cứ lên xuống xuống lên là chuyện thường tình. 

 

4/ Một trường hợp khác cho rằng việc tụt giảm Google index là do chính cách bạn set update frequency trên sitemap xml file

 

5/ Tương tự, 1 trường hợp khác ghi nhận chính những lỗi trong sitemap file sẽ làm tuột số trang Google index của bạn. Người viết bài còn hoang mang đặt ra 1 câu hỏi, nếu sitemap file được tạo ra để hỗ trợ cho webmaster để Google bot dễ dàng index hơn, vậy tại sao nó lại gây ra hậu quả nặng nề như vậy. Vậy có nên sử dụng nó không? 

Bài viết này tôi cũng muốn xoáy mạnh vào  mặt xấu của quá trình làm và submit sitemap. Thực tế nhiều trường hợp đã bị tuột index dữ dội sau khi thay đổi sitemap. Tôi không có ý phê phán việc sử dụng sitemap, nhưng muốn cảnh báo “hãy hết sức cẩn thận” nếu không thì hậu quả thật khó lường. Sau đây là trường hợp cuối cùng mà chính tôi là người chứng kiến hậu quả:

 

6/ PHẢI HẾT SỨC CẨN THẬN KHI ĐỤNG CHẠM ĐẾN SITEMAP:

1 trường hợp rất “kinh điển” như sau:

Bạn lấn cấn giữa việc lựa chọn url của website có www hoặc không có www. Google webmaster tool cho phép bạn tạo 2 tài khoản có và không có www cho cùng 1 website, để bạn có thể tracking được cả hai loại url này. 

Tuy nhiên, việc này sẽ không ảnh hưởng gì đến quá trình index miễn sao bạn chỉ submit sitemap lên 1 tài khoản duy nhất. Điều này có nghĩa là những ai lỡ tay submit sitemap mới lên tài khoản bên www mà vẫn để mấy thằng sitemap cũ bên tài khoản không có www, thì ôi thôi, chết toi !

Hiện tưởng xảy ra là (tui tận mắt chứng kiến) : số lượng index giảm đều đều vài k 1 ngày, crawl rate của google bot cũng tuột cái vèo. Cái triệu chứng này nhìn sao giống Duplicate content –> site xấu –> không crawl nữa, giảm index luôn. Hmm!

Chết! 

Vì vậy, bà con ơi! Hãy cẩn thận với cái thằng sitemap!

———-

Sau đây là 1 số link đọc chơi cho vui để thấy cái sự khổ sở đến mức nào của việc bị tuột index:

http://www.google.com/support/forum/p/Webmasters/thread?tid=4cb3f95654c9402f&hl=en

http://www.websitebabble.com/search-engines-directories/5240-why-did-indexed-pages-decrease.html

http://www.google.co.uk/support/forum/p/Webmasters/thread?tid=41a0d196e477b9b2&hl=en

http://www.webmaster-talk.com/the-google-forum/173049-decrease-of-indexed-pages-in-google.html

http://www.webmasterworld.com/google/3905582.htm