Google Crawl/Index Website như thế nào?

mai minh đức
mai minh đức
Trả lời 13 năm trước

Trước hết Google không cung cấp bất kỳ sự đảm bảo hoặc hứa hẹn nào rằng họ sẽ crawl (thu thập) và index (đánh chỉ mục) cho một Website mới ra đời. Điều quan trọng là bạn phải duy trì nội dung trang Web của mình để một lúc nào đó được chấp nhận. Google sẽ có một số cách nhất định để crawl, index cũng như xếp hạng cho Website của bạn. Và Google sẽ xử lý chúng bằng những cách khác nhau dựa trên độ phổ biến và tầm quan trọng của trang Web. Vì thế bài viết này sẽ cho chúng ta có cái nhìn tóm tắt về việc Google làm điều này như thế nào.

CRAWLING (THU THẬP)

Những con bọ Google (Google Spiders) sẽ crawl khi bạn đăng một vài thứ trên Website của mình – một vài bài viết mới lên Blog chẳng hạn. Tuy nhiên, điều này sẽ không xãy ra ngay lập tức vì nó còn dựa trên nhiều yếu tố. Google sẽ không cho bất kỳ nhân viên nào của họ làm việc này, tất cả công việc crawl Website đều do thuật toán trên máy tính đảm nhiệm. Vì thế nó phải xem xét những yếu tố như PageRank, Backlinks, …trước khi thu thập thông tin về Website. Việc đặt một Sitemap có thể làm công việc crawling của những chú bọ Google thực hiện nhanh hơn. Tuy nhiên, Google sẽ không crawling bất cứ thứ gì bạn đặt trên trang Web vì Sitemap chỉ giúp Google biết về nội dung trang Web của bạn mà thôi.

INDEX (ĐÁNH CHỈ MỤC)

Sau khi nội dung của bạn được thu thập thì nó có thể được đánh chỉ mục (index). Trước khi index, Google phải chắc chắn rằng nội dung của bạn là có giá trị. Còn không phải tức là nó được liệt vào nội dung không có giá trị – điều này xãy ra với một số lý do chính như sau :

- Những bài viết trùng lập trong trang Web – tức là trong cùng 1 trang web mà có đến 2-3 bài giống nhau hoàn toàn.

- Những bài viết cùng nội dung với bên ngoài – Google cho là bạn sao chép từ Website khác, điều này làm bài viết của bạn không còn được đánh giá cao nữa.

- Nội dung quá yếu, không có giá trị.

Vì thế, phải chắc chắn rằng nội dung của bạn là duy nhất – không nên copy từ những nội dung đã tồn tại trước.

BAO LÂU ĐỂ GOOGLE ĐÁNH CHỈ MỤC WEBSITE?

Đây là câu hỏi mà các Blogger mới rất quan tâm. Câu trả lời ở đây là nó phụ thuộc vào sự liên kết nội dung trên site bạn. Đối với những Website mới thì sẽ mất cả tuần thậm chí là cả tháng để được Google index.

LÀM CÁCH NÀO ĐỂ WEBSITE ĐƯỢC INDEX NHANH HƠN

Một điều mình luôn nhấn mạnh rằng, với những Blog mới, bạn phải thật sự kiên nhẫn. Kiên nhẫn không đồng nghĩa là tạo ra Website rồi ngồi đó mà … chờ. Google sẽ đánh giá Blog của bạn theo tần suất cập nhật thông tin mới, backlinks, … Vậy thay vì ngồi chờ đợi để được index, bạn sẽ có nhiều công việc để làm đấy chứ. Chăm chỉ viết bài và tạo ra các liên kết ngược chất lượng.

Đối với những Website đã tồn tại một thời gian bạn đừng coi thường điều này, vì bạn vẫn phải đối mặt với việc lập chỉ mục đấy. Luôn đảm bảo nội dung là duy nhất nhé ! Bởi với Google : “Content is King”.