[Hướng dẫn] xuất Full báo cáo các URL đã – chưa index trong GSC

[Hướng dẫn] xuất Full báo cáo các URL đã – chưa index trong GSC

Hướng dẫn xuất Full báo cáo các URL đã – chưa index trong GSC

Bất kì ai quen thuộc với Google Search Console đều biết rằng giới hạn dữ liệu có thể xuất ra là 1000 hàng, cho dù đó là các báo cáo về cụm từ tìm kiếm, trang, quốc gia, hình thức xuất hiện trong kết quả tìm kiếm,… Hiếu đã có một bài viết trước đó hướng dẫn mọi người cách sử dụng Looker Studio để xuất toàn bộ các dữ liệu này: 

Cách xuất File trong GSC ko bị giới hạn 1K data

Tuy nhiên, những báo cáo này chỉ ghi nhận các URL đã xuất hiện trên SERPs, nếu bạn muốn kiểm tra toàn bộ các URL đã được lập chỉ mục, chưa được lập chỉ mục thì cách này không hiệu quả.

Trong bài viết này, Hiếu sẽ hướng dẫn mọi người cách để có thể xuất dữ liệu toàn bộ các trang, bài viết đã được lập chỉ mục, chưa được lập chỉ mục trên website. Dữ liệu này sẽ rất quan trọng nếu bạn đang quản lý một website với hàng chục nghìn bài viết và sản phẩm. Bạn có thể kiểm tra các URL nào chưa được lập chỉ mục, lập chỉ mục rồi nhưng không xuất hiện trên SERPs để từ đó quyết định có nên giữ chúng lại, sửa đổi, ép index, hay xoá bỏ.

Các bước để xuất File full báo cáo URL trogn GSC

Bước 1: Tạo các sitemap với tối đa 1000 URL trên 1 sitemap.

Vì Google Search Console chỉ cho phép xuất dữ liệu dưới 1000 hàng, nên nguyên tắc là chúng ta sẽ tạo ra các sitemap với tối đa 1000 URL để từ đó có thể xuất dữ liệu theo từng sitemap.
Ở đây, Hiếu sẽ hướng dẫn anh chị cách làm trên WordPress với Plugin Rankmath SEO. Trên các nền tảng khác, anh chị cũng có thể thực hiện tương tự. Thay vì để tất cả bài viết, sản phẩm trong một sitemap duy nhất, chúng ta sẽ chia ra thành các sitemap nhỏ hơn với 1000 URL.

Anh chị tìm đến Cài đặt sơ đồ trang > Chung > Liên kết trên mỗi sơ đồ trang web > Chỉnh giá trị này lên 1000 (ảnh 1)

check index in GSC 1
check index in GSC 1

Bước 2: Truy cập https://domain[.]com/sitemap_index.xml, lấy danh sách các sitemap cần kiểm tra URL (ảnh 2).

check index in GSC 2
check index in GSC 2

Bình thường, Hiếu sẽ setup trong cài đặt của Rankmath SEO để chỉ tạo các sitemap với các URL mà Hiếu muốn lập chỉ mục như post, category product, product,… Các sitemap cho từng loại sẽ được chia nhỏ thành nhiều sitemap khác nhau như post-sitemap1.xml, post-sitemap2.xml,… Mỗi sitemap này sẽ có tối đa 1000 URL như chúng ta đã setup trong bước 1.
 
Bước 3: Thêm các sitemap này vào trong Google Search Console (ảnh 3).

check index in GSC 3
check index in GSC 3

Ở bước này, công việc của bạn chỉ đơn giản là thêm các sitemap đã lấy ở bước 2 vào Google Search Console. Bạn có thể sẽ gặp lỗi “Không thể tìm nạp”, đừng lo lắng, đây chỉ là lỗi hiển thị khi GSC chưa cập nhật dữ liệu kịp thời, bạn thêm sitemap mới hoặc reload lại trang là sẽ hết lỗi này.
 
Bước 4: Bây giờ bạn có thể điều hướng đến mục Trang > Tất cả các trang đã biết > Chọn bộ lọc theo sơ đồ trang web > Chọn đến một sitemap bất kì mà bạn muốn kiểm tra (ảnh 4).

check index in GSC 4
check index in GSC 4

Bước 5: Xuất dữ liệu các trang đã được lập chỉ mục. Sau khi đã vào xem báo cáo cho một sitemap cụ thể lúc này bạn có thể vào “Xem dữ liệu về các trang đã được lập chỉ mục” > Sau đó xuất dữ liệu ra file CSV hoặc Google Sheet. (ảnh 5, 6). Dữ liệu trong file báo cáo bao gồm cả số lượt hiển thị của URL đó trên SERP.

check index in GSC 5
check index in GSC 5
check index in GSC 6
check index in GSC 6

Bước 6: Xuất dữ liệu các trang chưa được lập chỉ mục: Ngoài dữ liệu các trang đã được lập chỉ mục, bạn có thể xuất dữ liệu các trang Đã thu thập dữ liệu – hiện chưa được lập chỉ mục hoặc Đã phát hiện thấy – hiện chưa được lập chỉ mục,…

Chọn vào từng mục để đến báo cáo của chúng, sau đó xuất báo cáo về định dạng file CSV hoặc Google Sheet như ở bước 5. (ảnh 7)

check index in GSC 7
check index in GSC 7

Bước 7: Thực hiện tương tự cho danh sách sitemap còn lại sau đó tổng hợp các file lại theo các tiêu chí như: URL đã được lập chỉ mục, URL đã thu thập dữ liệu – hiện chưa được lập chỉ mục, URL đã phát hiện thấy – hiện chưa được lập chỉ mục,… Bạn có thể sắp xếp các URL đã được lập chỉ mục theo số lần hiển thị.

check index in GSC 8
check index in GSC 8

Dựa vào các báo cáo này, bạn sẽ có phương án audit website toàn diện. Ví dụ như các URL đã phát hiện thấy nhưng chưa được lập chỉ mục nguyên nhân là do đâu, mình sẽ audit, ép index lại hay xoá bỏ. Các trang có lượt hiển thị thấp cần đi thêm backlink hoặc chỉnh sửa nội dung, bổ sung từ khoá,…

Cuối cùng, những cài đặt ở trên mình đã setup khi mới tạo website nên dữ liệu có ngay lập tức lúc mình cần báo cáo. Nếu bạn mới bắt đầu thực hiện theo các bước này, dữ liệu có thể sẽ được cập nhật lại ngay theo từng sitemap, hoặc bạn cần kiên nhẫn đợi vài ngày để Google Search Console cập nhật lại dữ liệu.

Hi vọng rằng những chia sẻ của Hiếu có thể giúp bạn trong quá trình audit toàn diện website. Hiếu còn một số bài viết khác về SEO mà bạn có thể tìm đọc như:

  • 9 cách sử dụng Liên Kết Nội Bộ để ranking em thường làm: https://www.facebook.com/groups/nghienseo/posts/1303068477029819/
  • Hướng dẫn sử dụng External link: https://www.facebook.com/groups/nghienseo/posts/1317731708896829/
  • Cách xuất File trong Google Search Console không bị giới hạn 1000 data – link trên bài

Hiếu Nguyễn – SEO Chữa Lành

Bạn đọc comment:

Nguyễnn Đạtt k liên quan lắm nhưng ở bước thứ 2, thay vì là post-sitemap thì có cách nào để mình sửa tên của cái site map k nhỉ. vd như trang seo-category-sitemap k nhỉ

Chien Nguyen -Nguyễnn Đạtt dùng mặc định được cái tiện. Còn yêu cầu của bạn thử tìm mấy plugin chuyên tạo sitemap và cho custom. Hoặc code riêng

Nguyễnn Đạtt –Chien Nguyen cảm ơn anh ạ

Ngô Phùng Khánh bữa làm dự án mà biết cái này thì có phải đỡ công sinbyte từng link một không :((

Nguyễn Hiếu -Ngô Phùng Khánh yes

Nhan Phamvan Cho m hỏi ngoài lề, trước mình không kiểm soát được ăn thịt từ khóa, giờ có hơn 10K contents ở trong Đã thu thập dữ liệu hiện chưa được lập chỉ mục, thì m nên xử lý ntn? Audit từng bài 1 thì không có sức rồi, để nguyên không làm gì cả? hay là mình sẽ xóa đi 404 hay tìm cách 301? Mong các cao nhân chỉ giáo

Ngô Phùng Khánh -Nhan Phamvan Kinh nghiệm của em là nếu website đang tăng trưởng thì cứ kệ nó không làm gì ạ.

Nhan Phamvan –Ngô Phùng Khánh web đg bị xuống b à, m đg xem xét phương án xử nên xử lý thế nào

Pháp Què Sao ko share đc nhỉ

Nguyễn Hiếu -Pháp Què Group kín k cho share ạ. A vô trang cá nhân của em nha

Ngô Phùng Khánh -Pháp Què group kín mà anh

Toan Nguyen –Nguyễn Hiếu copy cái link bài vẫn share được mà, chỉ là người thấy phải join group mới thấy nội dung bài, Group private có cái hay là không bơm được tương tác, nên tương khá con số là thật khá cao

Long “Mình nhớ là sitemap của RM chỉ nhận url đc mở index còn những url bị noindex thì nó sẽ auto ko cho vào sitemap Ko biết cách này có làm đc vs những url noindex k nhỉ, lâu r ko config sâu RM nên k nhớ là cái này có auto bỏ các url noindex nữa ko”

Ngô Phùng Khánh -Long có setup được đó anh, mà mặc định là no index thì nó không thêm vào

[Hướng dẫn] xuất Full báo cáo các URL đã – chưa index trong GSC