Hành trình đi tìm nguồn backlink chất lượng ở Việt Nam

Hành trình đi tìm nguồn backlink chất lượng ở Việt Nam

>>> Xem bài Audit Backlink và tìm hiểu cách đánh giá chất lượng hệ thống backlink đang trỏ về trang web của bạn: Thế nào là Backlinks chất lượng

Có 3 cách làm link building phổ biến hiện nay là: kéo traffic từ mạng xã hội, bắn GSAdùng PBN. Cả ba cách làm này bạn đều cần có thời gian dài tìm hiểu, thử nghiệm và cân nhắc, vì hai cách làm cuối cùng có rủi ro tiềm ẩn.

Để giảm thiểu rủi ro, Quang bắt đầu bằng một cách làm phổ thông và an toàn hơn, đó là đăng tin lên các diễn đàn, trang rao vặt và các sàn thương mại điện tử một cách chọn lọc.

Đó cũng là cách làm tự nhiên mà bất kỳ công ty nào cũng nên làm khi muốn quảng bá thương hiệu của mình trên môi trường Internet, cho dù họ có chủ đích làm SEO hay không.

Để thu thập được thông tin các website này trên toàn cầu là việc không thể và cũng không cần thiết, nhưng nếu chỉ làm trong quy mô Việt Nam thì Quang có thể.

Quang sẽ làm trước, tổng hợp thành một danh sách, sau đó công bố chúng tới cộng đồng SEO tại Việt Nam.

Lúc đó, các bạn làm SEO khi đến công đoạn này, họ chỉ cần xác định được chủ đề của trang web mình, sau đó chọn ra nguồn backlink chất lượng từ danh sách, rồi xây dựng link building.

Bạn sẽ không cần phải qua giai đoạn tiền trạm tìm kiếm và phân loại tốn nhiều thời gian và công sức, từ đó sẽ tiết kiệm được một lượng lớn nguồn tài nguyên.

Quang bắt đầu từ dữ liệu của Ahrefs. Quang download danh sách xếp hạng Top 1 triệu Ahrefs Global, sau đó nạp vào URL Profiler để thu thập thông tin.

>>> Xem cụ thể và chi tiết cách tìm và lọc backinks chất lượng-liên quan (và bộ công cụ được sử dụng)

Sau 1 tuần lễ, dựa vào đuôi tên miền, Name ServerIP Country, Quang tập hợp được khoảng 4.000 trang web có chỉ số Domain Rating cao nhất Việt Nam (UR >=40).

Sau khi làm xong, Quang công bố bảng danh sách tại đây: https://tinyurl.com/y7d84ykz

Xong việc, Quang cũng đuối sức và bị trễ dự án, nên phải dừng lại mọi thứ để quay về công việc thường ngày của mình, gác lại những điều còn dang dở.

NHƯỢC ĐIỂM CỦA LIST TOP 4.000 AHREFS VIỆT NAM

Sau này, trong quá trình sử dụng bảng danh sách Top 4.000 Ahrefs Việt Nam, Quang thấy nó còn nhiều nhược điểm.
Đầu tiên, danh sách có nhiều trang là spam, vì khi tổng hợp Quang chỉ lọc theo một tiêu chí duy nhất là Ahrefs DR > 40.

DR cao chưa chắc tốt, vì chỉ cần bắn nhiều backlink là Ahrefs DR sẽ tăng, không quan trọng là backlink có chất lượng hay không. Cách tốt nhất là cần tạo ra một bộ lọc đủ mạnh để loại trừ domain độc hại.

  • Trước đây, trong quá trình xử lý tác vụ thủ công, Quang đã tạo được một bộ lọc spam. Quang tăng độ khó của bộ lọc này lên gần gấp đôi, rồi ép nó vào bảng danh sách Top 4.000 Ahrefs Việt Nam. Kết quả là 1.300 domain ra đi, chỉ còn 2.700 domain ở lại.
  • Thứ hai, các chủ đề chưa được tổng hợp lại. Quang xác định được các chủ đề của từng trang web, nhưng chưa gom và phân loại chúng thành từng nhóm lớn.
    • Giả sử bạn SEO về thực phẩm chức năng, thì nguồn backlink từ chủ đề Sức khỏe, Y tế (Healthy) là chất lượng nhất. Khi đó, bạn cần lọc Excel thủ công từ bảng danh sách đó thêm một lần nữa mới có được thứ mình cần. Việc này không khó, nhưng nhiều bạn không quen dùng Excel sẽ không làm được việc này.
    • Một yếu tố nữa là trước đây, Quang vừa dùng URL Profiler và Majestic để lấy chủ đề. Khoảng 50% domain Quang lấy thông tin từ Majestic sẽ có đủ 10 chủ đề, còn 50% domain còn lại lấy dữ liệu từ URL Profiler, nên chỉ có 3 chủ đề. Từ đó, lượng chủ đề có được sẽ bị thiếu hụt đi một mảng lớn.
  • Cái thứ ba là Quang chưa lấy được tiêu đề của trang web. Nếu chỉ nhìn vào tên miền, bạn sẽ rất khó biết được nội dung của chúng.
    • Ví dụ với domain maybomnuoc.com, bạn biết họ bán máy bơm nước. Nhưng với domain dạng thương hiệu như nesovietnam.org, bạn không đoán được chủ đề của họ là Tư vấn du học Hà Lan.
  • Và cuối cùng, sau khi đã tìm được trang web chất lượng và liên quan, bạn cần liên lạc với ban quản trị để đặt banner / guest post / thương lượng trao đổi backlink. Gọi điện cũng được, nhưng gửi email hàng loạt là cách nhanh chóng, làm được với số lượng lớn và tiết kiệm chi phí. Bảng danh sách của Quang không có sẵn danh sách email này.

Vì những lí do đó, Quang quyết định cào thêm dữ liệu một lần nữa để khắc phục các nhược điểm trên.

Note: Nếu không cẩn thận trong quá trình xây dựng backlink, đi link trên những trang spam, kém uy tín => bạn có thể sẽ bị dính án phạt tác vụ thủ công.

Tham khảo bài viết: xử lý án phạt tác vụ thủ công do tạo liên kết bất thường của Google 

TIẾP TỤC CUỘC CHIẾN

Thử thách lớn nhất là Majestic, vì để lấy được chủ đề liên quan, Quang phải dùng chức năng Topical Trust Flow trong Majestic.

Cách tốt nhất là gắn API Majestic vào URL Profiler, rồi chạy chương trình để lấy dữ liệu lớn tự động. Tuy nhiên, API Majestic quá đắt (400 USD / tháng), và Quang cũng không tìm được nơi mua chung tài khoản.

Nếu dùng chế độ free của URL Profiler, họ giới hạn check 500 domain / ngày và 3 chủ đề / domain, chứ không thể check được số lượng domain lớn và full cả 10 chủ đề như Majestic.

Chỉ còn một cách duy nhất, là cào dữ liệu từ Majestic một cách THỦ CÔNG.

Từ danh sách 4.000 domain ở trên, Quang lấy ra từng con rồi nạp vào Majestic, và download bộ backlink của chúng về. Chỉ trong bộ backlink đó, mới chứa đủ full 10 chủ đề Quang cần tìm. Quang nạp được 1.000 con thì tắt thở.

Kết thúc bước thu thập dữ liệu, Quang được khoảng 1.000 file Excel danh sách backlink. Quang chuyển qua giai đoạn thứ hai là xử lý dữ liệu thô.

Đó là một quá trình dai dẳng của việc nối file Excel, loại trừ trùng lặp, lọc ngôn ngữ, loại bỏ từng phần các domain không đạt chuẩn.

Vì muốn bảo vệ sự toàn vẹn của dữ liệu, Quang không gộp chung lại toàn bộ chúng, mà chia nhỏ ra từng phần để xử lý, để nếu có hư hỏng gì, Quang vẫn có thể hồi quy trở lại để khôi phục thông tin.

Quang dùng KuTools for Excel để nối các file Excel lại thành từng nhóm nhỏ một, rồi lại gom nhiều nhóm nhỏ lại thành các nhóm lớn hơn.

Công việc này giống như xây dựng kim tự tháp, nhàm chán và đơn điệu. Bật chương trình lên, bấm 3 cái nút trong vòng 10 phút một cách tuần tự, xong việc, rồi lại lặp lại quá trình đó nhiều lần cho đến hết khối dữ liệu.

Nó khiến Quang nghĩ mình giống một công nhân SEO thực thụ, không cần phải suy nghĩ và đầy cơ bắp, nhưng đó cũng là loại công việc giết chết đi sự đam mê của mình một cách nhanh chóng nhất.

Sau khi xử lý dữ liệu thô xong, Quang chuyển qua công đoạn ráp dữ liệu. Quang mua dữ liệu từ My Addr và chạy URL Profiler để lấy thêm dữ liệu, từ đó tạo bộ ra lọc spam, rồi vác nó đi tiêu diệt các domain độc hại và chất lượng thấp.

Cuối cùng, sau khi có bảng danh sách hoàn chỉnh, Quang chạy URL Profiler thêm một lần nữa để lấy thông tin tiêu đề trang web, phân loại website và địa chỉ email liên hệ của các webmaster.

KẾT QUẢ CUỐI CÙNG

Sau gần 1 tháng làm việc, xử lý khoảng 3.2 GB dữ liệu Excel và nốc nhiều lon Bò Húc, Quang cũng tạo được nguồn danh sách backlink chất lượng ở Việt Nam. Chúng có các chỉ số như sau:

  • Ahrefs DR > 30
  • Moz PA, Moz DA, Citation Flow > 15
  • Trust Flow > 10, Spam Core Moz < 6
  • Vượt qua test của Google Safe Browser API

Quang phân loại chúng thành 16 chủ đề chính, như phân loại của Majestic, bao gồm:

  1. Adult – Người trưởng thành.
  2. Arts – Nghệ thuật, Giải trí.
  3. Business – Kinh doanh, Thương mại.
  4. Computers – Máy tính, Điện tử.
  5. Games – Trò chơi
  6. Health – Sức khỏe, Y tế.
  7. Home – Gia đình, Đồ gia dụng.
  8. News – Tin tức, Báo chí.
  9. Recreation – Nghệ thuật, Sáng tạo.
  10. Reference – Giáo dục, Tham khảo.
  11. Regional – Địa lý, Khu vực.
  12. Science – Khoa học, Công nghệ.
  13. Shopping – Mua sắm.
  14. Society – Xã hội, Hành chính.
  15. Sports – Thể thao.
  16. World – Thế giới, Nước ngoài.

Hầu hết các domain Quang đều thu thập được tiêu đề trang web, phân loại nền tảng (Blog, Forum, CMS, Shopping…), tuổi đời và email liên hệ của webmaster.

Hành trình đi tìm nguồn backlink chất lượng ở Việt Nam

Bạn có thể xem ở đây: [sociallocker id=1093]https://tinyurl.com/y9dj8der[/sociallocker]

Chúc bạn thành công!!!

Nguồn Quang Silic trong Group SEO Việt Nam