Audit Backlink – xử lý án phạt tác vụ thủ công do tạo liên kết bất thường của Google – P1

Audit Backlink – xử lý án phạt tác vụ thủ công do tạo liên kết bất thường của Google – P1

Audit Backlink là đánh giá chất lượng hệ thống backlink đang trỏ về trang web của bạn. Đây là công việc bạn phải làm mỗi khi bắt đầu dự án SEO mới và định kỳ mỗi tháng, cũng như khi từ khóa bị rớt hạng do ảnh hưởng tiêu cực của thuật toán Penguin hay dính án phạt tác vụ thủ công của Google.

Có lẽ, Quang sẽ không bao giờ phát triển được kỹ thuật audit backlink này, nếu như Quang không xử lý một tác vụ thủ công do tạo liên kết bất thường cho dự án của khách hàng.

Ngày trang web được Google xóa án phạt là ngày Quang có cảm giác như mình được trở về từ cõi chết. Rất mệt mỏi, nhưng Quang cũng đem về được cho mình những kinh nghiệm vô cùng quý giá. Hôm nay, Quang sẽ giới thiệu trọn vẹn quy trình đó tới bạn. Còn bạn áp dụng nó được thành công tới đâu là dựa vào tiềm năng của bạn.

Để Audit Backlink được tốt, bạn cần phải có dữ liệu. Đầu tiên, bạn hãy nạp tất cả các API mình có được vào URL Profiler, (xem bài: Tìm backlink liên quan và list 4k domain có chỉ số DR cao nhất Việt Nam) và chọn các mục Domain Level Data nhiều nhất có thể. Bạn càng thu thập được nhiều thông tin thì việc ra quyết định càng chính xác.

Trang web độc hại

Bạn đăng ký Google Safe Browsing API, rồi gắn vào URL Profiler. Vì đây là dữ liệu của Google, nên kết quả là chính xác tuyệt đối. Các domain Malware and Phishing là những trang web thuộc loại độc hại nhất, bạn cần phải disavow nó ngay lập tức. Trung bình trong khoảng 500 domain trỏ về trang web, sẽ có khoảng từ 2 – 5 domain thuộc dạng này.

Trùng lặp địa chỉ IP và IP Class C

Ví dụ: 103.68.82.189 là địa chỉ IP, thì 103.68.82 là IP Class C. Nếu hai trang web có cùng địa chỉ IP thì gần như 100%, chúng thuộc cùng một hệ thống được xây dựng nên để thâu tóm PageRank (ngoại trừ một số ít trường hợp ngoại lệ). Còn nếu trùng lặp IP Class C, thì tỉ lệ này cũng lên tới 90%. Nếu bạn xây dựng hệ thống vệ tinh trên cùng một IP, thì người bình thường như Quang còn phát hiện được, huống chi là Google. Lọc các địa chỉ này hơi lâu, nên Quang có cách nhanh hơn để xác định chúng, đó là nhìn vào chỉ số Domains on IP Address. Nếu chỉ số này lớn hơn 1, nghĩa là trên địa chỉ IP đó có nhiều hơn một domain.

Google Index và Đuôi tên miền

Quang thường dùng SpinEditor để quét nhanh Google Index, và loại các domain có số lượng nội dung được Google Index quá thấp ( 100, 200 hoặc hơn tùy vào trường hợp). Các đuôi tên miền giá rẻ, mua tầm vài chục ngàn / năm như .xyz, .top, .club… cũng rất nguy hiểm, vì Google có hệ thống tự động bật cảnh báo spam cho những tên miền loại này.

Tín hiệu mạng xã hội và Thông tin đăng ký tên miền

Nếu một domain không hề có bất kỳ một tài khoản mạng xã hội nào, hoặc có tài khoản mạng xã hội nhưng sự tương tác (Social Shares) quá thấp đều đáng ngờ. Ngoài ra, các trang web giấu đi thông tin người đăng ký tên miền, và đặc biệt là email đăng ký tên miền của nhiều domain bị trùng lặp, thì đó chắc chắn là hệ thống được dựng lên bởi cùng một người.

Server country và Wayback machine

Nếu bạn phục vụ cho khách hàng từ Việt Nam, thì domain trỏ về từ các nước như Việt Nam, USA, Japan, Singapore… là chuyện bình thường. Nhưng nếu chúng đến từ China, Korea, Russia, Romania, Portugal, Brazil… hay một nước trời ơi nào đó mà đọc tên nước xong bạn cũng không biết nó nằm ở đâu trên bản đồ thế giới, thì tốt nhất, bạn hãy xếp chúng vào danh sách đáng ngờ. Ngoài ra, các tên miền không có dữ liệu trên Wayback Machine, hay mới được mua trong thời gian gần đây (như năm 2017, 2016…), bạn cần cẩn thận với chúng. Vì chúng có thể được tạo nên chỉ để xây dựng hệ thống, chứ không thật sự là một trang web được phát triển tự nhiên.

Site Type

Site Type nghĩa là loại trang web. Nếu trang web thuộc dạng Blog, CMS, Shopping, Social…, đó thường là những backlink tự nhiên. Còn nếu trang web thuộc loại Forum, Bookmarking, Profile, Signature, Footer, Sidebar, Comment, Trackback, Wiki… đó thường là backlink thuộc dạng đáng ngờ.

Đánh giá các chỉ số của Ahrefs, Majestic, Moz

Bạn cần điều chỉnh các chỉ số này sao cho phù hợp với quy mô trang web của bạn. Với các trang web nhỏ, Quang thường tạo bộ lọc phát hiện liên kết bất thường là: DA, CF < 10, DR < 15, TF < 5, Trust Ratio < 0.5. Nếu bạn xử lý trang web có quy mô lớn hơn, hãy nâng các chỉ số này lên, nhưng vẫn cần sự hài hòa giữa chúng.

Đánh giá chỉ số của Alexa và SEMRush

Tuy chỉ số của Alexa và SEMRush không chính xác bằng chỉ số của ba công cụ trên, nhưng nó cũng đáng để đánh giá. Quang thường gán nhãn bất thường các trang web không được Alexa và SEMRush cập nhật dữ liệu, hoặc vị trí xếp hạng Alexa hay số lượng từ khóa ở trong top 100 của SEMRush Keyword quá thấp.

Quang dùng riêng chỉ số của Ahrefs để đánh giá backlink, vì Ahrefs là công cụ phân tích backlink chính xác nhất hiện nay. Quang đặt hai cột Ahrefs Backlinks và Ref Domains ở gần nhau, rồi sort Ahrefs Backlinks từ cao tới thấp và quan sát. Khi nhìn từ trên xuống dưới, nếu chỉ số Ahrefs Backlinks và Ref Domains đang cao, nhưng đột nhiên xuất hiện một domain có số lượng Ahrefs Backlinks cao mà Ref Domains lại thấp, thì đó là một domain bất thường. Ở đây không có một con số cụ thể để làm mốc cho bạn, mà chỉ có cách là bạn nhìn xuôi theo dòng chảy dữ liệu của chúng, rồi phát hiện các điểm dị thường. Bạn có thể tô màu các cột theo dạng Color Scales trong Exel để phát hiện nhanh chóng hơn.

Spam Core của MOZ

Đây là một trong những chỉ số tốt nhất của MOZ, và cũng là một trong những chỉ số đáng tin cậy nhất để bạn đánh giá độ spam của domain. Ahrefs và Majestic không có chỉ số tương tự như thế này, mà bạn phải lọc thủ công. Bộ phận R&D của MOZ, đứng đầu là Dr.Matt Peters đã thống kê dữ liệu lớn (500.000 domain) rồi so sánh tỉ lệ phần trăm với các domain nằm trong blacklist của Google, và đưa ra được 17 yếu tố có dấu hiệu spam. Moz khuyến cáo các domain có chỉ số Spam Core từ 5 / 17 trở lên là nguy hiểm. Còn theo kinh nghiệm thực tế của Quang, khi Spam Core từ 3 trở lên, chúng đã có dấu hiệu của sự bất thường. Với tài khoản Moz Pro bình thường, bạn không thể gắn API của Moz vào URL Profiler để lấy được chỉ số Spam Core này, mà bạn phải dán URL domain vào Open Site Explorer để lấy thủ công. Tuy nhiên, do bọ của MOZ ít khi cập nhật, dữ liệu lấy về không đủ, nên Quang thường phải mua thêm dữ liệu của bên thứ ba là My – Addr.

Penalty Risk trong SpyGlass

SpyGlass thuộc bộ PowerSuite của Link Assistant, chuyên dùng để phân tích backlink. Phiên bản mới nhất hiện nay dựa trên hơn 8 dấu hiệu (tuổi domain, incoming và outgoing links, PageRank, anchor text và keyword, IP…) để tính toán TỰ ĐỘNG mức độ spam của domain. Nếu chỉ số này trên 30% là ở mức cảnh báo, còn trên 70% là rất nguy hiểm. Với bản miễn phí, bạn chỉ xem được chỉ số, chứ không thể xuất file dữ liệu. Bạn có thể nhờ đàn anh đang dùng bản Spy Glass trả phí, quét domain rồi xuất file kết quả giùm bạn. Còn nếu không có ai giúp thì bạn có thể chụp ảnh màn hình, rồi dùng phần mềm convert hình ảnh sang file excel cũng được. Tuy nhiên, bạn lưu ý là backlink trong SpyGlass được mua từ bên thứ ba là WebMeUp, nên không có độ chính xác cao. Bạn có thể tổng hợp domain từ Ahrefs, sau đó thêm thủ công vào SpyGlass rồi quét để có kết quả chính xác hơn.

Cuối cùng, công cụ đánh giá chính xác nhất vẫn là con người. Bạn vào trang web tình nghi, sau đó xem nội dung trang web có nhất quán không, bài viết có văn phong tự nhiên do con người viết ra không, trang web có hình ảnh minh họa và có liên kết nội bộ không? Những yếu tố này chỉ có con người mới có thể đánh giá được, chứ công cụ thì thua. Tuy nhiên, do nguồn lực về con người luôn hạn chế và rất quý giá, nên bạn chỉ nên dùng nguồn lực này ở bước cuối cùng. Những bước đầu, bạn nên tập trung vào việc thu thập và phân tích số liệu sẽ hiệu quả hơn.

Audit Backlink – xử lý án phạt tác vụ thủ công do tạo liên kết bất thường của Google – P1

TỔNG HỢP DỮ LIỆU

Sau khi đánh giá được từng yếu tố xong, Quang cần tổng hợp các dữ liệu rời rạc lại để ra quyết định cuối cùng. Nhưng tổng hợp bằng cách nào, đồng thời, mỗi yếu tố lại có mức độ quan trọng khác nhau, mình không thể quy đồng tất cả.

Hãy quay về với ý tưởng xếp hạng của Google. Google dựa trên 200 yếu tố khác nhau. Họ đánh giá từng yếu tố xong, sau đó quy định mức độ quan trọng của từng yếu tố bằng các trọng số, rồi viết một giải thuật để tính toán cho ra kết quả cuối cùng. Quang biết được đây chính là thứ mình cần, nhưng cũng phải suy nghĩ mất 1 tuần mới có thể biến ý tưởng thành hiện thực.

Đó là đầu tiên, Quang GẮN NHÃN cho từng yếu tố, sau đó quy định mức độ bất tường của từng yếu tố qua ĐIỂM SỐ. Quang tạo ra 2 loại nhãn là Nguy hiểmBất thường. Nhãn Nguy hiểm gồm Malware (10 điểm), Spam Core Moz (Spam Core từ 3 tới 10 tương ứng từ 1 tới 8 điểm), Backlink Ahrefs (2 điểm), trùng lặp IP (2 điểm) và phần Kiểm tra của con người (3 điểm). Nhãn Bất thường gồm tất cả các yếu tố còn lại, 1 điểm cho từng yếu tố. Riêng với SEMRush, Quang chỉ cho 0.5 điểm, vì độ chính xác của nó không quá cao.

Khi đó, công việc tổng hợp các số liệu trở nên rất dễ dàng. Bạn đánh giá sự bất thường của từng yếu tố, rồi cho điểm chúng. Cuối cùng, bạn dùng hàm SUM để cộng các điểm số đó lại, thế là xong.

Bạn có thể tham khảo một file Audit Backlink tại đây: [sociallocker id=1093]https://tinyurl.com/ybkjc5x4 [/sociallocker]

Mời các bạn xem tiếp Phần 2: Xử lý án phạt tác vụ thủ công do tạo liên kết bất thường của Google

Nguồn: Bài viết chia sẻ của bạn Quang Silic trong một Group SEO