Chia sẻ Dữ liệu lớn, vấn đề lớn: 4 chỉ số liên kết chính được so sánh

nguyentrangphongem · 17/12/24 lúc 21:40

Diễn Đàn SEO - vnseo.edu.vn -

Chào các bạn làm Seo trong thường xuyên theo dõi thế giới Seo, hôm nay tôi xin phân tích một chút về Big Data trong Seo và trước tiên bạn nên dành một chút thời gian trong tuần này để nhìn lại backlinks trong các công cụ liên kết dữ liệu. Chúng ta biết rằng backlinks vẫn là một trong những phần quan trọng nhất của thuật toán xếp hạng của Google. Vậy có cách nào để tập hợp dữ liệu tốt nhất? Làm thế nào chúng ta có thể đánh giá các chỉ số liên kết chất lượng bằng việc sử dụng các công cụ như Moz, Majestic, Ahrefs và SEMRush? Trong lịch sử, đã có 4 phương pháp chung cho câu hỏi này.

- Chiều rộng: chúng tôi có thể nhìn vào số lượng liên kết trong bất kỳ báo cáo nào. Chúng tôi biết rằng referring domains có mối tương quan mạnh với bảng xếp hạng tìm kiếm.

- Chiều sâu: Chúng ta cũng có thể lựa chọn để xem độ sâu của các trang web được thu thập thông tin chứ không phải là sự đa dạng của referring domains.

- Sự chồng chéo liên kết: một cách tiếp cận tinh vi hơn là đếm số lượng liên kết đó là Google Webmaster Tools.

- Sự thay đổi: cuối cùng, chúng ta có thể nhìn vào sự thay đổi của các chỉ mục. Bao nhiêu phần trăm các liên kết được index vẫn còn sống?

Có một số nghiên cứu thực sự tốt mà bạn có thể quan tâm:

- Các phân tích BuiltVisible của Moz, Majestic, GWT, Ahrefs và Search Metrics

- SEOBook của Moz, Majestic, Ahrefs và Ayima

- Nghiên cứu MatthewWoodward của Ahrefs, Majestic, Moz, Raven và SEO Spyglass

- Các phân tích Marketing Signals của Moz, Majestic, Ahrefs và Link Research Tools

- Nghiên cứu StoneTemple của Moz và Majestic

Đây là những bài viết rất hay có thể giải quyết được các phương pháp trên nhưng cũng có một giới hạn cụ thể với tất cả chúng. Chúng bỏ qua một trong những thước đo quan trọng mà chúng ta cần phải xác định lại giá trị của một liên kết: tỷ lệ đại diện cho đồ thị liên kết của Google. Vì vậy, dưới góc nhìn Marketing, chúng tôi quyết định cần phải có một cái nhìn sâu hơn.

Tỷ lệ đại diện cho dữ liệu điều khiển của Google

Vậy tại sao nó lại quan trọng để xác định tỷ lệ đại diện? Nhiều dữ liệu quan trọng và có giá trị sử dụng được xây dựng dựa trên mô hình tỷ lệ. PageRank, MozRank, CitationFlow và Ahrefs Rank là tỷ lệ thuận về bản chất.

Hình ảnh trực quan

Đồ thị liên kết là được ưu tiên hàng đầu. Bởi vì không có đại diện của Internet, mỗi đồ thị liên kết của Google là một mẫu thử nghiệm của web. Hãy tưởng tượng hình ảnh dưới đây là của web. Mỗi dấu chấm đại diện cho một trang trên Internet và các dấu chấm được bao quanh bằng màu xanh lá cây, nó đại diện cho việc được Google index trên một phần cụ thể của web.

Tất nhiên, Google không phải là tổ chức duy nhất thu thập dữ liệu web. Các tổ chức khác như Moz, Majestic, Ahrefs và SEMRush cũng có quyền thu thập dữ liệu của riêng mình.

Trong ví dụ trên, bạn có thể thấy các nhà cung cấp liên kết khác nhau cố gắng để index các trang web khác chẳng hạn như Google. Người cung cấp dữ liệu liên kết (màu tím) làm một công việc tốt khi xây dựng mô hình tương tự như Google. Nó không phải là lớn nhưng nó lại tỷ lệ thuận. Người cung cấp dữ liệu liên kết (màu xanh) được index lớn hơn nhiều và có nhiều điểm liên kết chung với Google nhưng nó lại không tỷ lệ. Vậy làm thế nào chúng ta làm cho các số liệu này được cân xứng? Và tập dữ liệu đó có cân xứng nhất với Google?

Phương pháp luận

Bước đầu tiên là xác định một phép đo tương đối để phân tích. Google không cho chúng ta nhiều thông tin về đồ thị liên kết của họ. Tất cả những gì chúng ta phải làm là có trong Google Search Console. Nguồn tài nguyên tốt nhất chúng ta có thể sử dụng được là referring domain. Đặc biệt, chúng tôi muốn nhìn vào những gì mà chúng tôi gọi là referring domain liên kết theo cặp. Nó sẽ là một cái gì đó giống như ask.com->mlb.com: 9.444, điều đó có nghĩa là ask.com liên kết đến mlb.com 9.444 lần.

Các bước

1. Xác định các cặp tên miền gốc và các giá trị từ hơn 100 trang web trong Google Search Console

2. Xác định tương tự cho Ahrefs, Moz, Majestic Historic, SEMrush

3. So sánh từng dữ liệu được thiết lập đến Google với một Poisson Distribution.

4. Chạy các mô phỏng với mỗi tập dữ liệu khác nhau (ví dụ Moz vs Maj, Ahrefs vs SEMrush, Moz vs SEMrush)...

5. Phân tích kết quả

Kết quả

Dường như có một số người sẽ giành chiến thắng rõ ràng ngay từ cái nhìn đầu tiên. Moz cạnh với Ahrefs nhưng trên bảng, Moz và Ahrefs khá là đồng đều. Moz, Ahrefs và SEMRush dường như là tốt hơn nhiều so với Majestic Fresh và Majestic Historic. Điều đó có thực sự đúng? Và tại sao?

Thì ra có một mối quan hệ tỷ lệ nghịch giữa kích thước chỉ mục. Điều này có vẻ đối nghịch nhau.

Điều đó có nghĩa là gì?

Mỗi tổ chức đều có thể tạo ra chiến lược thu thập dữ liệu của riêng mình. Khi bạn phát hiện ra hàng triệu liên kết, bạn phải ưu tiên cho những người mà bạn có thể thu thập thông tin tiếp theo. Google cũng có một số ưu tiên trong việc thu thập dữ liệu ví dụ như Moz, Majestic, Ahrefs và SEMRush. Có rất nhiều công cụ khác nhau để bạn có thể lựa chọn.

- Bạn có thể ưu tiên phát hiện liên kết. Nếu bạn muốn xây dựng index lớn, bạn có thể ưu tiên thu thập dữ liệu các trang trên site mà nó đã cung cấp những liên kết mới.

- Bạn có thể ưu tiên các nội dung độc đáo. Nếu bạn muốn xây dựng một công cụ tìm kiếm, bạn có thể ưu tiên cho việc tìm kiếm các trang web mà không giống như những gì bạn đã thấy trước đó. Bạn có thể chọn thu thập domains có lịch sử cung cấp dữ liệu độc đáo và ít nội dung trùng lặp.

- Bạn có thể ưu tiên cho các nội dung mới. Nếu bạn muốn giữ lại các tìm kiếm của bạn gần đây, bạn có thể ưu tiên thu thập các trang mà thay đổi thường xuyên

- Bạn có thể ưu tiên giá trị nội dung, việc thu thập dữ liệu URL là quan trọng nhất dựa vào số lượng các liên kết gửi đến trang đó.

Rất có thể, ưu tiên thu thập dữ liệu của một tổ chức sẽ được pha trộn một số các tính năng này nhưng rất khó để thiết kế một cách chính xác như Google. Hãy thử tưởng tượng một thời điểm mà thay vì thu thập dữ liệu web, bạn muốn leo lên một cái cây. Bạn có thể đến với một chiến lược leo cây.

- Bạn quyết định leo lên những nhánh dài nhất mà bạn nhìn thấy ở mỗi ngã

- Một người bạn của bạn quyết định leo lên các chi nhánh mới đầu tiên bất kể nó mất ít hay nhiều thời gian

- Người bạn khác của bạn quyết định leo lên các chi nhánh mới và nhìn thấy một nhánh sắp off.

Mặc dù có nhiều chiến lược khác nhau nhưng mọi người đều chọn nhánh đầu tiên và tất tả mọi người đều chọn đi theo nhánh thứ 2 giống nhau.

Tuy nhiên, khi những người leo núi đi xa hơn và xa hơn thì sự lựa chọn của họ cuối cùng đã tạo ra kết quả khác nhau. Điều này giống hệt với các trình thu thập như Google, Moz, Majestic, Ahrefs và SEMRush. Khi thu thập dữ liệu càng nhiều thì càng có nhiều sự ưu tiên, khi đó sẽ gây ra sự bất bình đẳng. Đây không phải là sự thiếu hụt. Tuy nhiên, chúng tôi không hoàn toàn mất nó. Khi chúng tôi index, chúng tôi có thể đưa ra một số kết luận về cách thức tương tư khi ưu tiên thu thập dữ liệu của Google.

Thật tiếc lầ, chúng ta phải cẩn thận trong kết luận của chúng ta. Chúng tôi chỉ có một vài điểm dữ liệu để làm việc, do đó rất khó để xác định dữ liệu liên quan đến phân tích này. Có thể vào thời điểm này, chúng ta không thể thực hiện kết luận này.

Vì vậy, chúng ta làm gì?

Bạn có một danh sách các domains và URL mà bạn muốn biết giá trị tương đối của chúng. Quá trình này có thể trông giống như thế này ...

- Kiểm tra Open Site Explorer để xem tất cả các URL có trong chỉ mục của họ. Nếu vậy, bạn đang tìm kiếm các thước đo có thể tỷ lệ thuận với đồ thị liên kết của Google.

- Nếu mọi liên kết không xảy ra trong quá trình index, di chuyển đến Ahrefs và sử dụng nó để xếp hạng nếu tất cả những gì bạn cần là PageRank.

- Nếu bất kỳ liên kết nào bị thiếu từ chỉ mục của Ahrefs hoặc bạn cần một cái gì đó liên quan đến sự tin tưởng, bạn hãy chuyển sang Majestic Fresh.

- Cuối cùng, sử dụng Majestic Historic cho phạm vi lớn nhất sẵn có.

Điều quan trọng là bạn chỉ ra khả năng tất cả các URL mà bạn muốn kiểm tra khi độ chính xác của các dữ liệu bị giảm. Xem xét kích thước của dữ liệu Majestic, bạn không thể bỏ qua chúng vì bạn ít có khả năng để nhận được giá trị null so với các công cụ khác.

Còn SEEMrush? Họ đang tiến bộ nhưng họ không công bố bất kỳ số liệu thống kê tương đối mà có thể hữu ích trong trường hợp đặc biệt này. Có lẽ chúng ta phải hy vọng sẽ thấy được nhiều dữ liệu hơn từ họ để họ sớm đưa ra index như họ đã hứa.

Khuyến cáo cho ngành công nghiệp đồ liên kết

Tất cả chúng ta được biết rằng nó là dữ liệu lớn nhưng chúng ta gần như không bao giờ nghe nói đó là dữ liệu tốt. Tôi biết rằng team của Moz, Majestic, Ahrefs, SEMrush và một số team khác đang quan tâm bắt chước Google nhưng tôi rất thích nhìn thấy một số tổ chức đứng lên chống lại sự quyến rũ của dữ liệu. Nó có thể bắt đầu với các thử nghiệm chiến lược thu thập dữ liệu khác nhau để xem nếu họ tạo ra một kết quả tương tự khi dữ liệu được chia sẻ trong Google Search Console. Nếu hầu hết các dữ liệu gần giống với Google thì chắc chắn rằng nó sẽ nhận được một chiếc vương miện mang tên người chiến thắng.
Nguồn: thegioiseo.com