Sebagai TechRadar Pro melaporkan sebelumnya pada Januari 2023, mantan Yandex karyawan dengan motif "politis" diduga telah membocorkan repositori kode sumber yang luas untuk banyak produk portal web, yang berpotensi menjelaskan seni gelap dari mesin pencari optimasi .
BleepingComputer (terbuka di tab baru) melaporkan karyawan tersebut membocorkan sumber git dengan total file 44.7GB, yang berisi "semua" kode sumber Yandex kecuali aturan anti-spamnya, yang diperoleh pada Juli 2022.
Kode sumber mentah tidak akan menarik bagi semua orang, Search Engine Land (terbuka di tab baru) 's melaporkan bahwa 17,854 faktor peringkat pencarian telah terungkap sebagai bagian dari kebocoran harus menarik bagi siapa pun, bisnis atau publikasi yang ingin melihat halaman mereka berperingkat tinggi di mesin pencari.
Yandex membocorkan wawasan SEO
A sebagian daftar faktor yang diberi peringkat oleh mesin pencari Yandex dari satu file di basis kode, yang dibagikan oleh CEO konsultan SEO MOG Media Martin MacDonald, menjelaskan beberapa aspek penyalinan yang menjadi perhatian Yandex.
untuk Berita Pencarian Rusia (terbuka di tab baru) , ini termasuk PageRank dan beberapa aspek tautan seperti usia dan relevansi, relevansi salinan yang dirasakan, keandalan host, dan preferensi bawaan terhadap situs tertentu dengan otoritas yang dirasakan, seperti Wikipedia.
Penyelaman yang lebih dalam, lebih lama, dan lebih teknis Search Engine Land (terbuka di tab baru) juga menunjukkan bahwa prioritas ini juga menyertakan “NEWS_AGENCY_RATING”, yang memungkinkan mesin pencari Yandex menunjukkan preferensi ke organisasi berita tertentu.
Lainnya termasuk jumlah pengunjung unik, persentase lalu lintas organik, dan peringkat domain rata-rata di seluruh kueri.
Namun, mungkin melodramatis, atau sedikit sepi, bagi MacDonald untuk menggambarkannya sebagai "hal paling menarik yang pernah terjadi di SEO selama bertahun-tahun".
Sementara basis kode yang bocor pasti menawarkan banyak wawasan, perlu dicatat bahwa banyak situs web akan mencari peringkat yang baik di Google daripada Yandex, murni karena yang pertama jauh lebih dikenal.
Kedua perusahaan telah berbagi insinyur web selama bertahun-tahun, Yandex menggunakan banyak teknologi sumber terbuka Google, seperti TensorFlow dan BERT, dan referensi ke data Google muncul di basis kode yang bocor.
Namun, penyelaman mendalam Search Engine Land berpendapat bahwa kebocoran Yandex dapat memberikan wawasan umum tentang anatomi mesin pencari modern, tetapi, per Berita Pencarian Rusia, banyak faktor pencarian peringkat Yandex yang bocor tidak digunakan, atau secara resmi dianggap terdepresiasi.
Bahkan penyelaman mendalam teknis mengakui banyak aspek Google (mesin pencari) yang diketahui, seperti perayap dan sistem indeksnya, berbeda dari Yandex '.
Semua ini, dikombinasikan dengan usia basis kode yang bocor, membuat tidak jelas bagaimana asumsi tentang bagaimana Yandex dan Google dapat memeringkat halaman.