Als TechRadar Pro berichtet früher im Januar 2023, ein ehemaliger Yandex Mitarbeiter mit einem „politischen“ Motiv hat angeblich ein weitreichendes Repository mit Quellcode für viele Produkte des Webportals geleakt, was möglicherweise Licht auf die dunkle Kunst von wirft Suchmaschinen-Optimierung .
PiependerComputer (öffnet in neuem Tab) berichtet, dass der Mitarbeiter Git-Quellen mit insgesamt 44.7 GB an Dateien durchgesickert ist, die „den gesamten“ Quellcode von Yandex mit Ausnahme der Anti-Spam-Regeln enthalten, die im Juli 2022 erhalten wurden.
Der rohe Quellcode wird nicht für jeden von Interesse sein, Search Engine Land (öffnet in neuem Tab) Der Bericht von , dass 17,854 Suchmaschinen-Ranking-Faktoren als Teil des Leaks aufgedeckt wurden, sollte für alle Personen, Unternehmen oder Veröffentlichungen von Interesse sein, die ihre Seiten in Suchmaschinen hoch eingestuft sehen möchten.
Yandex verliert SEO-Einblicke
A Teilliste der von der Yandex-Suchmaschine eingestuften Faktoren aus einer Datei in der Codebasis, die vom CEO der SEO-Beratung MOG Media, Martin MacDonald, geteilt wird, wirft ein wenig Licht auf die Aspekte der Kopie, auf die Yandex Wert legt.
für Russische Suchnachrichten (öffnet in neuem Tab) , dazu gehören PageRank und verschiedene Aspekte von Links wie Alter und Relevanz, die wahrgenommene Relevanz der Kopie, Host-Zuverlässigkeit und angeborene Präferenzen gegenüber bestimmten Websites mit wahrgenommener Autorität, wie z. B. Wikipedia.
Ein tieferer, längerer, technischerer Tauchgang vorbei Search Engine Land (öffnet in neuem Tab) zeigt auch, dass diese Priorität auch eine „NEWS_AGENCY_RATING“ beinhaltet, die es der Suchmaschine von Yandex ermöglicht, bestimmte Nachrichtenorganisationen zu bevorzugen.
Andere umfassen die Anzahl der eindeutigen Besucher, den Prozentsatz des organischen Verkehrs und die durchschnittlichen Domain-Rankings über Abfragen hinweg.
Es ist jedoch vielleicht melodramatisch oder ein wenig trostlos, wenn MacDonald es als „das Interessanteste, was seit Jahren im Bereich SEO passiert ist“ beschreibt.
Während die durchgesickerte Codebasis sicherlich eine Reihe von Erkenntnissen bietet, ist es erwähnenswert, dass viele Websites versuchen werden, bei Google einen guten Rang gegenüber Yandex einzunehmen, nur weil ersteres weitaus bekannter ist.
Beide Unternehmen haben im Laufe der Jahre Webingenieure gemeinsam genutzt, Yandex verwendet viele der Open-Source-Technologien von Google, wie TensorFlow und BERT, und Verweise auf Google-Daten erscheinen in der durchgesickerten Codebasis.
Der Deep Dive von Search Engine Land argumentiert jedoch, dass das Yandex-Leck einen allgemeinen Einblick in die Anatomie einer modernen Suchmaschine geben kann, aber laut Russian Search News bleiben viele der durchgesickerten Ranking-Suchfaktoren von Yandex ungenutzt oder gelten offiziell als abgeschrieben.
Sogar der technische Deep Dive gibt zu, dass sich viele der bekannten Aspekte von Google (der Suchmaschine), wie z. B. seine Crawler- und Indexsysteme, von denen von Yandex unterscheiden.
All dies, kombiniert mit dem Alter der durchgesickerten Codebasis, macht es unklar, wie Annahmen darüber, wie Yandex und Google beide Seiten bewerten werden, abschneiden werden.