Als TechRadar Pro gerapporteerd eerder in januari 2023, een voormalige Yandex werknemer met een "politiek" motief heeft naar verluidt een uitgebreide opslagplaats van broncode gelekt voor veel van de producten van het webportaal, mogelijk licht werpend op de duistere kunst van zoekmachine optimalisatie .
BeginnersWeb (opent in nieuw tabblad) meldt dat de werknemer git-bronnen heeft gelekt voor in totaal 44.7 GB aan bestanden, die "alle" broncode van Yandex bevatten, behalve de antispamregels, die in juli 2022 zijn verkregen.
De ruwe broncode zal niet voor iedereen interessant zijn, Search Engine Land (opent in nieuw tabblad) 's rapport dat 17,854 zoekrangschikkingsfactoren zijn ontdekt als onderdeel van het lek, zou interessant moeten zijn voor elke persoon, bedrijf of publicatie die wil dat hun pagina's hoog scoren in zoekmachines.
Yandex lekt SEO-inzichten
A gedeeltelijke lijst met factoren gerangschikt door de Yandex-zoekmachine uit een bestand in de codebase, gedeeld door CEO van SEO-adviesbureau MOG Media Martin MacDonald, werpt enig licht op de aspecten van kopiëren waar Yandex gewicht aan toekent.
Per Russisch zoeknieuws (opent in nieuw tabblad) , deze omvatten PageRank en verschillende aspecten van links zoals leeftijd en relevantie, de waargenomen relevantie van kopiëren, host-reilability en aangeboren voorkeuren voor specifieke sites met vermeende autoriteit, zoals Wikipedia.
Een diepere, langere, meer technische duik voorbij Search Engine Land (opent in nieuw tabblad) laat ook zien dat deze prioriteit ook een "NEWS_AGENCY_RATING" omvat, waardoor de zoekmachine van Yandex de voorkeur kan geven aan bepaalde nieuwsorganisaties.
Anderen omvatten het aantal unieke bezoekers, percentages organisch verkeer en gemiddelde domeinrangschikkingen bij zoekopdrachten.
Het is echter misschien melodramatisch of een beetje desolaat voor MacDonald om het te omschrijven als "het meest interessante dat in jaren in SEO is gebeurd".
Hoewel de gelekte codebase zeker veel inzichten biedt, is het de moeite waard om op te merken dat veel websites beter zullen scoren op Google dan op Yandex, puur omdat de eerste veel bekender is.
Beide bedrijven hebben in de loop der jaren webengineers gedeeld, Yandex gebruikt veel van de open source-technologieën van Google, zoals TensorFlow en BERT, en verwijzingen naar Google-gegevens verschijnen in de gelekte codebase.
De diepe duik van Search Engine Land beweert echter dat het Yandex-lek algemeen inzicht kan geven in de anatomie van een moderne zoekmachine, maar volgens Russian Search News blijven veel van de gelekte zoekfactoren van Yandex ongebruikt of worden officieel als afgeschreven beschouwd.
Zelfs de technische diepte geeft toe dat veel van de bekende aspecten van Google (de zoekmachine), zoals de crawler en indexsystemen, verschillen van die van Yandex.
Dit alles, in combinatie met de ouderdom van de gelekte codebase, maakt het onduidelijk hoe het zal gaan met aannames over hoe Yandex en Google beide pagina's kunnen rangschikken.