Ως TechRadar Pro αναφερθεί νωρίτερα τον Ιανουάριο του 2023, πρώην Yandex υπάλληλος με «πολιτικά» κίνητρα φέρεται να διέρρευσε μια ευρεία αποθήκη πηγαίου κώδικα για πολλά από τα προϊόντα της διαδικτυακής πύλης, ρίχνοντας δυνητικά φως στη σκοτεινή τέχνη του βελτιστοποίηση μηχανών αναζήτησης .
BleepingComputer (ανοίγει σε νέα καρτέλα) αναφέρει ότι ο υπάλληλος διέρρευσε πηγές git με συνολικό μέγεθος 44.7 GB αρχείων, που περιέχουν «όλο» τον πηγαίο κώδικα του Yandex, εκτός από τους κανόνες κατά του ανεπιθύμητου περιεχομένου, που ελήφθησαν τον Ιούλιο του 2022.
Ο ακατέργαστος πηγαίος κώδικας δεν θα ενδιαφέρει όλους, Αναζήτηση Land κινητήρα (ανοίγει σε νέα καρτέλα) Η αναφορά του ότι αποκαλύφθηκαν 17,854 παράγοντες κατάταξης αναζήτησης ως μέρος της διαρροής θα πρέπει να ενδιαφέρει κάθε άτομο, επιχείρηση ή δημοσίευση που θέλει να δει τις σελίδες του να έχουν υψηλή κατάταξη στις μηχανές αναζήτησης.
Πληροφορίες SEO για διαρροές Yandex
A μερική λίστα παραγόντων που κατατάσσονται από τη μηχανή αναζήτησης Yandex από ένα αρχείο στη βάση κώδικα, το οποίο μοιράζεται ο Διευθύνων Σύμβουλος της συμβουλευτικής εταιρείας SEO MOG Media Martin MacDonald, ρίχνει λίγο φως στις πτυχές της αντιγραφής στις οποίες η Yandex εφαρμόζει βάρος.
για Ρωσικές ειδήσεις αναζήτησης (ανοίγει σε νέα καρτέλα) , σε αυτές περιλαμβάνονται η Κατάταξη σελίδας και πολλές πτυχές των συνδέσμων, όπως η ηλικία και η συνάφεια, η αντιληπτή συνάφεια του αντιγράφου, η επαναληψιμότητα του κεντρικού υπολογιστή και οι εγγενείς προτιμήσεις προς συγκεκριμένους ιστότοπους με αντιληπτή εξουσία, όπως η Wikipedia.
Μια βαθύτερη, μεγαλύτερη, πιο τεχνική κατάδυση Αναζήτηση Land κινητήρα (ανοίγει σε νέα καρτέλα) δείχνει επίσης ότι αυτή η προτεραιότητα περιλαμβάνει επίσης ένα "NEWS_AGENCY_RATING", επιτρέποντας στη μηχανή αναζήτησης του Yandex να δείχνει προτίμηση σε ορισμένους ειδησεογραφικούς οργανισμούς.
Άλλα περιλαμβάνουν τον αριθμό των μοναδικών επισκεπτών, τα ποσοστά οργανικής επισκεψιμότητας και τη μέση κατάταξη τομέα σε όλα τα ερωτήματα.
Ωστόσο, είναι ίσως μελοδραματικό ή λίγο έρημο για τον MacDonald να το περιγράφει ως «το πιο ενδιαφέρον πράγμα που έχει συμβεί στο SEO εδώ και χρόνια».
Ενώ η βάση κώδικα που διέρρευσε προσφέρει σίγουρα μια σειρά από πληροφορίες, αξίζει να σημειωθεί ότι πολλοί ιστότοποι θα προσπαθήσουν να κατατάσσονται καλά στο Google έναντι του Yandex, καθαρά επειδή το πρώτο είναι πολύ πιο γνωστό.
Και οι δύο εταιρείες έχουν μοιραστεί μηχανικούς ιστού όλα αυτά τα χρόνια, η Yandex χρησιμοποιεί πολλές από τις τεχνολογίες ανοιχτού κώδικα της Google, όπως το TensorFlow και το BERT, και οι αναφορές σε δεδομένα της Google εμφανίζονται στη βάση κώδικα που διέρρευσε.
Ωστόσο, η βαθιά κατάδυση του Search Engine Land υποστηρίζει ότι η διαρροή Yandex μπορεί να δώσει γενική εικόνα για την ανατομία μιας σύγχρονης μηχανής αναζήτησης, αλλά, σύμφωνα με τις Ρωσικές Ειδήσεις Αναζήτησης, πολλοί από τους παράγοντες αναζήτησης κατάταξης που διέρρευσαν του Yandex παραμένουν αχρησιμοποίητοι ή θεωρούνται επίσημα υποτιμημένοι.
Ακόμη και η τεχνική βαθιά κατάδυση παραδέχεται ότι πολλές από τις γνωστές πτυχές της Google (της μηχανής αναζήτησης), όπως τα συστήματα ανίχνευσης και ευρετηρίου, διαφέρουν από το Yandex.
Όλα αυτά, σε συνδυασμό με την ηλικία της βάσης κώδικα που διέρρευσε, καθιστά ασαφές το πώς θα λειτουργήσουν οι υποθέσεις σχετικά με τον τρόπο κατάταξης των σελίδων από το Yandex και την Google.