Като TechRadar Pro съобщи по-рано през януари 2023 г., бивш Yandex служител с „политически“ мотив се твърди, че е изтекъл широкообхватно хранилище на изходен код за много от продуктите на уеб портала, което потенциално хвърля светлина върху тъмното изкуство на оптимизация за търсещи машини .
BleepingComputer (отваря се в нов раздел) съобщава, че служителят е изтекъл git източници с общо 44.7 GB файлове, съдържащи „целия“ изходен код на Yandex, с изключение на неговите правила за защита от спам, които са получени през юли 2022 г.
Суровият изходен код няма да представлява интерес за всички, Land търсачка (отваря се в нов раздел) Докладът на , че 17,854 XNUMX фактора за класиране при търсене са разкрити като част от изтичането на информация, трябва да представлява интерес за всеки човек, бизнес или публикация, които искат да видят своите страници високо класирани в търсачките.
Изтичане на информация за SEO от Yandex
A частичен списък на факторите, класирани от търсачката Yandex от един файл в кодовата база, споделено от главния изпълнителен директор на SEO консултантската компания MOG Media Мартин Макдоналд, наистина хвърля малко светлина върху аспектите на копирането, към което Yandex прилага тежест.
на Руски новини за търсене (отваря се в нов раздел) , те включват PageRank и няколко аспекта на връзките, като възраст и релевантност, възприеманата уместност на копието, възможност за пренасочване към хост и вродени предпочитания към конкретни сайтове с възприеман авторитет, като Wikipedia.
По-дълбоко, по-дълго, по-технично гмуркане Land търсачка (отваря се в нов раздел) също така показва, че този приоритет включва също „NEWS_AGENCY_RATING“, позволявайки на търсачката на Yandex да показва предпочитания към определени новинарски организации.
Други включват броя на уникалните посетители, процентите на органичния трафик и средното класиране на домейни по заявки.
Въпреки това, може би е мелодраматично или малко отчаяно Макдоналд да го опише като „най-интересното нещо, което се е случвало в SEO от години“.
Въпреки че изтеклата кодова база със сигурност предлага множество прозрения, заслужава да се отбележи, че много уебсайтове ще се стремят да се класират добре в Google пред Yandex, просто защото първият е много по-известен.
И двете компании споделят уеб инженери през годините, Yandex наистина използва много от технологиите с отворен код на Google, като TensorFlow и BERT, и препратки към данни на Google се появяват в изтеклата кодова база.
Въпреки това, дълбокото гмуркане на Search Engine Land твърди, че изтичането на Yandex може да даде обща представа за анатомията на съвременната търсачка, но според Russian Search News много от изтеклите фактори за търсене на класиране на Yandex остават неизползвани или официално се считат за амортизирани.
Дори техническото гмуркане признава, че много от известните аспекти на Google (търсачката), като системите за обхождане и индексиране, се различават от Yandex.
Всичко това, съчетано с възрастта на изтеклата кодова база, прави неясно как ще се справят предположенията за това как Yandex и Google могат да класират страниците.