Як TechRadar Pro паведамляецца раней у студзені 2023 года былы Яндэкс Супрацоўнік з «палітычных» матываў нібыта зліў шырокае сховішча зыходнага кода многіх прадуктаў вэб-партала, патэнцыйна праліваючы святло на цёмнае мастацтва Пошукавая аптымізацыя .
BleepingComputer (адкрываецца ў новай укладцы) паведамляе, што супрацоўнік зрабіў уцечку крыніц git агульным аб'ёмам 44.7 ГБ файлаў, якія змяшчаюць «увесь» зыходны код Яндэкса, за выключэннем правілаў барацьбы са спамам, якія былі атрыманы ў ліпені 2022 года.
Неапрацаваны зыходны код будзе цікавы не ўсім, Зямля Пошукавая (адкрываецца ў новай укладцы) Справаздача аб тым, што 17,854 XNUMX фактары ранжыравання ў пошуку былі выяўленыя як частка ўцечкі, павінна быць цікавай для любога чалавека, кампаніі або публікацыі, якія хочуць бачыць свае старонкі высокага рэйтынгу ў пошукавых сістэмах.
Яндэкс уцечка інфармацыі аб SEO
A няпоўны спіс фактараў ранжыравання пошукавай сістэмы Яндэкс з аднаго файла ў кодавай базе, якім падзяліўся генеральны дырэктар кансалтынгавай кампаніі па SEO MOG Media Марцін Макдональд, сапраўды пралівае святло на аспекты копіі, да якіх Яндэкс прымяняе вагу.
Папулярны ў цяперашні час
Для Рускі пошук Навіны (адкрываецца ў новай укладцы) , да іх адносяцца PageRank і некаторыя аспекты спасылак, такія як узрост і рэлевантнасць, уяўная рэлевантнасць копіі, магчымасць размяшчэння на хасце і прыроджаныя перавагі да пэўных сайтаў з уяўным аўтарытэтам, такіх як Вікіпедыя.
Больш глыбокае, працяглае і больш тэхнічнае апусканне Зямля Пошукавая (адкрываецца ў новай укладцы) таксама паказвае, што гэты прыярытэт таксама ўключае «NEWS_AGENCY_RATING», што дазваляе пошукавай сістэме Яндэкса аддаваць перавагу пэўным інфармацыйным арганізацыям.
Іншыя ўключаюць колькасць унікальных наведвальнікаў, працэнт арганічнага трафіку і сярэдні рэйтынг дамена па запытах.
Тым не менш, гэта, магчыма, меладраматычна або трохі бязлюдна, калі Макдональд апісвае гэта як «самае цікавае, што здарылася ў SEO за апошнія гады».
У той час як уцечка кодавай базы, безумоўна, прапануе масу разумення, варта адзначыць, што многія вэб-сайты будуць імкнуцца атрымаць лепшы рэйтынг у Google, чым Яндэкс, выключна таму, што першы значна больш вядомы.
На працягу многіх гадоў у абедзвюх кампаній ёсць агульныя вэб-інжынеры, Яндэкс сапраўды выкарыстоўвае многія тэхналогіі Google з адкрытым зыходным кодам, такія як TensorFlow і BERT, і спасылкі на дадзеныя Google з'яўляюцца ў базе кода, якая прасачылася.
Тым не менш, глыбокі агляд Search Engine Land сцвярджае, што ўцечка Яндэкса можа даць агульнае ўяўленне аб анатоміі сучаснай пошукавай сістэмы, але, як паведамляе Russian Search News, многія з уцечаных пошукавых фактараў ранжыравання Яндэкса застаюцца невыкарыстоўваемымі або афіцыйна лічацца абясцэненымі.
Нават глыбокае тэхнічнае паглыбленне прызнае, што многія з вядомых аспектаў Google (пошукавай сістэмы), такіх як сканер і сістэмы індэксавання, адрозніваюцца ад Яндэкса.
Папулярны ў цяперашні час
Усё гэта, у спалучэнні з узростам уцечкі кодавай базы, робіць незразумелым, як будуць дзейнічаць здагадкі аб тым, як Яндэкс і Google могуць ранжыраваць старонкі.