باسم TechRadar Pro وذكرت في وقت سابق من يناير 2023 ، كان سابقًا ياندكس يُزعم أن موظفًا لديه دافع "سياسي" سرب مستودعًا واسع النطاق من التعليمات البرمجية المصدر للعديد من منتجات بوابة الويب ، مما قد يلقي الضوء على الفن المظلم لـ محرك البحث الأمثل .
BleepingComputer (يفتح في علامة تبويب جديدة) تشير التقارير إلى أن الموظف سرب مصادر git يبلغ مجموعها 44.7 جيجابايت من الملفات ، والتي تحتوي على "كل" كود مصدر Yandex باستثناء قواعد مكافحة البريد العشوائي ، التي تم الحصول عليها في يوليو 2022.
لن تكون شفرة المصدر الأولية محل اهتمام الجميع ، محرك البحث لاند (يفتح في علامة تبويب جديدة) يجب أن يكون تقرير "17,854" من عوامل تصنيف البحث التي تم الكشف عنها كجزء من التسريب محل اهتمام أي شخص أو شركة أو جهة نشر تتطلع إلى رؤية صفحاتها في مرتبة عالية في محركات البحث.
تسريب Yandex رؤى تحسين محركات البحث
A قائمة جزئية بالعوامل مرتبة بواسطة محرك بحث Yandex من ملف واحد في قاعدة البيانات ، شاركه الرئيس التنفيذي لشركة استشارات تحسين محركات البحث MOG Media Martin MacDonald ، يلقي بعض الضوء على جوانب النسخة التي تطبق Yandex وزنًا عليها.
إلى أخبار البحث الروسية (يفتح في علامة تبويب جديدة) ، تتضمن نظام ترتيب الصفحات PageRank والعديد من جوانب الروابط مثل العمر والملاءمة ، والأهمية المتصورة للنسخ ، وقابلية إعادة تعريف المضيف ، والتفضيلات الفطرية تجاه مواقع محددة ذات سلطة متصورة ، مثل ويكيبيديا.
الغوص أعمق وأطول وأكثر تقنية من قبل محرك البحث لاند (يفتح في علامة تبويب جديدة) يوضح أيضًا أن هذه الأولوية تتضمن أيضًا "NEWS_AGENCY_RATING" ، مما يسمح لمحرك بحث Yandex بإظهار التفضيل لبعض المؤسسات الإخبارية.
يشمل الآخرون عدد الزوار الفريدين ، والنسب المئوية لحركة المرور العضوية ، ومتوسط تصنيفات النطاق عبر الاستعلامات.
ومع ذلك ، ربما يكون وصفه ماكدونالد بأنه ميلودرامي ، أو مقفر قليلاً ، بأنه "الشيء الأكثر إثارة للاهتمام الذي حدث في تحسين محركات البحث منذ سنوات."
في حين أن قاعدة الكود التي تم تسريبها تقدم بالتأكيد مجموعة كبيرة من الأفكار ، فمن الجدير بالذكر أن العديد من مواقع الويب سوف تتطلع إلى الحصول على مرتبة جيدة على Google على موقع Yandex ، لمجرد أن الأول معروف بشكل أفضل.
شاركت كلتا الشركتين مهندسي الويب على مر السنين ، وتستخدم Yandex العديد من تقنيات Google مفتوحة المصدر ، مثل TensorFlow و BERT ، وتظهر الإشارات إلى بيانات Google في قاعدة الكود التي تم تسريبها.
ومع ذلك ، فإن الغوص العميق لـ Search Engine Land يجادل بأن تسريب Yandex يمكن أن يعطي نظرة عامة على تشريح محرك البحث الحديث ، ولكن وفقًا لأخبار البحث الروسية ، فإن العديد من عوامل البحث في الترتيب المسربة في Yandex لا يتم استخدامها ، أو تعتبر رسميًا مهملة.
حتى الغوص العميق التقني يعترف بالعديد من الجوانب المعروفة لـ Google (محرك البحث) ، مثل أنظمة الزاحف والفهرسة ، تختلف عن Yandex.
كل هذا ، جنبًا إلى جنب مع عمر قاعدة الكود التي تم تسريبها ، يجعل من غير الواضح كيف ستتحقق الافتراضات حول كيفية تصنيف كل من Yandex و Google للصفحات.