टेकराडार प्रो के रूप में की रिपोर्ट इससे पहले जनवरी 2023 में, एक पूर्व Yandex एक "राजनीतिक" मकसद के साथ कर्मचारी ने कथित रूप से वेब पोर्टल के कई उत्पादों के लिए स्रोत कोड की एक विस्तृत श्रृंखला को लीक कर दिया है, जो संभावित रूप से डार्क आर्ट पर प्रकाश डाल रहा है। खोज इंजन अनुकूलन .
BleepingComputer (नए टैब में खुलता है) रिपोर्ट करता है कि कर्मचारी ने कुल 44.7GB फ़ाइलों के git स्रोतों को लीक किया है, जिसमें इसके एंटी-स्पैम नियमों को छोड़कर "सभी" Yandex के स्रोत कोड शामिल हैं, जो जुलाई 2022 में प्राप्त किए गए थे।
कच्चा स्रोत कोड हर किसी के लिए दिलचस्प नहीं होगा, खोज इंजन भूमि (नए टैब में खुलता है) की रिपोर्ट है कि लीक के हिस्से के रूप में 17,854 खोज रैंकिंग कारकों को उजागर किया गया है, किसी भी व्यक्ति, व्यवसाय या प्रकाशन के लिए रुचि होनी चाहिए, जो खोज इंजनों में अपने पृष्ठों को उच्च स्थान पर देखना चाहते हैं।
यैंडेक्स लीक एसईओ अंतर्दृष्टि
A यैंडेक्स सर्च इंजन द्वारा रैंक किए गए कारकों की आंशिक सूची SEO कंसल्टेंसी MOG मीडिया मार्टिन मैकडोनाल्ड के सीईओ द्वारा साझा किए गए कोडबेस में एक फ़ाइल से कॉपी के उन पहलुओं पर कुछ प्रकाश डाला गया है, जिन पर Yandex वजन लागू करता है।
के लिए रूसी खोज समाचार (नए टैब में खुलता है) , इनमें पेजरैंक और लिंक के कई पहलू शामिल हैं जैसे कि उम्र और प्रासंगिकता, कॉपी की कथित प्रासंगिकता, होस्ट-रिलायबिलिटी, और कथित अधिकार वाली विशिष्ट साइटों के लिए सहज प्राथमिकताएं, जैसे कि विकिपीडिया।
द्वारा एक गहरा, लंबा, अधिक तकनीकी गोता खोज इंजन भूमि (नए टैब में खुलता है) यह भी दर्शाता है कि इस प्राथमिकता में एक "NEWS_AGENCY_RATING" भी शामिल है, जो Yandex के सर्च इंजन को कुछ समाचार संगठनों को वरीयता दिखाने की अनुमति देता है।
अन्य में अद्वितीय विज़िटर्स की संख्या, ऑर्गेनिक ट्रैफ़िक का प्रतिशत, और क्वेरीज़ में औसत डोमेन रैंकिंग शामिल हैं।
हालांकि, मैकडॉनल्ड्स के लिए शायद यह मेलोड्रामैटिक, या थोड़ा उजाड़ है, इसे "वर्षों में एसईओ में हुई सबसे दिलचस्प बात" के रूप में वर्णित किया गया है।
जबकि लीक हुआ कोडबेस निश्चित रूप से अंतर्दृष्टि का एक बेड़ा प्रदान करता है, यह ध्यान देने योग्य है कि कई वेबसाइटें यैंडेक्स पर Google पर अच्छी रैंक की तलाश करेंगी, विशुद्ध रूप से क्योंकि पूर्व कहीं बेहतर ज्ञात है।
दोनों कंपनियों ने वर्षों से वेब इंजीनियरों को साझा किया है, यैंडेक्स Google की कई ओपन सोर्स तकनीकों का उपयोग करता है, जैसे TensorFlow और BERT, और लीक हुए कोडबेस में Google डेटा के संदर्भ दिखाई देते हैं।
हालांकि, सर्च इंजन लैंड के गहरे गोता का तर्क है कि यांडेक्स रिसाव एक आधुनिक खोज इंजन की शारीरिक रचना में सामान्य अंतर्दृष्टि दे सकता है, लेकिन, रूसी खोज समाचार के अनुसार, यैंडेक्स के कई लीक रैंकिंग खोज कारक अप्रयुक्त हो जाते हैं, या आधिकारिक तौर पर मूल्यह्रास माने जाते हैं।
यहां तक कि तकनीकी गहरा गोता भी Google (खोज इंजन) के कई ज्ञात पहलुओं को स्वीकार करता है, जैसे कि इसके क्रॉलर और इंडेक्स सिस्टम, यांडेक्स से अलग हैं।
यह सब, लीक हुए कोडबेस की उम्र के साथ मिलकर, यह स्पष्ट नहीं करता है कि यैंडेक्स और Google दोनों पेजों को कैसे रैंक कर सकते हैं, इस पर धारणा कैसे होगी।