You.com AI арқылы Google-ді қабылдайды, apps, құпиялылық және жекелендіру

Ричард-Сочер

Ричард Сочер: «Біз ешқашан Google сияқты жаман болмаймыз. Біз сіздің деректеріңізді ешқашан сатпаймыз ».

salesforce.com бейне

Google іздеуіне ризасыз ба? Бұл сұраққа қалай жауап бергеніңізге қарамастан, сіз оны әлі де пайдалана аласыз. Baidu және Яндекс тиісінше жетекшілік ететін Қытай мен Ресейді қоспағанда, Google-дың іздеудегі нарықтағы үлесі дүние жүзінде 90%-дан асады.

Бұл Google қаладағы жалғыз ойын емес. Baidu және Yandex-тен басқа, Microsoft және Yahoo сияқты компаниялар да сәйкесінше Bing және аттас іздеу жүйесі арқылы өз сәттіліктерін сынап көрді. Құпиялылыққа бағытталған DuckDuckGo - тағы бір нұсқа. Дегенмен, олардың ешқайсысының дүние жүзінде 3%-дан астам нарықтық үлесі жоқ. Жаңа жазба өзіне дейінгі көптеген басқалардан жақсырақ бола ала ма?

Ричард Сочер осылай ойлайды. Сочер, upstart іздеу жүйесінің негізін қалаушы және бас директоры you.com, оның Стэнфордтағы күндерінен бері бұл мүмкін емес миссия болды. Бүгін, шамамен он жыл өткен соң, көптеген ерекшеліктер мен көптеген стартап пен кәсіпорын тәжірибесі бар, Сочер миссияны орындау мүмкін емес.

you.com сайтының дүниеге келуі

Сочер Еуропадан АҚШ-қа жиырма жасында келгенде, оның арманы университетте оқытушылық жұмысқа орналасу болды және оны жүзеге асыру үшін көп еңбек етті. Ол терең білімге ерте кірісті, бұл жай ғана тақырып болған кезде және Стэнфордта терең білім беру пионерлері Эндрю Нг және Крис Мэннингпен бірге жұмыс істеді.

Ph.D докторы үшін ең жақсы информатика диссертациясын жеңіп алғаннан кейін. Табиғи тілді өңдеу (NLP) және компьютерлік көру үшін рекурсивті терең оқыту бойынша Сочер стартаптың негізін салу академияға апаратын жолдағы айналма жол болады деп ойлады. Өмір оның қателігін дәлелдеді.

Сочер өзінің алғашқы стартапын сипаттады, MetaMind, «медициналық бейнелеу және электрондық коммерция кескіндері, NLP және басқа да көптеген нәрселерде жұмыс істейтін кәсіпорынның AI платформасы ретінде, көлденең платформа әзірлеушілер үшін машинаны оқыту құралы ретінде ойнайды. Бұл бүгін қызық болып көрінсе, 2014 жылы өз уақытынан озып кеткен шығар.

Salesforce MetaMind-ті 2016 жылы сатып алды, Сочер Salesforce-тың бас деректер жөніндегі маманы болды. Ол Salesforce масштабында және ықпалында орналастырылған қолданбаларда жұмыс істейтін 100-ден астам зерттеушілер мен жүздеген инженерлерді басқарды. Сошер Salesforce платформасына AI мүмкіндіктерін енгізуге арналған кең ауқымды бастама Salesforce Эйнштейнді құруда маңызды рөл атқарды.

2020 жылы Сочер Salesforce-тан кетіп, ол you.com деп атаған іздеу жүйесін құру жөніндегі өзінің көптен бергі амбициясын жүзеге асырды. You.com бірқатар инвесторлардан, соның ішінде Salesforce негізін қалаушы, басқарма төрағасы және бас атқарушы директоры Марк Бениофтан шамамен 20 миллион доллар жинады. Бірінші нұсқаны Сочер Ph.D докторантурасының соңында жүзеге асырды. бірақ ол бастапқыда бұл әрекетті орындауға екіталай болды.

«Ол кезде мен ойладым, жігітім, бұл тым амбициялық. Адамдар Google мені сотқа береді деп ойлаған шығар. Менің барлық ақылды достарым Google-да жұмыс істейді. Олармен бәсекелесу өте қиын болады. Менің ортамда және желіде ешкім Google-ға қатты шағымданбайды. Сондықтан мен бұл идеядан бас тарттым », - деді Сочер.

Сочер мұны тез сатып алуды ұнатпайтынын айтты және оның және you.com сайтындағы шағын команданың өте ынталы екенін және бұл жұмыста көптеген жылдар бойы жұмыс істеуге ұшу-қону жолағы бар екенін айтты. Сочер бұл іс жүзінде көп жылдарға созылатынын мойындады және Google-ды қабылдаудың үш түрлі себептерін келтірді: пайдаланушыға арналған, макрос және уақыт.

Google не болды?

Сочер келтірген пайдаланушыға тән көптеген себептер құпиялылыққа байланысты. Интернеттегі саяхаттардың көпшілігі қарапайым іздеуден басталады және біздің өміріміз онлайн режимінде өтіп бара жатқанда, біздің жеке өміріміздің әр қадамда дерлік жаппай қол сұғатыны өкінішті, деді ол. Алайда ол былай деп қосты: пайдаланушылар бұл туралы біледі, және бұл жақсы нәрсе.

Жарнамалар да Сошердің пайдаланушыға қатысты себептерінің бөлігі болып табылады. Пайдаланушы ретінде кейбір мазмұнды көрмей тұрып, бес, жеті түрлі жарнаманы көру тітіркендіреді, деді Сочер. Сонымен қатар, сіз мазмұн рейтингісінің қалай жұмыс істейтіні туралы аздап білгеннен кейін, барлық осы іздеу жүйесі оңтайландырылған (SEO) микросайттар Google-ды серіктестік сілтемелері мен cookie файлдарына айналдыруға тырысатын жарнамалар екенін түсінесіз, деп қосты ол.

Содан кейін бақылау мәселесі бар. «Көп адамдар өздерінің тағамдық диетасы туралы ойлайды, бірақ менің ойымша, біздің ақпараттық диетамыз да өте маңызды. Мен Reddit-ті көбірек көргім келеді немесе Reddit-ті азырақ көргім келеді немесе New York Times немесе ZDNet және басқаларды көргім келеді, бұл жай ғана сіздің ақпараттық қалауларыңызбен ең жоғары баға беретін жарнама берушіге сатылып жатқанына қарамастан және [...] айта алу маңызды. оған бақылау жоқ », - деді Сочер.

Сочердің макросебептері негізінен «бүкіл экономика желіде жүріп жатыр және сізді ең жоғары жарнама берушіге сатқысы келетін жалғыз қақпашының болуы веб үшін идеалды орнату емес» дегенге байланысты, ол айтқандай. 

Google әрқашан бар Google Ads және органикалық рейтингі толығымен тәуелсіз екенін айтты. Сочер бұл мәлімдеменің дұрыстығына күмән келтірді, бірақ біз мұны тәуелсіз түрде тексере алмадық. Сочер «бұл нашар фильм сияқты және бұл болып жатқан жаңғақ» деп түсіндірді. Бір жақсысы, деді ол, қазір монополияға қарсы және бүкіл экономикаға қауіп төндіретін мәселелерді жүзеге асыруға қатысты біраз артта қалған жел бар».  

opera-snapshot-2022-06-20-125436-you-com

You.com — Ричард Сочердің Google іздеуіне қатысуға ставкасы

Макрос пен уақыт арасындағы бір жерде біз ақпараттық су тасқыны деп атауға болады. Жиырма жыл бұрын ақпаратқа қол жеткізу керемет болды. Бүгінгі таңда ақпаратқа қол жеткізу - бұл үстел басы, ал мәселе мұнымен қалай күресуде, деп атап өтті Сошер. Оның жауабы: «Сізде оны қорытындылайтын AI болуы керек«.

Сочер қазір іздеуде жаңашылдық енгізудің уақыты келді деп қатты сенеді, өйткені соңғы жылдары онша көп инновация болған жоқ. Бастапқыда Google ақылға сыймайтын мән берді, бірақ қазір ол логарифмдік түрде тегістелді, деді Сочер. Адамдардың Google-ға беретін деректері бастапқыда өте құнды болған жоқ, бірақ қазір біз адамдардың деректері Google-дан алатын қызметтерге қарағанда құндырақ болатын құбылмалы нүктеге жеттік, деп қосты ол.

Уақыт өте келе Google іздеуді күшейту үшін AI қосты, атап айтқанда BERT, Google ізашар болған Үлкен тіл үлгілерінің (LLMs) бірін пайдалану арқылы. Дегенмен, Сочер Google іздеуінен «нақты бірдеңе» алудың жалғыз жолы - оған Reddit сияқты сайттардан нәтиже алуға нұсқау беру екенін және Google-дың жаңашылдық идеясы төмендейтінін атап өтті. сатуды арттыру үшін оның нәтижелеріне үнемі өсіп келе жатқан жарнамалар тізімін қосу.

AI көмегімен Google-ді қабылдау, apps, құпиялылық және жекелендіру

Сошердің Google-ды сынауында белгілі бір негіз бар. Дегенмен, бұл іздеу жүйелерімен қашықтан таныс кез келген адамға белгілі факт Google өз бизнесінің айналасында өте тиімді ор құрды Интернеттің ең жан-жақты және тиімді индексін жасау арқылы.

Бұған қоса, қазір Google бүкіл әлем бойынша миллиардтаған адамдардың жұмыс тәртібіне еніп кеткені соншалық және браузерлерді іздеу опцияларының көпшілігі үшін әдепкі болып табылады, сондықтан пайдаланушыларды ауыстыруға мүмкіндік беру үшін, бір кездері Яндекс басшысы ZDNet-ке айтқандай, сіз 10 есе жақсырақ болуыңыз керек. You.com сияқты жаңадан бастаушы былай тұрсын, бұл кез келген адам үшін мүмкін бе? Бұған қалай қарайсыз?

Сошердікі reply бұл айқын сұрақ барлық сұраулардың бірдей еместігіне негізделген. Кейде, оның айтуынша, адамдар бүгінгі ауа-райы немесе ұйымның басшысы сияқты нақты ақпаратты алғысы келеді. Кейде олар белгілі бір сайтқа кіргісі келеді және оны терудің орнына оны іздеуге енгізеді.

Сұраулардың бұл түрлері үшін (тиісінше жылдам ақпарат сұраулары және навигациялық сұраулар) тек оларға мүмкіндігінше жылдам қызмет көрсетуге болады. Дифференциацияға орын жоқ. Істің қызықты болатын жері - Сочер «күрделі ақпараттық/әрекеттік іздеулер» немесе егжей-тегжейлі сұраулар және сәйкесінше шынымен тапсырманы орындауға қатысты сұраулар.

Сочер you.com күрделі ақпараттық іздеулерде Google-ға қарағанда әлдеқайда жақсырақ екенін айтты, өйткені ол әлдеқайда бай ақпарат береді. Алып кетуге тапсырыс беру немесе рейске тапсырыс беру сияқты әрекеттерді іздеуге келетін болсақ, Сочер бұл you.com сайтының мақсаты екенін түсіндірді. Ол you.com сайтына сілтеме жасады apps, олар нақты тапсырмалардың/аудиториялардың қажеттіліктеріне дәл реттелген доменге арналған модульдер болып табылады.

you.com бағытталған домендердің бірі - кодтау және әзірлеушілерді іздеу. Сочер PyTorch көмегімен модельді қалай үйрету керектігін іздейтін әзірлеушінің мысалын ұсынды. You.com бірнеше жолмен көмектесе алады. Stack Overflow қолданбасы бар, код үзінділері бар, құжаттамаға қол жетімділік, Reddit талқылаулары және тіпті кодты жасайтын қолданба бар, деді Сочер.

Мұның бәрі Google ұсынбайтын нәрселер, олар көшіру-қою түймесімен бірге келеді және әзірлеушілерге әр іздеу үшін 30 секунд пен 30 минут аралығында кез келген жерде үнемдеуге көмектесу арқылы үлкен мән береді, деп мәлімдеді Сочер. «Онда бір тонна AI және NLP бар», - деп қосты ол.

zd-software-development-bundle.jpg

Доменге арналған іздеу қолданбалары - you.com Google-ге қарағанда 10 есе жақсы нәтижелерді жеткізуге бағытталған. Әзірлеушілер негізгі аудиториялардың бірі болып табылады

Көптеген қойындыларды ашудың орнына әртүрлі көздерден алынған ақпаратты біріктіретін және қорытындылайтын өнім шолулары сияқты нәрселерге де қатысты. Сочердің айтуынша, бұл 10 есе жақсы. Ол сондай-ақ you.com сайтының Stack Overflow сияқты мазмұн провайдерлерімен қалай жұмыс істейтініне сілтеме жасады apps, келе жатқан «экожүйені құру» туралы толығырақ хабарландыруларға меңзейді soon.

Сочер сонымен қатар you.com бизнес үлгісі және оның құпиялылыққа қатысты ұстанымы туралы айтты. Ол you.com сайтына сенімді apps жеткілікті адамдар төлеуге дайын болатын құндылықты қамтамасыз етеді. Сочер құндылықты қосады деп есептейтін тағы бір мүмкіндік - бұл жекелендіру — пайдаланушылардың нәтижелерді өз қалауларына сәйкес теңшеу мүмкіндігі.

Бұл орын алу үшін пайдаланушы профильдеріне қолдау көрсету керек екені анық. Бұл деректерді жинау, құпиялылық, жарнамадан түсетін табыс және қатысты саясаттар төңірегінде талқылауға жол ашады. Осы кезде Сочер жарнамаларды екінші реттік кіріс ағындары ретінде қарастырады және құпиялылыққа орташа көзқарасты ұстанады. You.com жеке режимді ұсынады, ал Сочер жақсырақ құпиялылыққа уәде береді: «Біз ешқашан Google сияқты жаман болмаймыз. Біз сіздің деректеріңізді ешқашан сатпаймыз».

Дегенмен, ол сондай-ақ егер сіз құпиялылықты басты нүктеге айналдырсаңыз, онда «сол кездегі қатал құпиялылық адамдары сіздің толық шифрланған, толық ашық көз, кіріс, деректер, ешқандай жоба болғаныңызды қалайды деп санайды. Негізінде, сіз шынымен компания бола алмайсыз, [..] сіз ешқашан Google-мен бәсекеге түсе алмайсыз». You.com локализацияланған нәтижелерге қызмет көрсету үшін жүйеге кірген пайдаланушылардың деректерін пайдаланады, Сошер бұл пайдаланушылардың көпшілігі қалаған нәрсе деп санайды.

Сайып келгенде, құпиялылық пен ыңғайлылық арасындағы таңдау пайдаланушыларға байланысты болады. Ақпарат қайдан келетініне келетін болсақ: оның кейбіреулері, жалпы сұраулар үшін, Bing индексінен келеді. Доменге қатысты сұраулар үшін you.com сайтында өз индекстері бар. Бұл Google және Bing-тен басқа барлық іздеу жүйелерінде болатын тәуелділік, Сочердің айтуынша, DuckDuckGo сияқты кейбіреулер «Bing айналасындағы жұқа қаптама».

Алға қадам

you.com сайты үшін әлі ерте күндер, сондықтан бұл жұмыс істей ме деген шешім әлі шыққан жоқ. Сочер жігерлендіретін белгі деп атаған «Твиттердегі және басқа арналардағы көп сүйіспеншіліктен» басқа, оптимизмнің одан да күшті себептері бар.

Сошерде Google-дың әлсіз жақтарын жан-жақты талдауы бар, және кем дегенде, бұған мүмкіндік беретін фон, мотивация және қолдау бар. you.com қолданып отырған тәсіл, толық жұмыс істемесе де немесе әлі ашылмаса да, перспективалы болып көрінеді. You.com жақында қосылды CB Insights AI 100 2022 жылғы ең перспективалы жасанды интеллект стартаптарының тізімі.

You.com негізін қалаушы бұл шайқастың қиын болатыны туралы ешқандай елес жоқ сияқты. Пайдаланушыларды іздеу үшін ақы төлеу үлгісін қабылдауға тарту, AI көмегімен іздеуді күшейту ойынында Google-ды жеңу және пайдаланушыларды бақытты ету мен өміршең бизнесті жүргізу арасындағы жақсы сызықтан өту барлығы you.com үшін үлкен ставкалар. Басқа ештеңе болмаса, тоқырау іздеу нарығындағы бәсекелестік барлығына жақсы болар еді.

Сочердің you.com сайты үшін басты алғышарт ретінде анықтаған нәрсесі AI-ны зардап шеккен адамдар басқаратын етіп жасау идеясы. you.com үшін бұл пайдаланушылардың іздеу жүйесінде нені көп немесе аз көргісі келетіні туралы итермелей алатынын білдіреді. AI-дағы үлкен суретке келетін болсақ, Сочер оның бейнесін жақсы көрген сияқты 2017 TED баяндамасы онда ол NLP және мультимодальды AI болашақтың негізгі бағыттары ретінде анықтады.

Сочер LLMs қазірдің өзінде «таңғажайып істер істеп жатыр» деп санайды және көп тапсырманы оқыту тұрғысынан көбірек прогреске қол жеткізіледі деп үміттенеді, бұл оларға көбірек тапсырмаларды орындауға мүмкіндік береді. Дегенмен, ол сонымен бірге LLM-ге белгілі бір ережелерді енгізу немесе оларды үйренуге мүмкіндік беру керек деп санайды, өйткені масштабтау бұған қол жеткізе алмайтын сияқты.

AI-ны алға жылжыту тұрғысынан Сочер сонымен қатар қазіргі аппараттық құрал матрицаны көбейтуге негізделген AI моделінің архитектурасының белгілі бір түрін қолдайтынын атап өтті. Бұл ілгерілеудің жолы болуы мүмкін немесе болмауы мүмкін, бірақ бұл «аппараттық бейімділік» балама модель архитектураларын шетке шығарды. Бұл сіздің кілттеріңізді шам бағанының астынан іздеу сияқты, деп атап өтті Сочер.

Сочер, әрине, қазіргі уақытта AI-ның барлық негізгі сөйлесу мәселелерін біледі, соның ішінде біржақтылық (бұл тек деректер жиынтығы емес), тұрақтылық (мүмкін, шамадан тыс, бірақ біз жақсырақ істей аламыз және жасай аламыз), этика (оңай жауаптар жоқ, бұл әр адамның ұстанымына байланысты және нанымдар) және т.б. Бұл зерттеуге тұрарлық әңгіме — мүмкін одан да көп, егер you.com жұмысын аяқтаса.



қайнар көз