You.com поема Google с AI, apps, поверителност и персонализиране

Ричард Сочер

Ричард Сочер: „Никога няма да бъдем толкова лоши като Google. Никога няма да продадем вашите данни.”

видео на salesforce.com

Доволни ли сте от търсенето с Google? Независимо как отговаряте на този въпрос, има вероятност все още да го използвате. С забележителните изключения на Китай и Русия, където Baidu и Yandex водят съответно, Пазарният дял на Google в търсенето е над 90% в световен мащаб.

Не че Google е единствената игра в града. Освен Baidu и Yandex, такива като Microsoft и Yahoo също опитаха късмета си, съответно с Bing и едноименната търсачка. DuckDuckGo, фокусиран върху поверителността, е друга опция. И все пак нито една от тях няма пазарен дял от над 3% в световен мащаб. Може ли един нов запис да се справи по-добре от толкова много други преди него?

Ричард Сочер смята така. Сохер, основател и главен изпълнителен директор на стартиращата търсачка you.com, е мислил за тази невъзможна мисия още от дните му в Станфорд. Днес, почти десетилетие по-късно, с много отличия и изобилие от стартиращи и корпоративни опити под колана си, Сохер е изправен пред невъзможна мисия.

Раждането на you.com

Когато Сохер дойде в САЩ от Европа на двадесетте, мечтата му беше да получи работа в университетски факултет и той работи много усилено, за да я осъществи. Той навлезе в дълбокото обучение рано, когато това беше само нишова тема, и работи с пионерите на дълбоко обучение Андрю Нг и Крис Манинг в Станфорд.

След като спечели наградата за най-добра теза по компютърни науки за докторска степен. относно рекурсивното задълбочено обучение за обработка на естествен език (NLP) и компютърно зрение, Сохер смята, че основаването на стартъп ще бъде само заобикаляне по пътя към академичните среди. Животът му показа, че греши.

Сохер описа първото си стартиране, Метаум, като „фирмена AI платформа, която работи в медицински изображения и изображения за електронна търговия и NLP и куп други неща, хоризонтална платформа играе като инструмент за машинно обучение за разработчици. Ако това звучи интересно днес, вероятно е изпреварило времето си през 2014 г.

Salesforce придоби MetaMind през 2016 г., а Сохер стана главен специалист по данни в Salesforce. Той ръководи повече от 100 изследователи и много стотици инженери, работещи върху приложения, които са били внедрени в мащаб и въздействие на Salesforce. Socher играе важна роля в създаването на Salesforce Einstein, широкообхватна инициатива за инжектиране на AI възможности в платформата на Salesforce.

През 2020 г. Сохер напусна Salesforce, за да преследва дългогодишната си амбиция да създаде търсачка, която нарече you.com. You.com събра около 20 милиона долара от редица инвеститори, включително съосновател, председател и съизпълнителен директор на Salesforce Марк Бениоф. Първата версия е реализирана от Сохер в края на неговата докторска степен. но първоначално се колебаеше да преследва това.

„По това време си помислих, човече, просто е твърде амбициозно. Хората вероятно си мислеха, че Google ще ме съди. Всичките ми умни приятели ще работят в Google. Ще бъде много трудно да се състезаваш с тях. Никой не се оплаква много от Google в моите кръгове и онлайн. И така отхвърлих идеята“, каза Сохер.

Сохер твърди, че не го интересува това за бързо придобиване, и добави, че той и малкият екип в you.com са много мотивирани и разполагат с пистата да работят върху това в продължение на много години. Сохер призна, че това всъщност ще отнеме много години, и посочи три различни групи причини за поемане на Google: специфични за потребителя, макрос и време.

Какво не е наред с Google?

Много от специфичните за потребителя причини, които Сохер цитира, са свързани с поверителността. Повечето онлайн пътувания започват с просто търсене и фактът, че поверителността ни се нахлува толкова масово на почти всяка стъпка, която предприемаме онлайн, тъй като животът ни става все повече и повече онлайн, е жалък, каза той. Той обаче добави, потребителите започват да го осъзнават, и това е хубаво нещо.

Рекламите също са част от специфичните за потребителя причини на Socher. Като потребител е просто досадно да виждаш пет, седем различни реклами, преди да видиш някакво съдържание, каза Сохер. Освен това, след като научите малко за това как работи класирането на съдържанието, разбирате, че всички тези оптимизирани за търсачки (SEO) микросайтове също са просто реклами, които се опитват да насочат Google към партньорски връзки и бисквитки, добави той.

След това възниква въпросът за контрола. „Много хора мислят за хранителната си диета, но мисля, че нашата информационна диета също е изключително важна. Важно е да мога да [..] казвам, искам да видя повече Reddit или по-малко Reddit, или искам да видя New York Times или ZDNet и други, вместо просто да бъда продаден с вашите желания за информация на рекламодателя с най-висока оферта и нямайки контрол върху това“, каза Сохер.

Макро причините на Сохер се свеждат най-вече до факта, че „цялата икономика се движи онлайн и наличието на един-единствен вратар, който иска да ви продаде на най-високия рекламодател, не е идеална настройка за мрежата, точка“, както се изрази той. 

Google винаги е правил поддържа, че Google Ads и органичното класиране са напълно независими. Сохер постави под съмнение валидността на това твърдение, въпреки че не успяхме да проверим това независимо. Сохер коментира, че „това е като лош филм и е някак лудо, че се случва“. От добрата страна, добави той, сега има някакъв попътен вятър по отношение на антитръста и осъзнаването на заложените проблеми за цялата икономика”.  

opera-snapshot-2022-06-20-125436-you-com

You.com е залогът на Ричард Сочер да се възползва от търсенето в Google

Някъде между макро и времето би било това, което бихме могли да наречем информационен потоп. Преди двадесет години беше невероятно да имаш достъп до информация. Днес достъпът до информация е залог на масата и проблемът е как да се справим с всичко това, отбеляза Сохер. Неговият отговор: „Трябва да имате AI, който да го обобщава за вас".

Сохер силно вярва, че сега е моментът за иновации в търсенето, тъй като през последните години всъщност не е имало толкова много иновации. Първоначално Google предостави безумно количество стойност, но сега тя е логаритмично изравнена, каза Сохер. Данните, които хората предоставят на Google, първоначално не бяха много ценни, но сега достигаме точка на пречупване, в която данните на хората стават по-ценни от услугите, които получават от Google, добави той.

Може да се твърди, че с течение на времето Google добави AI, за да засили търсенето си, по-специално чрез използване на BERT, един от големите езикови модели (LLM), въведени от Google. Сохер обаче не се въздържа от критиката си, отбелязвайки, че единственият начин да извлечете „нещо истинско“ от търсенето с Google е да го инструктирате всеки път изрично да получава резултати от сайтове като Reddit и че идеята на Google за иновации изглежда се срива. за добавяне на непрекъснато нарастващ списък с реклами към резултатите си, за да увеличи продажбите.

Вземайки Google с AI, apps, поверителност и персонализиране

Критиката на Сохер към Google има известна основа. Въпреки това, това е добре известен факт на всеки, който дори е запознат с търсачките Google изгради много ефективен ров около бизнеса си чрез създаване на това, което може би е най-изчерпателният и ефикасен индекс на мрежата.

Освен това досега Google е толкова вкоренен в рутината на милиарди хора по целия свят и е по подразбиране за повечето опции за търсене в браузъра, че за да накарате потребителите да превключват, както веднъж каза на ZDNet един изпълнителен директор на Yandex, трябва да сте 10 пъти по-добри. Възможно ли е това изобщо за някой, да не говорим за изкачване като you.com? Как се справяте с това?

на Сохер reply на този очевиден въпрос се основаваше на факта, че не всички заявки са еднакви. Понякога, каза той, хората просто искат да получат фактическа информация, като например времето днес или лидера на организация. Понякога те искат да стигнат до конкретен сайт и вместо да го напишат, го въвеждат в търсене.

За тези типове заявки (съответно заявки за бърза информация и заявки за навигация) всичко, което можете да направите, е да ги обслужвате възможно най-бързо. Няма място за диференциация. Нещата стават интересни в това, което Сохер нарече „сложни информационни/действени търсения“ или сложни заявки и съответно запитвания, които наистина са свързани с изпълнението на задача.

Socher твърди, че you.com вече се справя по-добре от Google в сложните информационни търсения, защото предоставя много по-богата информация. Що се отнася до търсенията за действие, като например поръчка за храна за вкъщи или резервация на полет, Сохер даде да се разбере, че това е целта за you.com. Той се позова на you.com apps, които са специфични за домейна модули, които са фино настроени за нуждите на конкретни задачи/аудитории.

Един домейн, към който you.com е насочен, е кодирането и търсенето на разработчици. Socher предложи примера на разработчик, който търси как да обучи модел с помощта на PyTorch. You.com може да помогне по няколко начина. Има приложение Stack Overflow, има фрагменти от код, има достъп до документация, дискусии в Reddit и дори приложение за генериране на код, каза Сочер.

Това са всички неща, които Google не предлага, идват с бутон за копиране и поставяне и осигуряват голяма стойност, като помагат на разработчиците да спестят някъде между 30 секунди и 30 минути за всяко търсене, твърди Сохер. Там има „тона AI и NLP“, добави той.

zd-software-development-bundle.jpg

Специфичните за домейните приложения за търсене са начинът, по който you.com се стреми да предостави 10 пъти по-добри резултати от Google. Разработчиците са една от ключовите аудитории

Същото важи и за неща като прегледи на продукти, които обобщават и обобщават информация от различни източници, вместо да се налага да отварят множество раздели. Това е 10 пъти по-добре, според Сохер. Той също така спомена как you.com работи с доставчици на съдържание като Stack Overflow за него apps, намеквайки за предстоящи съобщения с повече подробности относно „изграждането на екосистема“. soon.

Сохер говори и за бизнес модела на you.com и неговата позиция относно поверителността. Той е уверен, че you.com apps ще осигури стойност, за която достатъчно хора ще са готови да платят. Друга функция, която според Сохер добавя стойност, е персонализирането – възможността потребителите да персонализират резултатите според предпочитанията си.

Ясно е, че за да се случи това, трябва да се поддържат потребителски профили. Това отваря вратата за дискусии около събирането на данни, поверителността, приходите от реклами и свързаните с тях политики. В този момент Сохер разглежда рекламите като вторични потоци от приходи и използва среден подход към поверителността. You.com предлага частен режим, а Socher обещава по-добра поверителност: „Никога няма да бъдем толкова лоши като Google. Никога няма да продадем вашите данни”.

Въпреки това той също така вярва, че ако направите поверителността своя фокусна точка, тогава „твърдите хора, които се занимават с поверителността в този момент, искат да сте напълно криптиран, напълно отворен код, без приходи, без данни, никакъв проект. По същество не можете да бъдете компания, [..] никога няма да можете да се конкурирате с Google.” You.com ще използва данни от влезли потребители, за да обслужва локализирани резултати, което според Сохер е нещо, което повечето потребители искат.

В крайна сметка обаче изборът между поверителност и удобство ще зависи от потребителите. Що се отнася до това откъде идва информацията: част от нея, за общи заявки, идва от индекса на Bing. За специфични за домейна заявки you.com има свои собствени индекси. Това е зависимост, която имат всички търсачки с изключение на Google и Bing, каза Сохер, въпреки че някои като DuckDuckGo са „само тънка обвивка около Bing“.

Пътят напред

Все още са ранни дни за you.com, така че присъдата дали това може да проработи все още не е в сила. Освен „много любов в Twitter и други канали“, което Сохер посочи като окуражаващ знак, има и по-солидни причини за оптимизъм.

Socher има добре заоблен анализ на слабостите на Google, както и предисторията, мотивацията и подкрепата, за да даде поне възможност за това. Подходът, който you.com предприема, въпреки че все още не е напълно оперативен или разкрит, изглежда обещаващ. You.com беше включен наскоро в Списък на AI 100 на CB Insights на най-обещаващите стартиращи компании с изкуствен интелект през 2022 г..

Основателят на You.com изглежда не си прави илюзии относно факта, че това ще бъде тежка битка. Накарайте потребителите да приемат модел на плащане за използване за търсене, побеждавайки Google в собствената му игра на захранване на търсенето с AI и преминаване по тънката граница между поддържането на потребителите доволни и управлението на жизнеспособен бизнес всички са големи залози за you.com. Ако не друго, обаче, някаква конкуренция на застоялия пазар на търсене вероятно би била добра за всички.

Това, което Сохер определи като ключова предпоставка за you.com, е идеята AI да бъде контролиран от хората, засегнати от него. За you.com това означава, че потребителите могат да подтикнат търсачката към това какво биха искали да видят повече или по-малко. Що се отнася до по-голямата картина в AI, Сохер изглежда е бил на място в неговата 2017 TED разговор в която той идентифицира НЛП и мултимодалния AI като ключови насоки за бъдещето.

Socher вярва, че LLM вече „правят невероятни неща“ и се надява, че ще бъде постигнат повече напредък по отношение на многозадачното обучение, което им позволява да бъдат по-добри в повече задачи. Въпреки това той също така вярва, че в крайна сметка LLM ще трябва да бъдат инжектирани с определени правила или да им бъде позволено да ги научат, тъй като мащабирането изглежда не може да постигне това.

По отношение на придвижването на ИИ напред, Сохер също отбеляза, че настоящият хардуер предпочита специфичен тип архитектура на модела на ИИ, който разчита на матрични умножения. Това може или не може да е пътят напред, но това „хадуерно пристрастие“ отстрани алтернативните архитектури на модела. Това е малко като да търсите ключовете си под лампата, отбеляза Сохер.

Сохер естествено е наясно с всички основни точки за разговор в наши дни, включително пристрастия (не са само наборите от данни), устойчивост (може би преувеличена, но можем и трябва да направим по-добре), етика (няма лесни отговори, зависи от позициите на всеки човек и вярвания) и др. Това е разговор, който си струва да се проучи — може би дори повече, ако you.com свърши работа.



източник