You.com tager imod Google med kunstig intelligens, apps, privatliv og personalisering

richard-socher

Richard Socher: "Vi bliver aldrig så dårlige som Google. Vi sælger aldrig dine data."

salesforce.com video

Er du tilfreds med Google-søgning? Uanset hvordan du besvarer dette spørgsmål, er chancerne for, at du stadig bruger det. Med de bemærkelsesværdige undtagelser fra Kina og Rusland, hvor Baidu og Yandex fører hhv. Googles markedsandel inden for søgning er over 90 % på verdensplan.

Det er ikke, at Google er det eneste spil i byen. Udover Baidu og Yandex har folk som Microsoft og Yahoo også prøvet lykken med henholdsvis Bing og den eponyme søgemaskine. Den privatlivsfokuserede DuckDuckGo er en anden mulighed. Alligevel har ingen af ​​disse en markedsandel på over 3 % på verdensplan. Kan et nyt indlæg gøre det bedre end så mange andre før det?

Det mener Richard Socher. Socher, grundlægger og administrerende direktør for upstart søgemaskine dig.com, har haft denne umulige mission i tankerne lige siden hans Stanford-dage. I dag, næsten et årti senere, med masser af udmærkelser og masser af opstarts- og virksomhedserfaring under bælte, er Socher hovedet nede på mission umulig.

Fødslen af ​​you.com

Da Socher kom til USA fra Europa i tyverne, var hans drøm at få et universitetsfakultetsjob, og han arbejdede meget hårdt for at få det til at gå i opfyldelse. Han kom tidligt ind i deep learning, da det kun var et nicheemne, og arbejdede med deep learning-pionererne Andrew Ng og Chris Manning på Stanford.

Efter at have vundet prisen for bedste datalogi-afhandling for sin ph.d. om Rekursiv Deep Learning for Natural Language Processing (NLP) og Computer Vision, mente Socher, at grundlæggelsen af ​​en startup blot ville være en omvej på vejen til den akademiske verden. Livet beviste, at han tog fejl.

Socher beskrev sin første opstart, MetaMind, som "en virksomheds AI-platform, der arbejdede i medicinsk billedbehandling og e-handelsbilleder og NLP og en masse andre ting, et horisontalt platformspil som et maskinlæringsværktøj for udviklere." Hvis det lyder interessant i dag, var det sandsynligvis forud for sin tid i 2014.

Salesforce købte MetaMind i 2016, og Socher blev Chief Data Scientist hos Salesforce. Han ledede mere end 100 forskere og mange hundrede ingeniører, der arbejdede på applikationer, der blev implementeret i Salesforce skala og effekt. Socher var medvirkende til at skabe Salesforce Einstein, et vidtfavnende initiativ til at injicere AI-kapaciteter i Salesforces platform.

I 2020 forlod Socher Salesforce for at forfølge sin mangeårige ambition om at bygge en søgemaskine, som han kaldte you.com. You.com har rejst omkring $20 millioner fra en række investorer, herunder Salesforce-medstifter, formand og med-CEO Mark Benioff. Den første version blev implementeret af Socher i slutningen af ​​sin ph.d. men han var i starten tøvende med at forfølge dette.

“Dengang tænkte jeg, mand, det er bare for ambitiøst. Folk tænkte nok, at Google ville sagsøge mig. Alle mine smarte venner skal arbejde hos Google. Det bliver så svært at konkurrere med dem. Ingen klager rigtig meget over Google i mine cirkler og online. Så jeg forkastede på en måde ideen," sagde Socher.

Socher hævdede, at han ikke er til dette for en hurtig opkøb, og tilføjede, at han og det lille team på you.com er meget motiverede og har landingsbanen til at arbejde på dette i mange år. Socher erkendte, at dette faktisk vil tage mange år, og gav tre forskellige grupper af grunde til at tage på Google: Brugerspecifik, makro og timing.

Hvad er der galt med Google?

Mange af de brugerspecifikke årsager, Socher nævnte, har at gøre med privatliv. De fleste onlinerejser starter med en simpel søgning, og det faktum, at vores privatliv bliver så massivt invaderet ved næsten hvert eneste skridt, vi tager online, efterhånden som vores liv bliver mere og mere online, er uheldigt, sagde han. Han tilføjede dog, brugere bliver opmærksomme på det, og det er en god ting.

Annoncer er også en del af Sochers brugerspecifikke årsager. Som bruger er det bare irriterende at se fem, syv forskellige annoncer, før du ser noget indhold, sagde Socher. Plus, når du først har lært lidt om, hvordan indholdsrangering fungerer, indser du, at alle disse søgemaskineoptimerede (SEO) mikrosider også kun er annoncer, der forsøger at lede Google ind i affilierede links og cookies, tilføjede han.

Så er der spørgsmålet om kontrol. "Mange mennesker tænker på deres maddiæt, men jeg tror også, at vores informationsdiæt er utrolig vigtig. Det er vigtigt at kunne [..] sige, jeg vil se mere Reddit eller mindre Reddit, eller jeg vil se New York Times eller ZDNet og andre, i stedet for bare at blive solgt med dine informationsønsker til den højestbydende annoncør og har ingen kontrol over det," sagde Socher.

Sochers makroårsager kommer for det meste ned på det faktum, at "hele økonomien bevæger sig online, og at have en enkelt gatekeeper, der ønsker at sælge dig til den højeste annoncør, er ikke et ideelt setup for nettet, punktum," som han udtrykte det. 

Google har altid fastholdt, at Google Ads og organisk rangering er helt uafhængige. Socher satte spørgsmålstegn ved gyldigheden af ​​denne påstand, selvom vi ikke var i stand til at verificere dette uafhængigt. Socher kommenterede, at "det er ligesom en dårlig film, og det er lidt skørt, at det sker." På den lyse side, tilføjede han, er der nu en vis medvind i forhold til antitrust og realisering af de problemer, der er på spil for hele økonomien.  

opera-snapshot-2022-06-20-125436-you-com

You.com er Richard Sochers bud på at tage på Google-søgning

Et sted imellem makro og timing ville vi kunne kalde informationsfloden. For tyve år siden var det fantastisk at kunne få adgang til information. I dag er adgang til information bordspil, og problemet er, hvordan man håndterer det hele, bemærkede Socher. Hans svar: "Du skal have AI, der opsummerer det for dig".

Socher er overbevist om, at det nu er tid til at innovere i søgning, da der ikke rigtig har været så meget innovation i de senere år. I starten leverede Google en sindssyg mængde værdi, men nu er det logaritmisk fladt ud, sagde Socher. De data, som folk leverer til Google, var ikke særlig værdifulde i starten, men nu er vi ved at nå et vendepunkt, hvor folks data bliver mere værdifulde end de tjenester, de får fra Google, tilføjede han.

Det kunne hævdes, at Google over tid også har tilføjet AI til at drive sin søgning, især ved at bruge BERT, en af ​​de store sprogmodeller (LLM'er), som er banebrydende af Google. Socher holdt sig dog ikke tilbage med sin kritik og bemærkede, at den eneste måde at få "noget virkeligt" ud af Google-søgning er at instruere den om at få resultater fra websteder som Reddit eksplicit hver gang, og at Googles idé om innovation ser ud til at falde at tilføje en stadigt voksende liste af annoncer til sine resultater for at øge salget.

Tager imod Google med kunstig intelligens, apps, privatliv og personalisering

Der er en vis forankring i Sochers kritik af Google. Det er dog en velkendt kendsgerning for enhver, der selv fjernt er bekendt med søgemaskiner Google har bygget en meget effektiv voldgrav omkring sin virksomhed ved at skabe det, der uden tvivl er det mest omfattende og effektive indeks på nettet.

Plus, Google er efterhånden så forankret i rutinerne for milliarder af mennesker rundt om i verden, og standarden for de fleste browsersøgemuligheder, at for at få brugere til at skifte, som en Yandex-chef engang fortalte ZDNet, skal du være 10 gange bedre. Er det overhovedet muligt for nogen, endsige en opkomling som you.com? Hvordan gør du det?

Sochers reply til dette åbenlyse spørgsmål var baseret på det faktum, at ikke alle forespørgsler er ens. Nogle gange, sagde han, vil folk bare have faktuelle oplysninger, såsom vejret i dag, eller lederen af ​​en organisation. Nogle gange ønsker de at komme til et bestemt websted, og i stedet for at skrive det, indtaster de det i en søgning.

For disse typer forespørgsler (henholdsvis hurtige informationsforespørgsler og navigationsforespørgsler) kan du kun betjene dem så hurtigt som muligt. Der er ikke plads til differentiering. Hvor tingene bliver interessante, er i det, Socher kaldte henholdsvis "komplekse informations-/handlingssøgninger" eller udførlige forespørgsler og forespørgsler, der virkelig handler om at udføre en opgave.

Socher hævdede, at you.com allerede klarer sig bedre end Google i komplekse informationssøgninger, fordi det giver meget mere rig information. Med hensyn til handlingssøgninger, såsom at bestille takeaway eller booking af en flyrejse, gjorde Socher det klart, at dette er målet for you.com. Han henviste til you.com apps, som er domænespecifikke moduler, der er finjusteret til specifikke opgavers/målgruppers behov.

Et domæne, som you.com er målrettet mod, er kodning og udviklersøgninger. Socher tilbød eksemplet med en udvikler, der ledte efter, hvordan man træner en model ved hjælp af PyTorch. You.com kan hjælpe på en række måder. Der er en Stack Overflow-app, der er kodestykker, der er adgang til dokumentation, Reddit-diskussioner og endda en kodegenererende app, sagde Socher.

Det er alt sammen ting, som Google ikke tilbyder, de kommer med en copy-paste-knap, og de giver stor værdi ved at hjælpe udviklere med at spare et sted mellem 30 sekunder og 30 minutter for hver søgning, hævdede Socher. Der er "et væld af AI og NLP derinde," tilføjede han.

zd-software-development-bundle.jpg

Domænespecifikke søgeapplikationer er, hvordan you.com sigter mod at levere 10 gange bedre resultater end Google. Udviklere er en af ​​de vigtigste målgrupper

Det samme gælder ting som produktanmeldelser, der samler og opsummerer information fra forskellige kilder i stedet for at skulle åbne et væld af faner. Det er 10 gange bedre, ifølge Socher. Han henviste også til, hvordan you.com arbejder med indholdsudbydere såsom Stack Overflow for sin apps, der hentyder til meddelelser med flere detaljer om "opbygning af et økosystem" på vej soon.

Socher talte også om you.coms forretningsmodel og dens holdning til privatliv. Han er overbevist om, at you.com apps vil give værdi, som nok mennesker vil være villige til at betale for. En anden funktion, som Socher mener, tilføjer værdi, er personalisering - muligheden for brugere til at tilpasse resultater efter deres præferencer.

Det er klart, at for at dette kan ske, skal brugerprofiler understøttes. Det åbner døren til diskussioner omkring dataindsamling, privatliv, annonceindtægter og relaterede politikker. På dette tidspunkt ser Socher annoncer som sekundære indtægtsstrømme og tager en mellemvejstilgang til privatlivets fred. You.com tilbyder en privat tilstand, og Socher lover bedre privatliv: "Vi bliver aldrig så dårlige som Google. Vi sælger aldrig dine data”.

Han mener dog også, at hvis du gør privatliv til dit omdrejningspunkt, så vil "hardcore privatlivsfolkene på det tidspunkt have dig til at være en fuldt krypteret, fuldt åben kildekode, ingen indtægt, ingen data, intet slags projekt. I bund og grund kan du ikke rigtig være en virksomhed, [..] du vil aldrig være i stand til at konkurrere med Google." You.com vil bruge data fra loggede brugere til at vise lokaliserede resultater, hvilket Socher mener er noget, de fleste brugere ønsker.

I sidste ende vil valget mellem privatliv og bekvemmelighed dog være op til brugerne. Med hensyn til hvor informationen kommer fra: noget af det, for generiske forespørgsler, kommer fra Bings indeks. For domænespecifikke forespørgsler har you.com sine egne indekser. Dette er en afhængighed, som alle søgemaskiner undtagen Google og Bing har, sagde Socher, selvom nogle som DuckDuckGo "bare er en tynd indpakning omkring Bing".

Vejen frem

Det er stadig tidlige dage for you.com, så dommen om, hvorvidt dette kan fungere, er stadig ude. Udover "masser af kærlighed på Twitter og andre kanaler", som Socher omtalte som et opmuntrende tegn, er der også mere solide grunde til optimisme.

Socher har en velafrundet analyse af Googles svagheder, og baggrunden, motivationen og opbakningen til i det mindste at give dette et skud. Den tilgang you.com tager, selvom den ikke er fuldt operationel eller afsløret endnu, virker lovende. You.com blev for nylig inkluderet i CB Insights' AI 100-liste over de mest lovende kunstig intelligens-startups i 2022.

You.coms grundlægger ser ikke ud til at have nogen illusioner om, at dette bliver en kamp op ad bakke. At få brugere til at anvende en betalingsmodel til søgning, slå Google i sit eget spil med at drive søgning med AI, og går den fine grænse mellem at holde brugerne glade og at drive en levedygtig forretning er alle store indsatser for you.com. Om ikke andet ville en vis konkurrence på det stagnerende søgemarked nok være godt for alle.

Det, Socher identificerede som en nøglepræmis for you.com, er ideen om at gøre AI kontrollerbar af de mennesker, der er berørt af den. For you.com betyder det, at brugere kan skubbe søgemaskinen til, hvad de gerne vil se mere eller mindre af. Hvad angår det større billede i AI, ser Socher ud til at have været spot on i hans 2017 TED-samtale hvor han identificerede NLP og multimodal AI som nøgleretninger for fremtiden.

Socher mener, at LLM'er allerede "gør fantastiske ting", og håber på, at der vil blive gjort flere fremskridt med hensyn til multitask-læring, hvilket gør dem i stand til at blive bedre til flere opgaver. Han mener dog også, at LLM'er i sidste ende skal injiceres med visse regler eller gøres i stand til at lære dem, da opskalering ikke ser ud til at kunne opnå dette.

Med hensyn til at flytte AI fremad bemærkede Socher også, at den nuværende hardware favoriserer en specifik type AI-modelarkitektur, som er afhængig af matrixmultiplikationer. Det er måske eller måske ikke vejen frem, men denne "hardware-bias" har sat alternative modelarkitekturer til side. Det er lidt som at lede efter dine nøgler under lygtepælen, bemærkede Socher.

Socher er naturligvis opmærksom på alle vigtige AI-talepunkter i disse dage, inklusive bias (det er ikke kun datasættene), bæredygtighed (måske overdrevet, men vi kan og bør gøre det bedre), etik (ingen nemme svar, det afhænger af hver persons holdninger og tro) og mere. Det er en samtale værd at udforske - måske endnu mere, hvis you.com ender med at træne.



Kilde