You.com tar fatt på Google med AI, apps, personvern og personalisering

richard-socher

Richard Socher: «Vi kommer aldri til å bli så dårlige som Google. Vi vil aldri selge dataene dine.»

salesforce.com video

Er du fornøyd med Google-søk? Uansett hvordan du svarer på dette spørsmålet, er sjansen stor for at du fortsatt bruker det. Med de bemerkelsesverdige unntakene fra Kina og Russland, hvor henholdsvis Baidu og Yandex leder, Googles markedsandel innen søk er over 90 % på verdensbasis.

Det er ikke det at Google er det eneste spillet i byen. Foruten Baidu og Yandex, har slike som Microsoft og Yahoo også prøvd lykken, med henholdsvis Bing og den anonyme søkemotoren. Den personvernfokuserte DuckDuckGo er et annet alternativ. Likevel har ingen av disse en markedsandel på over 3 % på verdensbasis. Kan en ny oppføring gjøre det bedre enn så mange andre før den?

Richard Socher mener det. Socher, grunnlegger og administrerende direktør for oppkomling søkemotor du.com, har hatt dette umulige oppdraget på hjertet siden hans Stanford-dager. I dag, nesten et tiår senere, med mange utmerkelser og rikelig med oppstarts- og bedriftserfaring under beltet, er Socher hodestups på misjon umulig.

Fødselen til you.com

Da Socher kom til USA fra Europa i tjueårene, var drømmen hans å få en jobb ved universitetsfakultetet, og han jobbet veldig hardt for å få det til å gå i oppfyllelse. Han kom tidlig inn i dyp læring, da det bare var et nisjetema, og jobbet med dyplæringspionerene Andrew Ng og Chris Manning på Stanford.

Etter å ha vunnet prisen for beste informatikkavhandling for sin Ph.D. på Recursive Deep Learning for Natural Language Processing (NLP) og Computer Vision, trodde Socher at det å grunnlegge en oppstart bare ville være en omvei på veien til akademia. Livet viste at han tok feil.

Socher beskrev sin første oppstart, MetaMind, som "en enterprise AI-plattform som fungerte innen medisinsk bildebehandling og e-handelsbilder og NLP og en haug med andre ting, en horisontal plattformspill som et maskinlæringsverktøy for utviklere." Hvis det høres interessant ut i dag, var det sannsynligvis forut for sin tid i 2014.

Salesforce kjøpte MetaMind i 2016, og Socher ble Chief Data Scientist i Salesforce. Han ledet mer enn 100 forskere og mange hundre ingeniører som jobbet med applikasjoner som ble distribuert i Salesforce-skala og effekt. Socher var medvirkende til å skape Salesforce Einstein, et omfattende initiativ for å injisere AI-evner i Salesforces plattform.

I 2020 forlot Socher Salesforce for å forfølge sin mangeårige ambisjon om å bygge en søkemotor, som han kalte you.com. You.com har samlet inn rundt 20 millioner dollar fra en rekke investorer, inkludert Salesforce-medgründer, styreleder og co-CEO Mark Benioff. Den første versjonen ble implementert av Socher på slutten av sin Ph.D. men han var først nølende med å forfølge dette.

«Den gangen tenkte jeg, mann, det er bare for ambisiøst. Folk tenkte nok at Google kommer til å saksøke meg. Alle mine smarte venner skal jobbe hos Google. Det kommer til å bli så vanskelig å konkurrere med dem. Ingen klager så mye på Google i mine kretser og på nettet. Og så jeg forkastet ideen, sa Socher.

Socher hevdet at han ikke er interessert i dette for et raskt oppkjøp, og la til at han og det lille teamet på you.com er veldig motiverte og har rullebanen til å jobbe med dette i mange år. Socher erkjente at dette faktisk vil ta mange år, og ga tre forskjellige grupper av grunner for å ta på seg Google: brukerspesifikk, makro og timing.

Hva er galt med Google?

Mange av de brukerspesifikke grunnene Socher nevnte har med personvern å gjøre. De fleste nettreiser starter med et enkelt søk, og det faktum at personvernet vårt blir så massivt invadert ved nesten hvert trinn vi tar på nettet ettersom livene våre blir mer og mer på nettet, er uheldig, sa han. Imidlertid la han til, brukere blir klar over det, og det er en god ting.

Annonser er også en del av Sochers brukerspesifikke årsaker. Som bruker er det bare irriterende å se fem, syv forskjellige annonser før du ser noe innhold, sa Socher. I tillegg, når du først har lært litt om hvordan innholdsrangering fungerer, innser du at alle disse søkemotoroptimaliserte (SEO) mikronettstedene også bare er annonser som prøver å overføre Google til tilknyttede lenker og informasjonskapsler, la han til.

Så er det spørsmålet om kontroll. "Mange tenker på matdietten deres, men jeg tror også informasjonsdietten vår er utrolig viktig. Det er viktig å kunne [..] si, jeg vil se mer Reddit eller mindre Reddit, eller jeg vil se New York Times eller ZDNet og andre, i motsetning til bare å bli solgt med dine informasjonsønsker til den høyestbydende annonsøren og har ingen kontroll over det," sa Socher.

Sochers makrogrunner kommer for det meste ned på det faktum at "hele økonomien beveger seg på nettet, og å ha en enkelt portvakt som ønsker å selge deg til den høyeste annonsøren er ikke et ideelt oppsett for nettet, punktum," som han sa det. 

Google har alltid hevdet at Google Ads og organisk rangering er helt uavhengige. Socher stilte spørsmål ved gyldigheten av denne påstanden, selv om vi ikke var i stand til å bekrefte dette uavhengig. Socher kommenterte at "det er som en dårlig film, og det er litt sprøtt at det skjer." På den lyse siden, la han til, nå er det litt medvind når det gjelder antitrust og realisering av problemene som står på spill for hele økonomien.  

opera-snapshot-2022-06-20-125436-you-com

You.com er Richard Sochers innsats for å ta på Google-søk

Et sted i mellom makro og timing vil vi kunne kalle informasjonsfloden. For tjue år siden var det utrolig å kunne ha tilgang til informasjon. I dag er tilgang til informasjon bordinnsats, og problemet er hvordan man skal håndtere det hele, bemerket Socher. Hans svar: "Du må ha AI som oppsummerer det for deg".

Socher har stor tro på at nå er tiden inne for å innovere i søk, siden det egentlig ikke har vært så mye innovasjon de siste årene. I utgangspunktet ga Google en vanvittig mengde verdi, men nå er den logaritmisk flatet ut, sa Socher. Dataene som folk ga til Google var ikke veldig verdifulle i utgangspunktet, men nå når vi et vendepunkt der folks data blir mer verdifulle enn tjenestene de får fra Google, la han til.

Det kan hevdes at Google over tid har lagt til AI for å drive søket sitt også, spesielt ved å bruke BERT, en av de store språkmodellene (LLM) som ble utviklet av Google. Socher holdt imidlertid ikke tilbake på kritikken sin, og la merke til at den eneste måten å få "noe ekte" ut av Google-søk på er å instruere det om å få resultater fra nettsteder som Reddit eksplisitt hver gang, og at Googles idé om innovasjon ser ut til å falle. å legge til en stadig voksende liste med annonser til resultatene for å øke salget.

Tar på Google med AI, apps, personvern og personalisering

Det er en viss forankring i Sochers kritikk av Google. Det er imidlertid et velkjent faktum for alle som til og med er eksternt kjent med søkemotorer Google har bygget en veldig effektiv vollgrav rundt virksomheten sin ved å lage det som uten tvil er den mest omfattende og effektive indeksen på nettet.

I tillegg er Google nå så forankret i rutinene til milliarder av mennesker rundt om i verden, og standarden for de fleste søkealternativer i nettleseren, at for å få brukere til å bytte, som en Yandex-leder en gang fortalte ZDNet, må du være 10 ganger bedre. Er det mulig for hvem som helst, enn si en oppkomling som you.com? Hvordan går du frem?

Sochers reply til dette åpenbare spørsmålet var basert på det faktum at ikke alle spørsmål er like. Noen ganger, sa han, ønsker folk bare å få faktainformasjon, for eksempel været i dag, eller lederen av en organisasjon. Noen ganger ønsker de å komme til et bestemt nettsted, og i stedet for å skrive det, skriver de det inn i et søk.

For disse typene spørringer (henholdsvis raske informasjonsspørsmål og navigasjonsspørringer) er alt du kan gjøre å betjene dem så raskt som mulig. Det er ikke rom for differensiering. Hvor ting blir interessant er i det Socher kalte henholdsvis "komplekse informasjons-/handlingssøk" eller forseggjorte spørringer, og spørringer som egentlig handler om å fullføre en oppgave.

Socher hevdet at you.com allerede gjør det bedre enn Google i komplekse informasjonssøk fordi det gir mye mer rik informasjon. Når det gjelder handlingssøk, som å bestille takeaway eller bestille en flyreise, gjorde Socher det klart at dette er målet for you.com. Han henviste til you.com apps, som er domenespesifikke moduler som er finjustert til behovene til spesifikke oppgaver/målgrupper.

Et domene som you.com retter seg mot er koding og utviklersøk. Socher ga et eksempel med en utvikler som leter etter hvordan man trener en modell ved hjelp av PyTorch. You.com kan hjelpe på en rekke måter. Det er en Stack Overflow-app, det er kodebiter, det er tilgang til dokumentasjon, Reddit-diskusjoner og til og med en kodegenererende app, sa Socher.

Dette er alle ting som Google ikke tilbyr, de kommer med en copy-paste-knapp, og de gir stor verdi ved å hjelpe utviklere med å spare hvor som helst mellom 30 sekunder og 30 minutter for hvert søk, hevdet Socher. Det er "massevis av AI og NLP der inne," la han til.

zd-software-development-bundle.jpg

Domenespesifikke søkeapplikasjonene er hvordan you.com har som mål å levere ti ganger bedre resultater enn Google. Utviklere er en av de viktigste målgruppene

Det samme gjelder ting som produktanmeldelser, som samler og oppsummerer informasjon fra forskjellige kilder, i stedet for å måtte åpne en mengde faner. Det er 10 ganger bedre, ifølge Socher. Han refererte også til hvordan you.com jobber med innholdsleverandører som Stack Overflow for sin apps, med henvisning til kunngjøringer med flere detaljer om å "bygge et økosystem" kommer soon.

Socher snakket også om you.coms forretningsmodell og dens holdning til personvern. Han er sikker på at you.com apps vil gi verdi som nok folk vil være villige til å betale for. En annen funksjon som Socher mener tilfører verdi er personalisering – muligheten for brukere til å tilpasse resultater i henhold til deres preferanser.

Klart, for at dette skal skje, må brukerprofiler støttes. Det åpner for diskusjoner rundt datainnsamling, personvern, annonseinntekter og relaterte retningslinjer. På dette tidspunktet ser Socher på annonser som sekundære inntektsstrømmer og tar en mellomliggende tilnærming til personvern. You.com tilbyr en privat modus, og Socher lover bedre personvern: «Vi kommer aldri til å bli så dårlige som Google. Vi vil aldri selge dataene dine”.

Imidlertid mener han også at hvis du gjør personvern til fokuspunktet, så vil "hardcore personvernfolk på det tidspunktet at du skal være en fullstendig kryptert, fullstendig åpen kildekode, ingen inntekt, ingen data, ikke noe slags prosjekt. I hovedsak kan du egentlig ikke være et selskap, [..] du vil aldri være i stand til å konkurrere med Google.» You.com vil bruke data fra innloggede brukere for å vise lokaliserte resultater, noe Socher mener er noe de fleste brukere ønsker.

Til syvende og sist vil imidlertid valget mellom personvern og bekvemmelighet være opp til brukerne. Når det gjelder hvor informasjonen kommer fra: noe av det, for generiske spørringer, kommer fra Bings indeks. For domenespesifikke søk har you.com sine egne indekser. Dette er en avhengighet alle søkemotorer bortsett fra Google og Bing har, sa Socher, selv om noen som DuckDuckGo er "bare en tynn omslag rundt Bing".

Veien forover

Det er fortsatt tidlig for you.com, så dommen om dette kan fungere er fortsatt ute. Foruten "mye kjærlighet på Twitter og andre kanaler", som Socher omtalte som et oppmuntrende tegn, er det også mer solide grunner til optimisme.

Socher har en grundig analyse av Googles svakheter, og bakgrunnen, motivasjonen og støtten for i det minste å gi dette en sjanse. Tilnærmingen you.com tar, selv om den ikke er fullt operativ eller avduket ennå, virker lovende. You.com ble nylig inkludert i CB Insights' AI 100-liste over de mest lovende kunstig intelligens-oppstartene i 2022.

You.coms grunnlegger ser ikke ut til å ha noen illusjoner om at dette kommer til å bli en oppoverbakke. Få brukere til å ta i bruk en betal-til-bruk-modell for søk, slå Google i sitt eget spill med å drive søk med AI, og går den fine linjen mellom å holde brukerne fornøyde og å drive en levedyktig virksomhet er alle store innsatser for you.com. Om ikke annet ville nok en viss konkurranse i det stillestående søkemarkedet trolig være bra for alle.

Det Socher identifiserte som en nøkkelpremiss for you.com er ideen om å gjøre AI kontrollerbar av menneskene som er berørt av den. For you.com betyr det at brukere kan dytte søkemotoren til hva de vil se mer eller mindre av. Når det gjelder det større bildet i AI, ser det ut til at Socher har vært på topp i hans 2017 TED Talk der han identifiserte NLP og multimodal AI som nøkkelretninger for fremtiden.

Socher mener at LLM-er allerede "gjør fantastiske ting", og håper at flere fremskritt vil bli gjort når det gjelder fleroppgavelæring, slik at de kan bli bedre på flere oppgaver. Han tror imidlertid også at LLM-er til slutt må injiseres med visse regler, eller settes i stand til å lære dem, ettersom oppskalering ikke ser ut til å kunne oppnå dette.

Når det gjelder å flytte AI fremover, bemerket Socher også at nåværende maskinvare favoriserer en spesifikk type AI-modellarkitektur, som er avhengig av matrisemultiplikasjoner. Det kan være eller ikke være veien videre, men denne "maskinvarebias" har satt alternative modellarkitekturer til side. Det er litt som å lete etter nøklene dine under lyktestolpen, bemerket Socher.

Socher er naturligvis klar over alle viktige AI-talepunkter i disse dager, inkludert skjevhet (det er ikke bare datasettene), bærekraft (kanskje overdrevet, men vi kan og bør gjøre det bedre), etikk (ingen enkle svar, det avhenger av hver persons holdninger og tro), og mer. Det er en samtale verdt å utforske – kanskje enda mer hvis you.com ender opp med å trene.



kilde