You.com s'attaque à Google avec l'IA, apps, confidentialité et personnalisation

richard socher

Richard Socher : « Nous ne serons jamais aussi mauvais que Google. Nous ne vendrons jamais vos données.

vidéo salesforce.com

Êtes-vous satisfait de la recherche Google ? Quelle que soit la façon dont vous répondez à cette question, il y a de fortes chances que vous l'utilisiez toujours. À l'exception notable de la Chine et de la Russie, où Baidu et Yandex sont respectivement en tête, La part de marché de Google dans la recherche est de plus de 90 % dans le monde.

Ce n'est pas que Google est le seul jeu en ville. Outre Baidu et Yandex, Microsoft et Yahoo ont également tenté leur chance, avec respectivement Bing et le moteur de recherche éponyme. Le DuckDuckGo axé sur la confidentialité est une autre option. Pourtant, aucun de ceux-ci ne détient une part de marché supérieure à 3 % dans le monde. Une nouvelle entrée peut-elle faire mieux que tant d'autres avant elle ?

Richard Socher le pense. Socher, fondateur et PDG d'un moteur de recherche parvenu vous.com, a cette mission impossible en tête depuis ses jours à Stanford. Aujourd'hui, près d'une décennie plus tard, avec de nombreuses distinctions et une vaste expérience de démarrage et d'entreprise à son actif, Socher est tête baissée sur la mission impossible.

La naissance de you.com

Lorsque Socher est arrivé d'Europe aux États-Unis dans la vingtaine, son rêve était d'obtenir un poste de professeur d'université et il a travaillé très dur pour le réaliser. Il s'est lancé très tôt dans l'apprentissage en profondeur, alors qu'il ne s'agissait que d'un sujet de niche, et a travaillé avec les pionniers de l'apprentissage en profondeur Andrew Ng et Chris Manning à Stanford.

Après avoir remporté le prix de la meilleure thèse en informatique pour son doctorat. sur l'apprentissage profond récursif pour le traitement du langage naturel (TAL) et la vision par ordinateur, Socher pensait que fonder une startup ne serait qu'un détour sur le chemin du monde universitaire. La vie lui a donné tort.

Socher a décrit sa première startup, Métaesprit, en tant que "plate-forme d'IA d'entreprise qui fonctionnait dans l'imagerie médicale et les images de commerce électronique et la PNL et un tas d'autres choses, une plate-forme horizontale jouant le rôle d'outil d'apprentissage automatique pour les développeurs". Si cela semble intéressant aujourd'hui, c'était probablement en avance sur son temps en 2014.

Salesforce a acquis MetaMind en 2016 et Socher est devenu le Chief Data Scientist chez Salesforce. Il a dirigé plus de 100 chercheurs et plusieurs centaines d'ingénieurs, travaillant sur des applications qui ont été déployées à l'échelle et à l'impact de Salesforce. Socher a joué un rôle déterminant dans la création de Salesforce Einstein, une initiative de grande envergure visant à injecter des capacités d'IA dans la plateforme de Salesforce.

En 2020, Socher a quitté Salesforce pour poursuivre son ambition de longue date de créer un moteur de recherche, qu'il a nommé you.com. You.com a levé environ 20 millions de dollars auprès d'un certain nombre d'investisseurs, dont le co-fondateur, président et co-PDG de Salesforce, Mark Benioff. La première version a été mise en œuvre par Socher à la fin de son doctorat. mais il a d'abord hésité à poursuivre cela.

«À l'époque, je pensais, mec, c'est tout simplement trop ambitieux. Les gens étaient probablement comme, Google va me poursuivre en justice. Tous mes amis intelligents vont travailler chez Google. Ça va être si dur de rivaliser avec eux. Personne ne se plaint vraiment de Google dans mes cercles et en ligne. Et donc j'ai en quelque sorte rejeté l'idée », a déclaré Socher.

Socher a affirmé qu'il n'était pas intéressé par une acquisition rapide et a ajouté que lui et la petite équipe de you.com étaient très motivés et avaient la piste pour y travailler pendant de nombreuses années. Socher a reconnu que cela prendra en fait de nombreuses années et a donné trois groupes de raisons différentes pour s'attaquer à Google : spécifiques à l'utilisateur, macro et timing.

Quel est le problème avec Google ?

Bon nombre des raisons spécifiques à l'utilisateur citées par Socher sont liées à la confidentialité. La plupart des voyages en ligne commencent par une simple recherche, et le fait que notre vie privée soit si massivement envahie à presque chaque étape que nous franchissons en ligne alors que nos vies se déroulent de plus en plus en ligne est regrettable, a-t-il déclaré. Cependant, a-t-il ajouté, les utilisateurs en prennent conscience, et c'est une bonne chose.

Les annonces font également partie des raisons spécifiques à l'utilisateur de Socher. En tant qu'utilisateur, il est simplement ennuyeux de voir cinq ou sept publicités différentes avant de voir du contenu, a déclaré Socher. De plus, une fois que vous en savez un peu plus sur le fonctionnement du classement de contenu, vous réalisez que tous ces microsites optimisés pour les moteurs de recherche (SEO) ne sont que des publicités essayant d'orienter Google vers des liens d'affiliation et des cookies, a-t-il ajouté.

Ensuite, il y a la question du contrôle. "Beaucoup de gens pensent à leur régime alimentaire, mais je pense que notre régime d'information est également extrêmement important. Il est important de pouvoir [..] dire, je veux voir plus de Reddit ou moins de Reddit, ou je veux voir le New York Times ou ZDNet et d'autres, plutôt que d'être simplement vendu avec vos désirs d'information à l'annonceur le plus offrant et n'ayant aucun contrôle sur cela », a déclaré Socher.

Les raisons macroéconomiques de Socher se résument principalement au fait que "toute l'économie se déplace en ligne, et avoir un seul gardien qui veut vous vendre au meilleur annonceur n'est pas une configuration idéale pour le Web, point final", comme il l'a dit. 

Google a toujours a soutenu que Google Ads et le classement organique sont entièrement indépendants. Socher a mis en doute la validité de cette affirmation, bien que nous n'ayons pas été en mesure de la vérifier de manière indépendante. Socher a commenté que "c'est comme un mauvais film, et c'est un peu fou que ça se passe." Du bon côté, a-t-il ajouté, il y a maintenant un certain vent arrière en termes d'antitrust et de prise de conscience des enjeux pour l'ensemble de l'économie ».  

opéra-instantané-2022-06-20-125436-vous-com

You.com est le pari de Richard Socher pour s'attaquer à la recherche Google

Quelque part entre la macro et le timing se trouverait ce que nous pourrions appeler le déluge d'informations. Il y a vingt ans, c'était incroyable de pouvoir avoir accès à l'information. Aujourd'hui, l'accès à l'information est un enjeu de table, et le problème est de savoir comment gérer tout cela, a noté Socher. Sa réponse : "Vous devez avoir une IA qui le résume pour vous" .

Socher croit fermement que le moment est venu d'innover dans la recherche, car il n'y a pas vraiment eu beaucoup d'innovation ces dernières années. Initialement, Google a fourni une quantité insensée de valeur, mais maintenant, elle est aplatie de manière logarithmique, a déclaré Socher. Les données que les gens fournissent à Google n'étaient pas très utiles au départ, mais nous atteignons maintenant un point d'inflexion où les données des gens deviennent plus précieuses que les services qu'ils obtiennent de Google, a-t-il ajouté.

On pourrait affirmer qu'au fil du temps, Google a également ajouté l'IA pour alimenter sa recherche, notamment en utilisant BERT, l'un des grands modèles de langage (LLM) lancé par Google. Cependant, Socher n'a pas retenu sa critique, notant que la seule façon d'obtenir "quelque chose de réel" de la recherche Google est de lui demander d'obtenir explicitement des résultats de sites comme Reddit à chaque fois et que l'idée d'innovation de Google semble descendre. à ajouter une liste toujours croissante d'annonces à ses résultats pour augmenter les ventes.

S'attaquer à Google avec l'IA, apps, confidentialité et personnalisation

Il y a un certain fondement dans la critique de Google par Socher. Cependant, c'est un fait bien connu de tous ceux qui connaissent même à distance les moteurs de recherche qui Google a construit une douve très efficace autour de son activité en créant ce qui est sans doute l'index le plus complet et le plus efficace du web.

De plus, à l'heure actuelle, Google est tellement ancré dans la routine de milliards de personnes à travers le monde, et la valeur par défaut pour la plupart des options de recherche de navigateur, que pour faire changer les utilisateurs, comme l'a dit un dirigeant de Yandex à ZDNet, vous devez être 10 fois meilleur. Est-ce même possible pour n'importe qui, sans parler d'un parvenu comme vous.com ? Comment faites-vous cela?

Socher's reply à cette question évidente reposait sur le fait que toutes les requêtes ne sont pas identiques. Parfois, a-t-il dit, les gens veulent simplement obtenir des informations factuelles, comme la météo du jour ou le chef d'une organisation. Parfois, ils veulent accéder à un site spécifique et, au lieu de le saisir, ils le saisissent dans une recherche.

Pour ces types de requêtes (requêtes d'informations rapides et requêtes de navigation, respectivement), tout ce que vous pouvez faire est de les traiter le plus rapidement possible. Il n'y a pas de place pour la différenciation. Là où les choses deviennent intéressantes, c'est dans ce que Socher a appelé des "recherches complexes d'information / d'action" ou des requêtes élaborées, et des requêtes qui concernent réellement l'accomplissement d'une tâche, respectivement.

Socher a affirmé que you.com fait déjà mieux que Google dans les recherches d'informations complexes car il fournit des informations beaucoup plus riches. En ce qui concerne les recherches d'action, telles que la commande de plats à emporter ou la réservation d'un vol, Socher a clairement indiqué que c'était l'objectif pour you.com. Il s'est référé à you.com apps, qui sont des modules spécifiques à un domaine et adaptés aux besoins de tâches/publics spécifiques.

Un domaine que you.com cible est le codage et les recherches de développeurs. Socher a donné l'exemple d'un développeur cherchant à former un modèle à l'aide de PyTorch. You.com peut vous aider de plusieurs façons. Il existe une application Stack Overflow, des extraits de code, un accès à la documentation, des discussions Reddit et même une application génératrice de code, a déclaré Socher.

Ce sont toutes des choses que Google n'offre pas, elles viennent avec un bouton copier-coller, et elles offrent une grande valeur en aidant les développeurs à économiser entre 30 secondes et 30 minutes pour chaque recherche, a affirmé Socher. Il y a "une tonne d'IA et de PNL là-dedans", a-t-il ajouté.

zd-software-development-bundle.jpg

Les applications de recherche spécifiques à un domaine sont la façon dont you.com vise à fournir des résultats 10 fois meilleurs que Google. Les développeurs sont l'un des publics clés

Il en va de même pour des éléments tels que les avis sur les produits, qui regroupent et résument les informations provenant de différentes sources, plutôt que d'avoir à ouvrir une multitude d'onglets. C'est 10 fois mieux, selon Socher. Il a également évoqué la manière dont you.com travaille avec des fournisseurs de contenu tels que Stack Overflow pour son apps, faisant allusion à des annonces avec plus de détails sur la "construction d'un écosystème" à venir soon.

Socher a également parlé du modèle commercial de you.com et de sa position sur la confidentialité. Il est convaincu que you.com apps apportera une valeur qu'un nombre suffisant de personnes seront prêtes à payer. Une autre caractéristique qui, selon Socher, ajoute de la valeur est la personnalisation - la possibilité pour les utilisateurs de personnaliser les résultats en fonction de leurs préférences.

De toute évidence, pour que cela se produise, les profils d'utilisateurs doivent être pris en charge. Cela ouvre la porte à des discussions sur la collecte de données, la confidentialité, les revenus publicitaires et les politiques connexes. À ce stade, Socher considère les publicités comme des sources de revenus secondaires et adopte une approche intermédiaire de la confidentialité. You.com propose un mode privé, et Socher promet une meilleure confidentialité : « Nous ne serons jamais aussi mauvais que Google. Nous ne vendrons jamais vos données ».

Cependant, il pense également que si vous faites de la confidentialité votre point central, alors "les inconditionnels de la confidentialité à ce stade veulent que vous soyez un projet entièrement crypté, entièrement open source, sans revenus, sans données, sans aucun type de projet. Essentiellement, vous ne pouvez pas vraiment être une entreprise, [..] vous ne pourrez jamais rivaliser avec Google. » You.com utilisera les données des utilisateurs connectés pour fournir des résultats localisés, ce que Socher estime être quelque chose que la plupart des utilisateurs souhaitent.

En fin de compte, cependant, le choix entre confidentialité et commodité appartiendra aux utilisateurs. Quant à savoir d'où proviennent les informations : certaines d'entre elles, pour les requêtes génériques, proviennent de l'index de Bing. Pour les requêtes spécifiques à un domaine, you.com possède ses propres index. Il s'agit d'une dépendance de tous les moteurs de recherche, à l'exception de Google et Bing, a déclaré Socher, bien que certains comme DuckDuckGo ne soient "qu'un mince emballage autour de Bing".

La voie à suivre

Il est encore tôt pour you.com, donc le verdict quant à savoir si cela peut fonctionner n'a pas encore été rendu. Outre "beaucoup d'amour sur Twitter et d'autres canaux", que Socher a qualifié de signe encourageant, il existe également des raisons plus solides d'être optimiste.

Socher a une analyse complète des faiblesses de Google, ainsi que du contexte, de la motivation et du soutien pour au moins essayer. L'approche adoptée par you.com, bien qu'elle ne soit pas encore pleinement opérationnelle ou dévoilée, semble prometteuse. You.com a récemment été inclus dans Liste AI 100 de CB Insights des startups d'intelligence artificielle les plus prometteuses de 2022.

Le fondateur de You.com ne semble pas se faire d'illusions sur le fait que cela va être une bataille difficile. Amener les utilisateurs à adopter un modèle de paiement à l'utilisation pour la recherche, battre Google à son propre jeu d'alimentation de la recherche avec l'IA, et marcher sur la ligne de démarcation entre garder les utilisateurs heureux et gérer une entreprise viable sont tous de gros paris pour you.com. Si rien d'autre, cependant, une certaine concurrence sur le marché de la recherche stagnante serait probablement bonne pour tout le monde.

Ce que Socher a identifié comme une prémisse clé pour you.com est l'idée de rendre l'IA contrôlable par les personnes concernées. Pour you.com, cela signifie que les utilisateurs peuvent pousser le moteur de recherche sur ce qu'ils aimeraient voir plus ou moins. En ce qui concerne la vue d'ensemble de l'IA, Socher semble avoir été sur place dans son 2017 TED Discuter dans lequel il a identifié la PNL et l'IA multimodale comme des orientations clés pour l'avenir.

Socher pense que les LLM « font déjà des choses incroyables » et espère que davantage de progrès seront réalisés en termes d'apprentissage multitâche, leur permettant d'être meilleurs dans plus de tâches. Cependant, il pense également qu'à terme, les LLM devront se voir injecter certaines règles ou leur permettre de les apprendre, car la mise à l'échelle ne semble pas en mesure d'y parvenir.

En ce qui concerne la progression de l'IA, Socher a également noté que le matériel actuel favorise un type spécifique d'architecture de modèle d'IA, qui repose sur des multiplications matricielles. Ce n'est peut-être pas la voie à suivre, mais ce "biais matériel" a écarté les architectures de modèles alternatives. C'est un peu comme chercher ses clés sous le lampadaire, note Socher.

Socher est naturellement conscient de tous les principaux points de discussion sur l'IA ces jours-ci, y compris les préjugés (ce ne sont pas seulement les ensembles de données), la durabilité (peut-être exagérée, mais nous pouvons et devons faire mieux), l'éthique (pas de réponses faciles, cela dépend des positions de chacun et croyances), etc. C'est un conversation à explorer – peut-être encore plus si you.com finit par fonctionner.



Identifier