You.com бросает вызов Google с помощью ИИ, apps, конфиденциальность и персонализация

Ричард-Сохер

Ричард Сочер: «Мы никогда не будем такими плохими, как Google. Мы никогда не продадим ваши данные».

Видео с сайта salesforce.com

Довольны ли вы поиском Google? Независимо от того, как вы ответите на этот вопрос, скорее всего, вы все еще используете его. За исключением Китая и России, где Baidu и Яндекс лидируют соответственно. Доля Google на рынке поиска составляет более 90% по всему миру..

Дело не в том, что Google — единственная игра в городе. Помимо Baidu и Яндекс, попытали счастья такие компании, как Microsoft и Yahoo, с Bing и одноименной поисковой системой соответственно. DuckDuckGo, ориентированный на конфиденциальность, — еще один вариант. Тем не менее, ни один из них не имеет доли рынка более 3% по всему миру. Может ли новая запись добиться большего успеха, чем многие другие до нее?

Так считает Ричард Сочер. Сочер, основатель и генеральный директор новой поисковой системы you.com, эта миссия была невыполнима с тех пор, как он учился в Стэнфорде. Сегодня, почти десятилетие спустя, имея за плечами множество отличий и большой опыт стартапов и предприятий, Сохер с головой окунулся в невыполнимую миссию.

Рождение you.com

Когда Сочер приехал в США из Европы в возрасте двадцати с небольшим лет, его мечтой было получить работу преподавателя в университете, и он очень много работал, чтобы воплотить ее в жизнь. Он рано начал заниматься глубоким обучением, когда это была лишь нишевая тема, и работал с пионерами глубокого обучения Эндрю Нг и Крисом Мэннингом в Стэнфорде.

Получив награду за лучшую диссертацию по компьютерным наукам за докторскую степень. по рекурсивному глубокому обучению для обработки естественного языка (NLP) и компьютерному зрению Сохер думал, что создание стартапа будет просто обходным путем на пути к академическим кругам. Жизнь доказала, что он ошибался.

Сочер описал свой первый стартап, МетаРазум, как «корпоративная платформа искусственного интеллекта, которая работала с медицинскими изображениями и изображениями электронной коммерции, НЛП и множеством других вещей, горизонтальная платформа играет роль инструмента машинного обучения для разработчиков». Если это звучит интересно сегодня, то, вероятно, в 2014 году это было намного раньше.

Salesforce приобрела MetaMind в 2016 году, и Сохер стал главным специалистом по данным в Salesforce. Он руководил более чем 100 исследователями и многими сотнями инженеров, работающих над приложениями, которые были развернуты в масштабах и влиянии Salesforce. Сочер сыграл важную роль в создании Salesforce Einstein, широкомасштабной инициативы по внедрению возможностей искусственного интеллекта в платформу Salesforce.

В 2020 году Сочер покинул Salesforce, чтобы реализовать свои давние амбиции по созданию поисковой системы, которую он назвал you.com. You.com привлек около 20 миллионов долларов от ряда инвесторов, включая соучредителя, председателя и со-генерального директора Salesforce Марка Бениоффа. Первая версия была реализована Сочером в конце защиты докторской диссертации. но поначалу он не решался заняться этим.

«В то время я думал, чувак, это слишком амбициозно. Люди, вероятно, думали, что Google собирается подать на меня в суд. Все мои умные друзья собираются работать в Google. С ними будет очень сложно конкурировать. В моих кругах и в сети никто особо не жалуется на Google. И поэтому я как бы отказался от этой идеи», — сказал Сочер.

Сочер заявил, что он не заинтересован в быстром приобретении, и добавил, что он и небольшая команда на you.com очень мотивированы и имеют возможность работать над этим в течение многих лет. Сочер признал, что на самом деле это займет много лет, и назвал три разных группы причин для обращения в Google: специфические для пользователя, макрос и сроки.

Что не так с Google?

Многие из причин, связанных с конкретными пользователями, на которые ссылается Сочер, связаны с конфиденциальностью. Большинство онлайн-путешествий начинаются с простого поиска, и тот факт, что наша конфиденциальность подвергается такому массовому вторжению почти на каждом шагу, который мы делаем онлайн, поскольку наша жизнь все больше и больше уходит в онлайн, вызывает сожаление, сказал он. Однако, добавил он, пользователи узнают об этом, и это хорошо.

Реклама также является частью причин, связанных с пользователями Socher. По словам Сочера, пользователя просто раздражает видеть пять-семь разных рекламных объявлений, прежде чем вы увидите какой-то контент. Кроме того, как только вы немного узнаете о том, как работает ранжирование контента, вы поймете, что все эти микросайты, оптимизированные для поисковых систем (SEO), также являются просто рекламой, пытающейся направить Google в партнерские ссылки и файлы cookie, добавил он.

Затем возникает проблема контроля. «Многие люди думают о своей пищевой диете, но я думаю, что наша информационная диета также невероятно важна. Важно иметь возможность [..] сказать: я хочу видеть больше Reddit или меньше Reddit, или я хочу видеть New York Times или ZDNet и другие, вместо того, чтобы просто быть проданным с вашими информационными желаниями рекламодателю с самой высокой ценой и не имея никакого контроля над этим», — сказал Сочер.

Макропричины Сочера в основном сводятся к тому факту, что «вся экономика переходит в онлайн, и наличие единственного привратника, который хочет продать вас самому высокому рекламодателю, не является идеальной установкой для Интернета, и точка», как он выразился. 

Google всегда утверждал, что Google Ads и органическое ранжирование полностью независимы. Сочер поставил под сомнение обоснованность этого утверждения, хотя мы не смогли проверить это независимо. Сочер прокомментировал, что «это похоже на плохой фильм, и это безумие, что это происходит». С другой стороны, добавил он, сейчас есть некоторый попутный ветер с точки зрения антимонопольного законодательства и понимания проблем, поставленных на карту для всей экономики».  

опера-моментальный снимок-2022-06-20-125436-вы-com

You.com - это ставка Ричарда Сочера на поиск Google

Где-то посередине между макро и таймингом будет то, что мы могли бы назвать информационным потоком. Двадцать лет назад было удивительно иметь доступ к информации. Сегодня доступ к информации является ставкой, и проблема заключается в том, как со всем этим справиться, отметил Сочер. Его ответ: «Вам нужен ИИ, который резюмирует это для вас».

Сочер твердо убежден, что сейчас самое время внедрять инновации в области поиска, поскольку в последние годы инноваций было не так много. По словам Сочера, изначально Google предлагал безумную ценность, но теперь она логарифмически сглажена. Он добавил, что данные, которые люди предоставляют Google, изначально не были очень ценными, но сейчас мы достигаем переломного момента, когда данные людей становятся более ценными, чем услуги, которые они получают от Google.

Можно утверждать, что со временем Google также добавил ИИ для обеспечения поиска, в частности, с помощью BERT, одной из моделей большого языка (LLM), впервые разработанной Google. Тем не менее, Сочер не стал сдерживать свою критику, отметив, что единственный способ получить «что-то реальное» из поиска Google — это дать ему указание каждый раз явно получать результаты с таких сайтов, как Reddit, и что представление Google об инновациях, похоже, сходит на нет. добавлять постоянно растущий список объявлений в свои результаты для увеличения продаж.

Соперничая с Google с помощью ИИ, apps, конфиденциальность и персонализация

В критике Google Сохером есть определенная основа. Однако всем, даже отдаленно знакомым с поисковыми системами, хорошо известен тот факт, что Google построил очень эффективный ров вокруг своего бизнеса создав, возможно, самый полный и эффективный индекс в Интернете.

Кроме того, к настоящему времени Google настолько укоренился в рутине миллиардов людей по всему миру и является стандартным для большинства параметров поиска в браузере, что, как однажды сказал ZDNet один из руководителей Яндекса, чтобы заставить пользователей переключиться, вы должны быть в 10 раз лучше. Возможно ли это вообще для кого-то, не говоря уже о таком выскочке, как you.com? Как вы это делаете?

Сочера reply на этот очевидный вопрос был основан тот факт, что не все запросы одинаковы. Иногда, по его словам, люди просто хотят получить фактическую информацию, например, сегодняшнюю погоду или руководителя организации. Бывает, хотят попасть на конкретный сайт, а вместо того, чтобы набирать, вводят в поиск.

Для этих типов запросов (быстрых информационных запросов и навигационных запросов соответственно) все, что вы можете сделать, это обслужить их как можно быстрее. Здесь нет места для дифференциации. Что становится интересным, так это то, что Сохер назвал «сложным поиском информации/действия» или сложными запросами, а также запросами, которые действительно касаются выполнения задачи, соответственно.

Сочер заявил, что you.com уже работает лучше, чем Google, в сложных информационных поисках, потому что он предоставляет гораздо больше информации. Что касается поисковых запросов, таких как заказ еды на вынос или бронирование авиабилета, Сохер ясно дал понять, что это цель для you.com. Он ссылался на you.com apps, которые представляют собой модули для предметной области, точно настроенные на потребности конкретных задач/аудиторий.

Один из доменов, на который ориентирован you.com, — это кодирование и поиск разработчиков. Сочер привел пример разработчика, ищущего, как обучить модель с помощью PyTorch. You.com может помочь несколькими способами. По словам Сочера, есть приложение Stack Overflow, фрагменты кода, доступ к документации, обсуждения Reddit и даже приложение для генерации кода.

Это все то, чего Google не предлагает, у них есть кнопка «копировать-вставить», и они очень полезны, помогая разработчикам экономить от 30 секунд до 30 минут на каждый поиск, заявил Сочер. Он добавил, что там «тонна ИИ и НЛП».

zd-software-development-bundle.jpg

Поисковые приложения для конкретных доменов — это то, как you.com стремится предоставлять в 10 раз лучшие результаты, чем Google. Разработчики — одна из ключевых аудиторий

То же самое касается таких вещей, как обзоры продуктов, которые собирают и обобщают информацию из разных источников, вместо того, чтобы открывать множество вкладок. По словам Сочера, это в 10 раз лучше. Он также упомянул о том, как you.com работает с поставщиками контента, такими как Stack Overflow. apps, ссылаясь на объявления с более подробной информацией о «построении экосистемы», soon.

Сочер также рассказал о бизнес-модели you.com и ее позиции в отношении конфиденциальности. Он уверен, что you.com apps обеспечит ценность, за которую будет готово платить достаточное количество людей. Еще одна функция, которая, по мнению Сочера, добавляет ценности, — это персонализация — возможность для пользователей настраивать результаты в соответствии со своими предпочтениями.

Понятно, что для этого должны поддерживаться профили пользователей. Это открывает двери для дискуссий о сборе данных, конфиденциальности, доходах от рекламы и соответствующих политиках. На данный момент Сохер рассматривает рекламу как второстепенный источник дохода и придерживается промежуточного подхода к конфиденциальности. You.com предлагает приватный режим, а Сохер обещает лучшую конфиденциальность: «Мы никогда не будем такими плохими, как Google. Мы никогда не продадим ваши данные».

Тем не менее, он также считает, что если вы сделаете конфиденциальность своим фокусом, то «хардкорные люди в области конфиденциальности в этот момент хотят, чтобы вы были полностью зашифрованным, полностью открытым исходным кодом, без доходов, без данных, без какого-либо проекта. По сути, вы не можете быть компанией, [..] вы никогда не сможете конкурировать с Google». You.com будет использовать данные вошедших в систему пользователей для предоставления локализованных результатов, что, по мнению Сочера, нужно большинству пользователей.

Однако в конечном итоге выбор между конфиденциальностью и удобством будет за пользователями. Что касается того, откуда берется информация: часть ее для общих запросов поступает из индекса Bing. Для доменных запросов у you.com есть свои индексы. Это зависимость есть у всех поисковых систем, кроме Google и Bing, сказал Сочер, хотя некоторые из них, такие как DuckDuckGo, являются «просто тонкой оболочкой Bing».

Путь вперед

Для you.com все еще рано, поэтому вердикт о том, сработает ли это, еще не вынесен. Помимо «большой любви в Твиттере и других каналах», которую Сочер назвал обнадеживающим признаком, есть и более веские причины для оптимизма.

У Сочера есть всесторонний анализ слабых сторон Google, а также предыстория, мотивация и поддержка, чтобы хотя бы попытаться. Подход, который использует you.com, хотя и не полностью запущен или еще не представлен, кажется многообещающим. You.com недавно был включен в Список CB Insights AI 100 самых многообещающих стартапов искусственного интеллекта 2022 года.

У основателя You.com, похоже, нет никаких иллюзий по поводу того, что это будет тяжелая битва. Привлечение пользователей к модели поиска с оплатой за использование, победа над Google в его собственной игре по усилению поиска с помощью ИИ и пройти тонкую грань между удовлетворением пользователей и ведением жизнеспособного бизнеса все большие ставки для you.com. Однако, по крайней мере, некоторая конкуренция на застойном рынке поиска, вероятно, была бы полезна для всех.

То, что Сочер определил как ключевую предпосылку для you.com, — это идея сделать ИИ контролируемым людьми, на которых он распространяется. Для you.com это означает, что пользователи могут подтолкнуть поисковую систему к тому, что они хотели бы видеть больше или меньше. Что касается более широкой картины ИИ, Сочер, кажется, попал в точку. 2017 TED Talk в которой он определил НЛП и мультимодальный ИИ как ключевые направления будущего.

Сочер считает, что LLM уже «делают удивительные вещи», и надеется, что будет достигнут больший прогресс в плане многозадачного обучения, что позволит им лучше справляться с большим количеством задач. Тем не менее, он также считает, что в конечном итоге LLM необходимо будет ввести определенные правила или дать им возможность изучить их, поскольку масштабирование, похоже, не может достичь этого.

Что касается продвижения ИИ вперед, Сочер также отметил, что современное оборудование предпочитает определенный тип архитектуры модели ИИ, основанный на умножении матриц. Это может быть или не быть путем вперед, но этот «аппаратный уклон» отодвинул на второй план альтернативные архитектуры моделей. Это немного похоже на поиск ключей под фонарным столбом, отметил Сохер.

Сочер, естественно, осведомлен обо всех основных темах для обсуждения ИИ в наши дни, включая предвзятость (это не только наборы данных), устойчивость (возможно, преувеличение, но мы можем и должны работать лучше), этику (нет простых ответов, это зависит от позиции каждого человека и убеждения) и многое другое. Это разговор, который стоит изучить — возможно, даже больше, если you.com в конечном итоге сработает.



Источник