четверг, 31 января 2019 г.

Руководитель ViV Labs, принадлежащей Samsung Electronics, рассказал о перспективах голосовых помощников в 2019-м году





Начиная с 2011 года виртуальные голосовые помощники широко используются на смартфонах и других устройствах. Сегодня люди регулярно отправляют миллиарды самых разных запросов: «воспроизведи трэк», «отправь сообщение», «установи напоминание», «проверь список задач», и даже спрашивают у телефона: «Ты меня любишь?» Однако, какими бы популярными и полезными ни были голосовые ассистенты, в экосистеме мобильных приложений и интернета им все ещё не отводится центральное место. Но ситуация начинает меняться. Крупнейшие игроки представляют инновации по целому ряду важных направлений, и уже скоро это приведёт к трансформации рынка.
Технический директор американской Viv Labs, которая 3 года назад вошла в состав Samsung Electronics, Адам Чейер (Adam Cheyer) поделился своими прогнозами на то, как будет развиваться рынок виртуальных помощников в 2019 году.

1. Один помощник вместо тысячи

Сегодня: В большинстве популярных платформ виртуальных помощников пользователь может отправлять запросы и работать лишь с ограниченным набором встроенных сервисов. И если вы хотите работать с приложениями от сторонних разработчиков, то вам придётся добавить в запрос имя поставщика услуг, а затем использовать его специальный набор команд. В итоге запросы выглядят примерно так: «Помощник, попроси ‘приложение 7’ выполнить ‘команду 5’». Пользователям трудно запомнить многочисленные названия сервисов и выучить их наборы команд, такая модель плохо масштабируется. Пользователи по-прежнему работают лишь с небольшим числом встроенных сервисов, изначально поддерживаемых помощником.

В будущем: В 2019 году виртуальные помощники получат более цельный и интегрированный интерфейс, благодаря которому пользователи смогут задавать любые вопросы, в любой удобной форме, и более естественным образом взаимодействовать с сервисами от сторонних разработчиков.
С точки зрения пользователя удобнее взаимодействовать с одним ассистентом, способным выполнять множество различных задач, вместо целого множества разных помощников, у каждого из которых – свои собственные возможности, управление, память и т.д. Если этот прогноз сбудется, то пользователи получат гораздо более эффективный и индивидуальный инструмент, а поставщики услуг – легко масштабируемый канал для доступа к своим сервисам.

2. Инструменты и платформы для разработки станут мощнее

Сегодня: При добавлении новых сервисов в платформу голосового ассистента, зачастую существует огромная разница между инструментами, доступными большой компании, специализирующейся на разработке виртуальных помощников, и ресурсами, которые имеются в арсенале сторонних разработчиков. Последние имеют доступ к веб-инструментам, которые способны предоставить только базовый синтаксический анализ естественной речи и простые шаблоны для построения диалога.

В будущем: В 2019 году у сторонних разработчиков наконец-то появится доступ к сложным платформам и инструментарию с более широкой функциональностью. В дополнение к этому, чтобы усовершенствовать распознавание естественного языка, платформы на базе технологии машинного обучения будут предлагать больше возможностей для анализа пользовательских предпочтений, структурного и контекстуального управления диалогом с пользователем, адаптивной поддержки сразу нескольких устройств для работы на разных языках. Наиболее продвинутые платформы будут поддерживать создание кода с помощью искусственного интеллекта, благодаря чему разработчики смогут быстрее добавлять самые разные сценарии использования. При этом количество кода, который придётся писать и поддерживать, будет сокращаться.

3. Помощники станут не только информативными, но и деятельными

Сегодня: В большинстве случаев помощники используются для получения информации и ответов на вопросы.

В будущем: В 2019 году мы увидим, что виртуальные ассистенты смогут не только отвечать на запросы пользователей, но и самостоятельно выполнять определённые задачи. Благодаря интегрированным платёжным системам и сетевым стандартам, таким как OAuth, помощники будут осуществлять платёжные транзакции без перенаправления пользователей в другие интерфейсы. Например, заказывать билеты, отправлять цветы, бронировать места в ресторанах и многое другое – всё это посредством голосового управления на различных устройствах без необходимости перехода в отдельное приложение или на вэб-сайт.

4. Виртуальные помощники изменят наши представления о поездках на автомобиле

Сегодня: Виртуальные помощники в автомобиле используются в основном для отправки текстовых сообщений, совершения телефонных звонков, управления музыкой, поиска маршрутов и навигации.

В будущем: Экосистемы виртуальных помощников будут становиться более открытыми и предлагать новый инструментарий для естественного взаимодействия с пользователями. Это, в первую очередь, предоставление полезной для водителя информации в голосовом формате и поддержка платёжных транзакций.
Каждый год жители США тратят в общей сложности более одного миллиарда часов на дорогу от дома до работы. Поскольку во время управления автомобилем открывать вэб-сайты или приложения небезопасно, интеллектуальный виртуальный помощник способен взять на себя часть задач пользователя, тем самым обеспечив более безопасное вождение.
В 2019 году мы увидим новые решения, благодаря которым виртуальные помощники превратятся из инструмента с второстепенной функциональностью в полноценную платформу пользовательского интерфейса, не менее важную, чем интерфейс мобильных устройств.

2019 Predictions (by Adam Cheyer CTO of Viv Labs, Samsung Electronics)

Conversational Assistants have been widely deployed on phones and other devices since 2011. Today, people send billions of requests each week, asking to “play a song”, “send a message”, “set a reminder”, “check my calendar”, and even “do you love me?” However, as popular and useful as they’ve become, Assistants are still not important at the level of the web or the mobile app ecosystem. This is starting to change though. The major players are innovating along some important dimensions that will change the landscape for Assistants in the coming year.

Here are some predictions to watch for in the Assistant space in 2019.

1.Users will have one Assistant rather than 50,000 assistants

Today: With most of the popular Assistant platforms, you can make requests to a limited set of built-in services such as the examples above. But when you try to access a service from a third-party developer, it’s a whole different ball game — you need to prefix your request with the service providers name and then use their specific command set. “Assistant, ask to do ”. For a user, it’s hard to remember tens of thousands of different provider names and command sets, so this model doesn’t scale well. As a result, traffic to third party services is minimal, and users remain limited mostly to the few built-in services that come with the Assistant.

Prediction: In 2019, Assistant experiences will move towards a more seamless, integrated interface, where you can ask for what you want in the way you want, and interact more naturally with services provided by third parties. As a user, I want one Assistant who can do 50,000 things, not 50,000 different Assistants who each have their own very different experience, memories, and so forth. As this prediction comes to fruition, users will have a much more efficient, customizable experience, and service providers will have a much more scalable channel to receive relevant service requests.

2.Developer tools and platforms will be far more powerful

Today: When a developer adds services to an AI Assistant, there is a huge disparity between the tools you get to use if you’re working inside one of the big Assistant companies and if you’re a third party developer. Third parties only have access to simple web-based tools that provide basic natural language parsing, brittle dialog response templates, and not much else.

Prediction: In 2019, developers will finally have access to sophisticated platforms and tools that provide much more functionality and richness than what they have to work with today. In addition to rich natural language understanding, platforms will offer capabilities such as machine learning for user preferences, compositional and contextual dialog management, adaptable multi-device and multi-lingual experiences, and the most advanced of them will feature AI-created code generation, allowing developers to more quickly handle a wide array of use cases with less code to write and maintain.

3.Assistants move from just “knowing” to “doing”

Today: Most Assistants in use today are primarily used for retrieving information or answering questions.

Prediction: In 2019, we will see Assistants begin to be able to not only answer questions, but also perform tasks on the user’s behalf. Through integrated payment systems and Internet standards such as OAuth, Assistants will be able to complete transactions end-to-end, without ever leaving the Assistant experience. Assistants will now be able to order tickets, send flowers, make reservations, and much more, all through a conversational multi-device experience, without ever needing to punch out to an app or a website.

4.Assistants will transform the car experience

Today: Assistants are used in the car primarily to send text messages, make phone calls, play music, and to start navigation to desired destinations.

Prediction: As Assistant ecosystems open up and start to offer more powerful development tools, more natural interactions, and provide in-experience transactional capabilities, we anticipate the developers will flock to offer commuters all sorts of useful and important functionality through hands and eyes-free interaction experiences. More than one billion hours are spent by commuters each year in the US alone, and while it’s not safe to use websites or apps to perform functions while driving, an Assistant interface can bring more interesting functionality within reach of car users.

In 2019, keep an eye out for developments along these dimensions, signaling a move for the Assistant from being a simple utility to becoming a full-fledged user interface paradigm as important as the Web or Mobile.