среда, 11 июля 2018 г.

Интервью с Джи Хи Ким, главой лаборатории по восприятию естественного языка Samsung Research



«Уникальные возможности Samsung позволяют нам разработать ориентированный на пользователя алгоритм Искусственного интеллекта»

Научить искусственный интеллект (Artifical Intelligence или сокращённо AI) понимать человеческие диалоги и запросы, чтобы  давать оптимальные ответы пользователям, – одна из самых актуальных задач современной IT-индустрии. Джи Хи Ким, глава лаборатории по восприятию естественного языка в Центре искусственного интеллекта Samsung Research, стремится разработать AI-алгоритм, который сможет говорить с людьми на естественном языке и предлагать решение поставленных задач.
Лаборатория, которую возглавляет д-р Ким, недавно оказалась в центре внимания всего мира, когда получила высшие результаты в международных конкурсах по восприятию текстов, проводимых Microsoft и Университетом Вашингтона. Мы посетили Центр Искусственного Интеллекта Samsung Research, расположенный в районе Сеочо в Сеуле, чтобы обсудить с д-р Ким достижения AI в конкурсах по машинному восприятию текста и планы по развитию алгоритмов искусственного интеллекта.

Расскажите, пожалуйста, о конкурсах MS MARCO и TriviaQA, которые проводят Microsoft и Университет Вашингтона соответственно, на которых ваша команда заняла первые места.

 - В последнее время проводится множество международных конкурсов по машинному восприятию текстов, на которых искусственному интеллекту необходимо решить те или иные задачи. MS MARCO и TriviaQA входят в пятёрку лучших в мире конкурсов по машинному восприятию текстов. Алгоритмы AI проверяются на основании того, смогут ли они понять и проанализировать вопросы и предложить подходящие ответы на них. Эти тесты разрабатывают, опираясь на запросы и поисковую выдачу пользователей интернета.

Что, по вашему мнению, стало решающим фактором, который позволил вам одержать победу в конкурсах AI, требующих таких высоких уровней технической экспертизы?

- Алгоритм ConZNet, разработанный в лаборатории по восприятию естественного языка Samsung Research, совершенствует себя посредством применения в новой пользовательской среде. Алгоритм также учитывает особенности естественного языка, такие как поисковые запросы и ответы интернет-пользователей. Мы смогли одержать победу в этих конкурсах, так как MS MARCO и TriviaQA основаны на возможностях AI в реальной пользовательской среде. Честно говоря, в тестах, где требовалось дать простой ответ на вопрос, проанализировав абзац текста, наш алгоритм немного отставал от других участников. Но благодаря тому, что такие технологии не слишком актуальны для использования AI в реальных ситуациях, при исследовании AI мы концентрируемся на таких тестах как MS MARCO.

Используете ли вы алгоритмы-победители для общения с клиентами в обычной жизни?

- Недавно прошло мероприятие «Открытая лаборатория», в рамках которого лаборатории Samsung Research представили другим департаментам Samsung Electronics. На мероприятии у нас была возможность обсудить AI-алгоритмы с нашими коллегами из подразделений бытовой техники и смартфонов. Филиалы по работе с клиентами также проявили большой интерес к нашей работе, так как сейчас основанные на AI сервисы по обслуживанию, в том числе чат-боты, начинают использоваться всё активнее. Мы надеемся, что технологии, которые разрабатываются в Samsung Research, будут естественным образом адаптированы для продуктов и сервисов Samsung Electronics.

Какой ваш план по развитию технологий AI по восприятию естественного языка в будущем?

- Название ConZNet образовано от фразы «Контекстная приближённая сеть». Такое имя предполагает, что понимание того, что говорят люди – критически важная задача. Нам нужно развивать технологии искусственного интеллекта, чтобы помочь им в понимании и анализе коротких предложений. AI-алгоритмы также должны быть способны анализировать выпуски новостей в реальном времени, а не уже существующие данные, чтобы предоставлять ответы на запросы пользователей. Мы также разрабатываем технологии, в которых алгоритм может сказать «На ваш вопрос нет доступных подходящих ответов» или искать нужные ответы. Так называемая «задача отказа» – технически сложная технология AI.

Пожалуйста, расскажите нам о вашей главной цели в развитии AI-технологий.

- Преимущества Samsung в сравнении с другими IT-компаниями – в том, что мы можем построить систему знаний о взаимодействии машин и приложений, а также в нашей широкой и разнообразной линейке продуктов, которая позволит пользователям построить экосистему Интернета вещей (IoT) из персональных устройств. Эти преимущества помогут нам в достижении нашей цели – создания ориентированной на пользователя AI-системы вместе с партнёрами по индустрии. Центры искусственного интеллекта Samsung Electronics были открыты в Сеуле (ноябрь 2017), в Кремниевой долине (январь 2018), в Кембридже, Торонто и Москве (май 2018). Мы будем активно сотрудничать с экспертами в разных областях искусственного интеллекта, работающих в новых центрах.

Фото: Д-р Ким и разработчики лаборатории по восприятию естественного языка Samsung Research обсуждают идеи на совещании

“With Samsung’s Unique Strengths, We Are Developing a User-Oriented AI Algorithm”

An interview with Jihie Kim, Head of Language Understanding Lab, Samsung Research

The question of how AI technologies understand human dialog and queries to suggest an optimum answer is one of the hot topics in the AI industry. Jihie Kim, Head of the Language Understanding Lab at Samsung Research AI Center, is also striving to develop the technology behind an AI algorithm that can talk with people naturally and propose solutions to a problem.
The Language Understanding Lab led by Dr. Kim recently grabbed global attention after placing top ranks at global machine reading comprehension competitions held by Microsoft and the University of Washington, respectively. Samsung Newsroom visited the Samsung Research AI center in Seocho-gu, Korea to interview Dr. Kim about AI performance in the machine reading comprehension competitions and a future evolution plan for AI algorithms.

Q. Please tell us about the MS MARCO and TriviaQA competitions held by Microsoft and the University of Washington, respectively, where your team ranked first place.

Kim: There have been many global machine reading competitions recently where AI presents solutions to a problem. MS MARCO and TriviaQA are among the top five global competitions in machine reading comprehension. AI algorithms are tested on whether they can understand and analyze questions to offer answers. Those tests are designed by referring to internet users’ queries and search results.

Q. What do you think was the critical factor in excelling at the AI competitions which require such high levels of technical expertise?

Kim: The ConZNet algorithm developed by the Language Understanding Lab at Samsung Reseach is upgrading its intelligence by considering real user environments. The algorithm takes natural language into account such as how people deliver queries and answers online. We were able to win those competitions because the MS MARCO and TriviaQA competitions are about AI capabilities in real user environments. In truth, our algorithm was a bit behind other competitors in tests requiring a simple answer to a question after analyzing a short paragraph. But because such technologies have low relevance to real environments using AI technologies, we are focusing on the other tests such as MS MARCO in proceeding with continuous R&D.
  
Q. Do you apply the winning algorithms to customer services in real life?

Kim: An Open Lab event was held recently to introduce the labs at Samsung Research to other departments in Samsung Electronics. At the event, we had in-depth discussions with engineers in our home appliances and smartphone departments about AI algorithms. Departments dealing with customer services also showed high interest in what we do because AI-based customer services including chatbots are emerging as a hot topic. We hope that our technologies developed at Samsung Research will be naturally adopted to Samsung Electronics products and services.

Q. What is your future evolution plan for advancing AI technologies in language understanding?

Kim: ConZNet is an acronym for “Context Zoom-in Network.” The name implies that understanding the context of what people say is critical. We need to advance AI technologies to help them understand and analyze short sentences. AI algorithms also need to have capabilities to analyze real-time news reports rather than existing data to give answers to customer queries. We are also developing technologies where an AI algorithm can answer, “there are no proper answers to your query,” as well as search for right answers. The so-called “rejection problem” is an AI technology with a high level of technical difficulties.

Q. Please tell us your ultimate goal in developing AI technologies.

Kim: The strengths of Samsung in the AI industry are that we can build a knowledge system about connections between machines and applications, and customer demands in the internet of things (IoT) environment comprised of personal devices, based on Samsung Electronics’ diverse product lineup. This will help us to achieve the goal of realizing a user-oriented AI system by collaborating with global partners in the industry. Samsung Electronics recently began to launch global AI Centers and we will lead the effort of working with AI experts at the new centers abroad.

Photos: Dr. Kim and the developers of the Language Understanding Lab at Samsung Research are participating in an ideation meeting.