Показаны сообщения с ярлыком MS MARCO. Показать все сообщения
Показаны сообщения с ярлыком MS MARCO. Показать все сообщения

среда, 28 ноября 2018 г.

Samsung получает престижные награды за работы в области развития искусственного интеллекта




Корпорация Samsung Electronics в официальном пресс-релизе сообщила о получении целого ряда престижных мировых наград в области развития систем искусственного интеллекта и нейросетей. 

Технологии искусственного интеллекта, разработанные Samsung Electronics, получили высокую оценку от глобального экспертного сообщества. За последние месяцы научно-исследовательский центр Samsung Research, подразделение направления потребительских продуктов Samsung Electronics, одержал победу сразу в нескольких авторитетных конкурсах.
В октябре Samsung Research в Польше (SRPOL) в сотрудничестве с Эдинбургским университетом (Великобритания) занял 1-е место на Международном конкурсе-семинаре по устному переводу (International Workshop on Spoken Language Translation, IWSLT), одном из известнейших и старейших соревнований по автоматическому языковому переводу. IWSLT стоит в одном ряду с Конкурсом-семинаром по машинному переводу (Workshop on Machine Translation, WMT) и считается одним из самых престижных соревнований в этой сфере. Научно-исследовательский институт Samsung Electronics в Польше побеждает в IWSLT уже 2-й раз подряд.
Ежегодно в июне IWSLT публикует наборы данных для обучения нейронных сетей и позволяет участникам соревнования «протестировать» эти данные через собственные нейросети. Результаты автоматически оцениваются по ряду метрик. В этом году конкурс IWSLT включал в себя два задания: машинный перевод с минимальным использованием ресурсов (Low Resource Machine Translation) и перевод устной речи (Speech Translation). Для того, чтобы выполнить первое задание, учёным из команды SPOR пришлось создать новые технологии, способные эффективно работать в условиях нехватки ресурсов (дефицит данных, ограничения по времени и стоимости) – распространённой проблемы при использовании искусственного интеллекта для перевода многоязычных текстов.
Задача Samsung заключалась в том, чтобы с помощью искусственного интеллекта осуществить перевод текста с баскского языка на английский. Сначала исследователям SPROL был предложен ограниченный объём данных – сопоставительный словарь из около миллиона баскско-английских пар эквивалентов, взятых из субтитров к фильмам. Он применялся для обучения нейронной сети и создания алгоритмической модели. Затем команда использовала эти данные для перевода выступлений TED Talks с баскского на английский язык. Несмотря на сложность предложенного направления перевода и ограниченность исходных данных, при сравнении с эталонным переводом алгоритм SRPOL получил высочайший балл Bilingual Evaluation Understudy (BLEU) – 26.21, что указывает на высокий уровень соответствия машинного перевода эталону и небольшое число ошибок.
В Украине разработки Samsung в области искусственного интеллекта успешно применяются в автомобильной отрасли. В августе Научно-исследовательский институт Samsung в Украине (SRK) представил своё решение по обнаружению пешеходов для тестирования в рамках совместного проекта Технологического института в Карлсруе и Технологического института Toyota в Чикаго (Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago (KITTI) Vision Benchmark Suite). Проект компаний входит в тройку самых авторитетных экспертных организаций, которые осуществляют тестирование технологий для беспилотного вождения, наряду с такими исследовательскими учреждениями, как Caltech Pedestrian и CityScapes.
В рамках KITTI оцениваются решения по 9-ти различным направлениям – стерео (Stereo), объекты (Objects), отслеживание (Tracking), дорога (Road) и другим. Команда SRK предложила технологию машинного зрения SiRtaKi в категории «Отслеживание пешеходов» (Pedestrian Tracking). Разработка SRK была названа лучшей в направлении, и до сих пор удерживает 1-ю позицию в таблице лидеров.
Чтобы заявленная работа могла принять участие в конкурсе в категории «Отслеживание пешеходов», предложенный алгоритм искусственного интеллекта должен не только уметь обнаруживать объекты, но и отслеживать их движение (технологии предыдущего поколения умели только обнаруживать объекты). Команда SRK загрузила примерно 3.400 необработанных изображений движущихся пешеходов с сайта KITTI и запустила алгоритм SiRtaKi, построенный на базе подхода отслеживания путем обнаружения (tracking-by-detection). Затем учёные многократно получали и анализировали расположение и направление перемещения каждого пешехода, обучая таким образом SiRtaKi. В результате алгоритм получил максимальный балл среди всех участников конкурса за самый высокий уровень точности отслеживания объектов.
Подобные технологии искусственного интеллекта будут способствовать созданию новых возможностей в автомобильной отрасли – например, они могут применяться в автономных датчиках для обнаружения пешеходов и отслеживания движущихся объектов, чтобы повысить уровень безопасности на дорогах. Кроме того, новый алгоритм будет использоваться и в повседневной жизни людей, например, в бытовой технике.
В июле команда Samsung Research заняла первые места в двух престижных соревнованиях по машинному чтению: в конкурсе MAchine Reading COmprehension (MS MARCO) Competition, организованном Microsoft, и в конкурсе TriviaQA, который проводится Вашингтонским университетом. На сегодняшний день Samsung по-прежнему занимает 1-е место в категории Web в TriviaQA. В марте научно-исследовательский институт Samsung в Пекине (SRC-B) получил высокую оценку применения искусственного интеллекта для машинного зрения (для распознавания символов и изображений) и выиграл глобальный конкурс технологий в области оптического распознавания символов в рамках Международной конференции по анализу и распознаванию документов (International Conference on Document Analysis and Recognition, ICDAR).
«В научно-исследовательских центрах Samsung по всему миру разрабатывается огромное количество инновационных решений. Многократные победы в престижных мировых конкурсах и соревнованиях в области искусственного интеллекта свидетельствуют о ведущих позициях Samsung в сфере искусственного интеллекта и смежных технологий, – прокомментировал Сын Хван Чо (Seunghwan Cho), вице-президент Samsung Research. – Мы продолжим вносить свой вклад в создание комфортной для пользователей среды, внедряя революционные технологии искусственного интеллекта в наши продукты и сервисы».

Samsung Electronics Sweeps Coveted Global AI Awards

Samsung Electronics’ artificial intelligence (AI) capabilities are being recognized globally in a competitive field with top researchers all seeking to dominate. Samsung Research, the advanced R&D arm of Samsung Electronics’ device business, has won recent competitions, which will be vital in ultimately rolling out AI in more real-world situations than ever.
In October, Samsung Research’s R&D Institute Poland (SRPOL), in partnership with University of Edinburgh of the U.K., won first place at the International Workshop on Spoken Language Translation (IWSLT), one of the world’s most renowned and longest-running automatic language translation workshops. IWSLT sits alongside the Workshop on Machine Translation (WMT) as the most prestigious competitions in the space. The IWSLT win is the second consecutive time that the Poland research center has topped the workshop.
Every June, IWSLT provides permissible training data sets and allows test run submissions from participants, evaluating the submitted runs with automatic metrics. This year, IWSLT featured two tasks: Low Resource Machine Translation and Speech Translation. SRPOL participated in the first sector, aiming to discover new technologies that can help overcome low-resource situations with scarcity in not only data but also in time and cost that are often required to use AI for multilingual translation.
Samsung’s task was using AI technology to translate text from Basque to English. The SRPOL team was first provided with limited amount of data – about a million Basque-to-English parallel data sets in the form of movie subtitles – to train and develop the algorithm model. Then, the team used this data to translate TED Talks given in Basque into English. Despite the difficulty of proposed translation direction and scarce data, when compared with the reference translations, SRPOL received the highest Bilingual Evaluation Understudy score (BLEU) of 26.21 – showing a high level of correspondence of the machine translation to the reference – and a significantly low error rate.
On the bordering country of Ukraine, Samsung’s AI expertise is being applied successfully within the automotive field. Samsung R&D Institute Ukraine (SRK) submitted a solution that it developed to detect pedestrians for the Karlsruhe Institute of Technology and Toyota Technological Institute at Chicago (KITTI) Vision Benchmark Suite, one of the top three benchmarking organizations for automotive driving technology, in August. KITTI sits alongside Caltech Pedestrian and CityScapes as the leading benchmarking institutions.
Among the nine KITTI categories including Stereo, Objects, Tracking, Road and more – SRK submitted its computer vision technology SiRtaKi in the ‘Pedestrian Tracking’ category. Since the submission, the solution has been recognized as the best in the field, retaining its top position on the leaderboard.
To enter the competition in the ‘Pedestrian Tracking’ category, AI algorithms are tested on their capabilities to not only detect objects but trace their movements – an upgrade from the previous technologies where only detection was possible. Likewise, SRK downloaded roughly 3,400 raw images of pedestrian movements from KITTI to run SiRtaKi which employs a tracking-by-detection approach. The team, using SiRtaKi, obtained and analyzed each passerby’s coordination and traveling direction countless times. As a result, SRK’s rigorous work paid off as they received the best score among competitors for a high level of accuracy in the object tracking.
Needless to say, such AI technology is expected to help create new possibilities in the automotive industry – that it can be implemented in autonomous sensors to detect nearby pedestrians and objects’ movements and reduce danger on the roads. Adding on, the new algorithm will also be applied in our daily lives like home appliances and also in the to-be-developed next-generation technologies.
It doesn’t end here. Last July, Samsung Research placed first in two of the world’s prestigious AI reading competitions, the MAchine Reading COmprehension (MS MARCO) Competition held by Microsoft and TriviaQA hosted by the University of Washington. To date, Samsung is still ranked first in the Web category of TriviaQA. And in March, Samsung R&D Institute China-Beijing (SRC-B) made mark in AI development in computer vision (technologies in analysis of characters and images), winning the International Conference on Document Analysis and Recognition (ICDAR), a global competition in Optical Character Recognition technologies.
“So much innovation took place by Samsung Electronics from all over the world. With multiple achievements in the world’s prestigious AI-related competitions, Samsung is leading the development of artificial intelligence and the related technologies on a global level,” said Seunghwan Cho, Vice President of Samsung Research. “We will continue to contribute to realizing a highly user-centric environment by applying the groundbreaking AI technology to our current products and services.”

среда, 11 июля 2018 г.

Интервью с Джи Хи Ким, главой лаборатории по восприятию естественного языка Samsung Research



«Уникальные возможности Samsung позволяют нам разработать ориентированный на пользователя алгоритм Искусственного интеллекта»

Научить искусственный интеллект (Artifical Intelligence или сокращённо AI) понимать человеческие диалоги и запросы, чтобы  давать оптимальные ответы пользователям, – одна из самых актуальных задач современной IT-индустрии. Джи Хи Ким, глава лаборатории по восприятию естественного языка в Центре искусственного интеллекта Samsung Research, стремится разработать AI-алгоритм, который сможет говорить с людьми на естественном языке и предлагать решение поставленных задач.
Лаборатория, которую возглавляет д-р Ким, недавно оказалась в центре внимания всего мира, когда получила высшие результаты в международных конкурсах по восприятию текстов, проводимых Microsoft и Университетом Вашингтона. Мы посетили Центр Искусственного Интеллекта Samsung Research, расположенный в районе Сеочо в Сеуле, чтобы обсудить с д-р Ким достижения AI в конкурсах по машинному восприятию текста и планы по развитию алгоритмов искусственного интеллекта.

Расскажите, пожалуйста, о конкурсах MS MARCO и TriviaQA, которые проводят Microsoft и Университет Вашингтона соответственно, на которых ваша команда заняла первые места.

 - В последнее время проводится множество международных конкурсов по машинному восприятию текстов, на которых искусственному интеллекту необходимо решить те или иные задачи. MS MARCO и TriviaQA входят в пятёрку лучших в мире конкурсов по машинному восприятию текстов. Алгоритмы AI проверяются на основании того, смогут ли они понять и проанализировать вопросы и предложить подходящие ответы на них. Эти тесты разрабатывают, опираясь на запросы и поисковую выдачу пользователей интернета.

Что, по вашему мнению, стало решающим фактором, который позволил вам одержать победу в конкурсах AI, требующих таких высоких уровней технической экспертизы?

- Алгоритм ConZNet, разработанный в лаборатории по восприятию естественного языка Samsung Research, совершенствует себя посредством применения в новой пользовательской среде. Алгоритм также учитывает особенности естественного языка, такие как поисковые запросы и ответы интернет-пользователей. Мы смогли одержать победу в этих конкурсах, так как MS MARCO и TriviaQA основаны на возможностях AI в реальной пользовательской среде. Честно говоря, в тестах, где требовалось дать простой ответ на вопрос, проанализировав абзац текста, наш алгоритм немного отставал от других участников. Но благодаря тому, что такие технологии не слишком актуальны для использования AI в реальных ситуациях, при исследовании AI мы концентрируемся на таких тестах как MS MARCO.

Используете ли вы алгоритмы-победители для общения с клиентами в обычной жизни?

- Недавно прошло мероприятие «Открытая лаборатория», в рамках которого лаборатории Samsung Research представили другим департаментам Samsung Electronics. На мероприятии у нас была возможность обсудить AI-алгоритмы с нашими коллегами из подразделений бытовой техники и смартфонов. Филиалы по работе с клиентами также проявили большой интерес к нашей работе, так как сейчас основанные на AI сервисы по обслуживанию, в том числе чат-боты, начинают использоваться всё активнее. Мы надеемся, что технологии, которые разрабатываются в Samsung Research, будут естественным образом адаптированы для продуктов и сервисов Samsung Electronics.

Какой ваш план по развитию технологий AI по восприятию естественного языка в будущем?

- Название ConZNet образовано от фразы «Контекстная приближённая сеть». Такое имя предполагает, что понимание того, что говорят люди – критически важная задача. Нам нужно развивать технологии искусственного интеллекта, чтобы помочь им в понимании и анализе коротких предложений. AI-алгоритмы также должны быть способны анализировать выпуски новостей в реальном времени, а не уже существующие данные, чтобы предоставлять ответы на запросы пользователей. Мы также разрабатываем технологии, в которых алгоритм может сказать «На ваш вопрос нет доступных подходящих ответов» или искать нужные ответы. Так называемая «задача отказа» – технически сложная технология AI.

Пожалуйста, расскажите нам о вашей главной цели в развитии AI-технологий.

- Преимущества Samsung в сравнении с другими IT-компаниями – в том, что мы можем построить систему знаний о взаимодействии машин и приложений, а также в нашей широкой и разнообразной линейке продуктов, которая позволит пользователям построить экосистему Интернета вещей (IoT) из персональных устройств. Эти преимущества помогут нам в достижении нашей цели – создания ориентированной на пользователя AI-системы вместе с партнёрами по индустрии. Центры искусственного интеллекта Samsung Electronics были открыты в Сеуле (ноябрь 2017), в Кремниевой долине (январь 2018), в Кембридже, Торонто и Москве (май 2018). Мы будем активно сотрудничать с экспертами в разных областях искусственного интеллекта, работающих в новых центрах.

Фото: Д-р Ким и разработчики лаборатории по восприятию естественного языка Samsung Research обсуждают идеи на совещании

“With Samsung’s Unique Strengths, We Are Developing a User-Oriented AI Algorithm”

An interview with Jihie Kim, Head of Language Understanding Lab, Samsung Research

The question of how AI technologies understand human dialog and queries to suggest an optimum answer is one of the hot topics in the AI industry. Jihie Kim, Head of the Language Understanding Lab at Samsung Research AI Center, is also striving to develop the technology behind an AI algorithm that can talk with people naturally and propose solutions to a problem.
The Language Understanding Lab led by Dr. Kim recently grabbed global attention after placing top ranks at global machine reading comprehension competitions held by Microsoft and the University of Washington, respectively. Samsung Newsroom visited the Samsung Research AI center in Seocho-gu, Korea to interview Dr. Kim about AI performance in the machine reading comprehension competitions and a future evolution plan for AI algorithms.

Q. Please tell us about the MS MARCO and TriviaQA competitions held by Microsoft and the University of Washington, respectively, where your team ranked first place.

Kim: There have been many global machine reading competitions recently where AI presents solutions to a problem. MS MARCO and TriviaQA are among the top five global competitions in machine reading comprehension. AI algorithms are tested on whether they can understand and analyze questions to offer answers. Those tests are designed by referring to internet users’ queries and search results.

Q. What do you think was the critical factor in excelling at the AI competitions which require such high levels of technical expertise?

Kim: The ConZNet algorithm developed by the Language Understanding Lab at Samsung Reseach is upgrading its intelligence by considering real user environments. The algorithm takes natural language into account such as how people deliver queries and answers online. We were able to win those competitions because the MS MARCO and TriviaQA competitions are about AI capabilities in real user environments. In truth, our algorithm was a bit behind other competitors in tests requiring a simple answer to a question after analyzing a short paragraph. But because such technologies have low relevance to real environments using AI technologies, we are focusing on the other tests such as MS MARCO in proceeding with continuous R&D.
  
Q. Do you apply the winning algorithms to customer services in real life?

Kim: An Open Lab event was held recently to introduce the labs at Samsung Research to other departments in Samsung Electronics. At the event, we had in-depth discussions with engineers in our home appliances and smartphone departments about AI algorithms. Departments dealing with customer services also showed high interest in what we do because AI-based customer services including chatbots are emerging as a hot topic. We hope that our technologies developed at Samsung Research will be naturally adopted to Samsung Electronics products and services.

Q. What is your future evolution plan for advancing AI technologies in language understanding?

Kim: ConZNet is an acronym for “Context Zoom-in Network.” The name implies that understanding the context of what people say is critical. We need to advance AI technologies to help them understand and analyze short sentences. AI algorithms also need to have capabilities to analyze real-time news reports rather than existing data to give answers to customer queries. We are also developing technologies where an AI algorithm can answer, “there are no proper answers to your query,” as well as search for right answers. The so-called “rejection problem” is an AI technology with a high level of technical difficulties.

Q. Please tell us your ultimate goal in developing AI technologies.

Kim: The strengths of Samsung in the AI industry are that we can build a knowledge system about connections between machines and applications, and customer demands in the internet of things (IoT) environment comprised of personal devices, based on Samsung Electronics’ diverse product lineup. This will help us to achieve the goal of realizing a user-oriented AI system by collaborating with global partners in the industry. Samsung Electronics recently began to launch global AI Centers and we will lead the effort of working with AI experts at the new centers abroad.

Photos: Dr. Kim and the developers of the Language Understanding Lab at Samsung Research are participating in an ideation meeting.

вторник, 10 июля 2018 г.

Искусственный интеллект от Samsung одержал победу в двух престижных международных конкурсах


Samsung Research, научно-исследовательское подразделение направления потребительских продуктов Samsung Electronics, заняло первые места в двух крупнейших международных конкурсах по качеству восприятия текста искусственным интеллектом (AI).
Samsung Research одержал победу в конкурсе Machine Reading Comprehension (MS MARCO), проводимом компанией Microsoft, а также показал лучший результат на конкурсе TriviaQA, который был организован Университетом Вашингтона[1].
По мере того, как мировая конкуренция в сфере технологий искусственного интеллекта  обостряется, такие конкурсы как MS Marco стремительно набирают популярность. MS MARCO и TriviaQA – одни из самых известных и уважаемых конкурсов AI (Artifical Intelligence), наряду с SQuAD Стэнфордского университета и NarrativeQA компании DeepMind. В них принимают участие лучшие мировые университеты и глобальные компании, специализирующиеся на AI, в том числе и Samsung Electronics.
Машинное понимание текста означает, что алгоритм искусственного интеллекта получает задание проанализировать текстовые данные и самостоятельно выбирает оптимальный ответ из предложенных вариантов. На конкурсах MS MARCO и TriviaQA тестируется способность AI-алгоритмов обрабатывать естественную письменную речь в различных типах документов, например, в новостных заметках или постах и блогах.
Например, в ходе конкурса MS MARCO AI-алгоритму предоставляется 10 вэб-документов поисковой выдачи, из которых необходимо выбрать оптимальный вариант. Фразы случайным образом выбираются из миллиона запросов пользователей поисковой системы Microsoft Bing. Ответы алгоритма оцениваются на основании того, насколько близки они к ответам человека. Этот тест был разработан для оценки способности AI-алгоритмов решать практические задачи.
Samsung Research на соревновании представлял AI-алгоритм ConZNet, разработанный Центром искусственного интеллекта южнокорейского техногиганта. Навыки решения задач алгоритм приобрёл, используя технику «Reinforcement Learning»[2] – в ней AI развивается, получая обратную связь в ответ на каждое его действие.
В последнее время в связи с усилением глобальной конкуренции по разработке AI-технологий стали широко распространены соревнования в области компьютерного зрения (технологии для анализа символов и изображений), а также визуальных вопросов и ответов. Это способствует совершенствованию алгоритма распознавания текста машинами.
Пекинское подразделение Samsung Research одержало победу на Международной конференции по анализу и распознаванию документов (ICDAR), проведённой Международной ассоциацией распознавания образов (IAPR) в марте 2018 года. Этот успех сделал Samsung игроком высочайшего уровня на глобальных тестах компьютерного зрения. ICDAR – самый влиятельный конкурент корпорации в области оптических технологий распознавания символов (OCR).
«Мы разрабатываем AI-алгоритм, который предоставит ответы на запросы пользователей простым и удобным способом и который можно применять в реальной жизни, – отметила Джи Хи Ким, глава лаборатории по восприятию естественного языка в Центре искусственного интеллекта Samsung Research. – Сейчас в Samsung ведётся активное обсуждение возможностей применения AI-алгоритма ConZNet в продуктах, сервисах, обслуживании клиентов и технологическом развитии».

[1] В таких соревнованиях как MS MARCO и TriviaQA можно принимать участие в любое время, рейтинги устанавливаются в реальном времени в зависимости от результатов  прошедших тестов.
[2] «Reinforcement Learning» (обучение с подкреплением) – самый продвинутый алгоритм машинного обучения искусственного интеллекта, где возможности машины совершенствуются благодаря таким прорывным AI-технологиям как AlphaGo.

Samsung Electronics Wins at Two Top Global AI Machine Reading Comprehension Challenges

Samsung Research, the advanced R&D hub of Samsung Electronics’ SET (end-products) business, has ranked first in two of the world’s top global artificial intelligence (AI) machine reading comprehension competitions.
Samsung Research recently placed first in the MAchine Reading COmprehension (MS MARCO) Competition held by Microsoft (MS), as well as showing the best performance in TriviaQA* hosted by the University of Washington, proving the excellence of its AI algorithm.
With intense competition in developing AI technologies globally, machine reading comprehension competitions such as MS MARCO are booming around the world. MS MARCO and TriviaQA are among the actively researched and used machine reading comprehension competitions along with SQuAD of Stanford University and NarrativeQA of DeepMind. Distinguished universities around the world and global AI firms including Samsung are competing in these challenges.
Machine reading comprehension is where an AI algorithm is tasked with analyzing data and finding an optimum answer to a query on its own accord. For MS MARCO and TriviaQA, AI algorithms are tested in their capabilities of processing natural language in human Q&As and also providing written text in various types of documents such as news articles and blog posts.
For example in MS MARCO, ten web documents are presented for a certain query to let an AI algorithm create an optimum answer. Queries are randomly selected from a million queries from Bing (MS search engine) users. Answers are evaluated statistically by estimating how close they are with human answers. This is a test designed to apply an AI algorithm to solve real-world problems.
Samsung Research took part in the competitions with ConZNet, an AI algorithm developed by the company’s AI Center. ConZNet features skillful capabilities through adopting the Reinforcement Learning** technique, which advances machine intelligence by giving reasonable feedback for outcomes, similar to a stick-and-carrot strategy in a learning process.
With the recent acceleration in global competition to develop AI technologies, contests are widespread in areas of computer vision (technologies to analyze characters and images) and visual Q&A to solve problems using recognized images of characters as well as machine reading comprehension. The Beijing branch of Samsung Research won the International Conference on Document Analysis and Recognition (ICDAR) hosted by the International Association of Pattern Recognition (IAPR) in March, putting them in a top-tier group for global computer vision tests. The ICDAR is the most influential competition in Optical Character Recognition (OCR) technologies.
“We are developing an AI algorithm to provide answers to user queries in a simpler and more convenient manner, for real life purposes,” said Jihie Kim, Head of Language Understanding Lab at Samsung Research. “Active discussion is underway in Samsung to adopt the ConZNet AI algorithm for products, services, customer response and technological development.”

* Competitions such as MS MARCO and TriviaQA allow contestants to participate at any time, and rankings are altered according to real-time test results.
** The Reinforcement Learning is the most advanced Machine Learning AI algorithm, and cutting-edge AI technologies including AlphaGo are upgrading machine intelligence by applying this technique.