Технология Глубинного обучения или Deep Learning сейчас стала одним из наиболее востребованных IT-трендов. На глубинном обучении основано огромное количество инноваций. Уже сейчас технология Deep Learning применяется в различных сферах жизни и бизнеса: маркетинге, продажах, клиентских сервисах и даже государственных делах. В статье подробнее разберемся какие существуют сферы применения Deep Learning технологии.
IT-рынок все больше движется в сторону так называемых SaaS решений (программное обеспечение как услуга). Сервисы основанные на технологиях искусственного интеллекта показывают стремительный рост. Согласно статистике, в 2017 году рынок Глубинного Обучения только в США достиг 80 миллионов долларов, прогнозируется, что в последующие годы эта цифра будет расти. Для решения каких задач подойдет технология Deep Learning? Давайте разбираться.
5 впечатляющих вариантов применения Deep Learning
1. Стираем языковой барьер
Приложение для мгновенного перевода Google Translate app теперь применяет технологию Deep Learning для визуального перевода. Как это работает? Приложение использует глубинные нейронные сети для распознавания текста при сканировании картинки. Если совсем просто — технология Deep Learning позволяет определить, есть ли на картинке буквы, затем, когда буквы определены и слова распознаны, приложение переводит надпись с картинки на ваш родной язык:
Подобная инновация значительно облегчит жизнь туристам — например, в кафе можно не ломать голову над названиями блюд в меню. Достаточно просто отсканировать страницу и получить необходимую информацию в режиме реального времени. Специалисты Гугл говорят, что приложение действительно быстро работает и не перегружает оперативную память смартфона.
2. Супер поиск
Технология Deep Learning позволяет двигаться от распознавания надписей на картинках еще дальше — до анализа видео. Oxford Visual Geometry group запустил сервис для поиска релевантных новостей BBC, основанный на нейронных сетях. Программа позволяет подобрать интересующие вас видеосюжеты по ключевому слову, которое появлялось в видео, даже много лет назад.
Пример поиска сюжета по слову «Hollywood»
3. Неограниченные возможности для работы с изображениями
Системы, основанные на Deep Learning предоставляют массу возможностей по обработке изображений, с их помощью уже возможно: добавлять эффекты (например, сделать из обычного фото картину в стиле известного художника), увеличивать четкость изображения и т.д.
Система на основе Deep Learning под названием Let there be color!, например помогает придать цвет черно-белым фото и даже видео. Сверхточные нейронные сети вычисляют все нюансы изображения и разделяют его на слои, чтобы определить глубину цвета и переходы. По мере обработки фотографий система обучается и сейчас уже может обрабатывать старинные фото и даже видео-материалы:
4. На шаг ближе к общению с машинами
В 2016 году Гугл выпустил WaveNet — систему, основанную на глубоких нейронных сетях, которая может преобразовать текст в аудио формат. В отличие от голосовых помощников, как например Siri, WaveNet позволяет создать гораздо более реалистичное звучание голоса путем выборки реальной человеческой речи и непосредственно моделированием сигналов.
Обучение WaveNet позволило системе создавать человеческий голос и даже музыку, приятные для слуха и максимально приближенные к настоящей человеческой речи. Подробный процесс обучения системы можно найти здесь.
5. Распознавание речи
При помощи Deep Learning машины могут не только говорить, но и понимать, что вы говорите. Яркий тому пример система LipNet, разработанная с применением технологии нейронных сетей учеными Оксфордского университета. LipNet стала первой в мире системой, которая может распознать по губам речь, причем не просто отдельные слова, а сразу на целые предложения. Для этого система обрабатывает видеоряд, разделяя его на множество фрагментов и слоев. Результаты впечатляют:
Технологии распознавания речи, основанные на Deep Learning дают качественный толчок развитию медицинских технологий (например, созданию принципиально новых слуховых аппаратов), а также систем защиты — считывание речи по губам, при просмотре видео с камер видеонаблюдения.
Это всего лишь краткий перечень возможностей, которые открывает технология Deep Learning. Эта инновация лежит в основе беспилотных автомобилей, робототехники и систем аналитики.
Хотите создать проект с использованием новейших технологий? У нашей компании более чем 8 лет опыта в разработке проектов для крупного и среднего бизнеса. Напишите нам на info@stfalcon.com, чтобы обсудить детали сотрудничества. Мы с радостью создадим инновационное решение специально для вас!