Чувства плюс интеллект

Как компьютер помогает людям видеть и слышать

Число умных персональных устройств в мире достигнет в 2025 году 40 млрд, а пользоваться виртуальной и дополненной реальностью будут больше 440 млн человек, предсказывают эксперты Huawei в докладе Unfolding the Industry Blueprint of an Intelligent World.

С одной стороны, появятся миллиарды устройств, помогающих людям «чувствовать» окружающую среду, а с другой стороны, возникнут новые модели использования чувств, уже не привязанные к реальному миру.

Мир в 2025 году

40 млрд

умных персональных устройств

440 млн

пользователей виртуальной и дополненной реальности

Источник: Huawei

Слух и речь

Человеческий интеллект — это комбинация органов чувств, опыта и знаний. Применив эту аналогию к машине, мы увидим, что искусственный интеллект — это не просто мощный процессор, а совокупность решений и технологий. По сути, это органы чувств, позволяющие компьютерам решать задачи пользователей.

«Чувства» роботов проявляются в способности взаимодействовать с человеком, слышать и разговаривать, писать и понимать тексты. Наиболее яркие примеры такого взаимодействия — чат-боты и голосовые ассистенты.

По прогнозу экспертов Gartner, к 2020 году 20% жителей развитых стран будут использовать возможности голосовых ассистентов для решения повседневных задач. Все это — благодаря смартфонам. Все флагманские модели стараются интегрировать те или иные аспекты искусственного интеллекта. Самые последние модели — такие как смартфоны Huawei серии Mate 20 — стараются соединить ИИ со всеми доступными компьютеру органами чувств, чтобы в кармане у владельца был полноценный интеллектуальный помощник

20 %

жителей развитых стран будут использовать голосовые ассистенты для повседневных задач в 2020 году.

Источник: Huawei

И главное в помощнике — чтобы он понимал вас и мог отвечать. В последние годы благодаря развитию машинного обучения точность распознавания речи приложениями с искусственным интеллектом значительно выросла. Современные системы распознавания голоса допускают не больше 5% ошибок — это лучше, чем понимание речи человеком. То есть смартфон понимает вас уже лучше, чем друзья и родственники.

менее 5 %

ошибок допускают системы распознавания голоса. Это меньше, чем ошибаются люди

Источник: Microsoft

Понимание машинами естественных языков достигло такого уровня, что стал возможным голосовой перевод в реальном времени — визионерская идея Дугласа Адамса, описанная им в «Автостопом по Галактике», наконец-то воплотилась в реальности.

Возможности «органов слуха» искусственного интеллекта не ограничиваются распознаванием человеческой речи. Одна из неожиданных сфер применения — борьба с храпом. Смартфон чувствует, когда его владелец начинает храпеть, запускает после этого специальное приложение, которое заставит пользователя изменить положение во сне.

Сегодня функции голосовых ассистентов и чат-ботов ограничены, пожалуй, только фантазией разработчиков. Российская компания Endurance разрабатывает чат-бота для пожилых людей и пациентов, страдающих болезнью Альцгеймера. Основная функция чат-бота — общаться с людьми на разные темы: от погоды до хобби, от текущих новостей до музыкальных предпочтений. Умный ассистент должен научиться не просто понимать собеседника, но и улавливать его настроение, чтобы выстраивать натуралистичный диалог. Идея в том, чтобы помочь одиноким людям поддерживать в тонусе когнитивные способности мозга и компенсировать недостаток общения с родственниками и друзьями. Обычно из таких узких задач рождаются большие решения — и, если развить эту технологию, умные помощники смогут обрести что-то вроде эмпатии, быть не просто бездушными роботами, но и компаньонами. Умный помощник Google Assistant подсказывает своему владельцу, что надеть, чтобы не замерзнуть на улице: по сути, люди делегируют искусственному интеллекту свою способность ощущать холод и тепло.

Умение искусственного интеллекта «чувствовать» изменения температуры или давления с помощью данных сенсоров позволило совершить революцию в технологии прогнозов погоды. К примеру, IBM использует сеть датчиков и свою платформу искусственного интеллекта Watson, чтобы предлагать клиентам гиперлокальные прогнозы с детализацией до нескольких сотен метров. Такой прогноз позволяет узнать, когда пойдет дождь в вашем квартале. Похожий сервис для некоторых крупных городов в России предлагает и Яндекс.

К 2025 году компании и правительства мира будут тратить $553,4 млн на технологии искусственного интеллекта в метеорологии и прогнозировании погоды, предсказывает исследовательская компания Tractica. При этом в 2018 году инвестиции в «метеорологический AI» составят всего $31,7 млн. Деньги пойдут на разработку программного обеспечения, создание сервисов и внедрение объектов «интернета вещей», отвечающих за мониторинг окружающей среды и сбор данных для построения точных прогнозов.

$ 553.4 млн

мировые расходы на искусственный интеллект в прогнозах погоды в 2025 году.

Источник: Tractica

Зрение

Еще одно чувство машин — способность наблюдать за окружающей средой, собирая и обрабатывая огромные массивы данных. Именно так работают камеры в московском метро, которые распознают лица пассажиров и сравнивают их с фотографиями из базы правонарушителей. «Видят» дорогу и автомобили, причем не футуристичные штучные модели типа беспилотников «Яндекса» или Google, которые колесят на ограниченной территории. Системы активной безопасности уже стали стандартом в мире автопрома. Эти системы следят за дорогой и предотвращают аварии. Многие машины, которые мы встречаем на дорогах, могут «видеть». Им просто пока не дают рулить. Но самое впечатляющее в компьютерном зрении — это то, что оно более совершенное, чем обычное человеческое. Ведь компьютеру или даже маленькому смартфону необязательно ограничивать себя оптическим диапазоном, доступным человеку.

Более того, зрение и осязание у компьютеров складываются в нечто единое — они могут «пощупать» на расстоянии, определив форму объекта и его фактуру. Эти технологии доступны сейчас каждому. Смартфоны Huawei серии Mate 20 узнают лицо хозяина в трехмерном пространстве: за это отвечает система 3D-распознавания лица, разблокирующая устройство за доли секунды.

Прорыв в области компьютерного зрения, которое заметно превосходит человеческое, совершили недавно исследователи MIT. Их проект RF-Pose использует искусственный интеллект, чтобы обучить беспроводные устройства «чувствовать» движения людей, находящихся за стеной. Ученые используют нейронную сеть, чтобы анализировать отражающиеся от человеческих тел радиосигналы и создавать на их основе динамические аватары, которые двигаются на экране так же, как их реальный прообраз.

600

переменных с данными о здоровье пациентов использует искусственный интеллект

переменных с данными о здоровье пациентов использует эксперты-люди

Источник: Healthcare IT News

Человек всегда видел в компьютере помощника. А сейчас он постепенно становится и товарищем. Он умнеет, учится общению, лучше понимает нас. Смартфон уже стал идеальным помощником для миллиардов жителей Земли. Сейчас смартфоны обретают чувства и готовятся стать товарищами. И Huawei Mate 20 — это прообраз того, какими будут устройства будущего. Они не только узнают, но и хорошо знают владельца, смотрят на все более пристальным и точным взглядом, чем у человека, позволяют общаться со всем миром и заниматься творчеством, помогают сберечь здоровье и контролировать свое состояние. Они даже могут поговорить с владельцем. Когда к интеллекту электронных устройств добавляются чувства, это рождает совершенно другой опыт.

Но настоящая магия начинается, если заставить компьютеры смотреть не сквозь стены, а сквозь человека. Ученые из Университета Орегона представили систему, способную использовать компьютерное зрение для распознавания на снимках МРТ активности участков головного мозга, отвечающих за воспоминания. Исследователи обучили искусственный интеллект восстанавливать изображения лиц по воспоминаниям участников эксперимента — в будущем это поможет бороться с амнезией и другими расстройствами памяти. И снова узкая медицинская тема имеет шансы устроить прорыв в интеграции человека и компьютера, потому что речь идет фактически о чтении мыслей. Не простых ясных импульсов вроде «вправо», «влево», «да» или «нет», а сложных визуальных образов, возникающих в мозгу.