Viewdle начался с разработки украинских ученых VideoSecurity

Тимур Ворона

На прошлой неделе мы побывали в Международном научно-учебном центре информационных технологий и систем в гостях у руководителя отдела распознавания образов Вячеслава Мацелло и профессора Михаила Шлезингера. Именно здесь(а не в институте кибернетики, как массово растиражировали СМИ) была разработана технология распознавания лиц, которая легла в основу стартапа Viewdle и «Поиска по картинкам» от компании Google. Как известно, Viewdle на днях купила Motorola Mobility, которая в свою очередь принадлежит Гуглу. В настоящее время МНУЦ ИТиС–один из немногих украинских научных центров, где ведутся исследования мирового уровня. Основные направления деятельности института -это интеллектуальные информационные технологии. Сюда входят распознавание изображений, построение трехмерных моделей объектов и сцен, биометрическая идентификация личности. О последних разработках украинских ученых, о том, как создавался Viewdle, и почему в Украине так мало технологических стартапов, читайте в этом материале.

Вместо замка на двери в кабинет Михаила Шлезингера висит небольшое устройство с единственной кнопкой. Система под названием VideoSecurity состоит из двух частей – видеокамеры и управляющего блока, который подключается к компьютеру.

 При нажатии на кнопку программа сверяет лицо входящего с изображениями в базе данных. – «Здравствуйте, Михаил Иванович», раздается из динамиков спустя пару секунд, и дверь автоматически открывается. Идентификация происходит по нескольким основным признакам: глаза, нос, рот и брови. После чего на основе полученных данных выстраивается генеративная 3D модель человеческого лица и идет проверка прав доступа в помещение. – «Извините, я вас не знаю», отвечает «коробочка», когда я пробую зайти в кабинет.

– Это наиболее естественный способ идентификации человека, рассказывает Вячеслав Мацелло.  Ведь именно по лицу мы узнаем друг друга. Традиционные методы проверки (карточки, пин-коды  и пр.) ненадежны -их можно украсть, скопировать, подсмотреть... Как раз на основе этой разработки и создавался Viewdle. Один из основателей Viewdle Егор Анчишкин, будучи студентом, посещал лекции Михаила Шлезингера в КПИ и увидел коммерческую перспективу в наших исследованиях. Мы тогда разрабатывали технологию распознавания лиц в видеопотоке - брали видеосигнал, вытаскивали оттуда лица и распознавали их.

- С этой идеи и начался Viewdle. Потом ребята нашли инвесторов, собрали команду талантливых программистов, начали вносить свои усовершенствования в систему. Мы с Михаилом Ивановичем и нашим коллегой, кандидатом наук Владимиром Кийко до последнего времени были членами научного совета при этой компании. Viewdle купил у нашего института право патентовать и использовать эту технологию за рубежом. Также в контракте с Viewdle было оговорено, что они могут менять содержание патента. Поэтому мы уже являемся соавторами целого ряда изобретений, в том числе и на распознавание лиц. Все это запатентовано уже за границей. Чтобы найти официальную форму сотрудничества с Viewdle (понятие «продать право патентовать» было совсем необычным для Украины!) понадобилось немало времени и усилий. Только консультации по официальному оформлению наших отношений заняли около 7 месяцев!  Ведь нужно было предусмотреть массу правовых и финансовых условий контракта,  в том числе  долю Центра от прибыли или возможной продажи  Viewdle. Эти средства пойдут на развитие украинской науки и новые исследования.

- Сейчас в мировой компьютерной науке происходит зарождение нового этапа – подключается к разговору Михаил Шлезингер. Несмотря на ошеломительный прогресс в области информатики за последние полвека, современные компьютеры все еще могут выполнять действия только в соответствии с четко заданной инструкцией. Сейчас зарождается новый виток развития, когда пользователь будет указывать лишь задачу, а программа самостоятельно будет искать способы ее решения. Это и будут машины будущего. На Западе такими исследованиями сейчас занимаются многочисленные научные коллективы. В Украине же наш Центр - один из немногих коллективов, который ведет подобные разработки. С одной стороны, приятно, что мы не стоим в стороне от этого значимого процесса.  С другой - огорчает, что Украина в этом новом витке участвует значительно меньше, чем могла бы. У Украины есть выдающиеся достижения в этом направлении, и она может занять достойное место в начинающемся сейчас новом витке развития интеллектуальных информационных технологий.

Почему же у нас так мало технологических инноваций?

Боюсь, ответ будет банальным. Для молодого человека, закончившего вуз, занятие наукой несовместимо с жизнью…

После этого мы проследовали в кабинет, где непосредственно ведутся разработки и продолжили разговор уже про конкретные достижения ученых из  МНУЦ ИТиС. Ниже мы публикуем краткое описание последних разработок института.

Распознавание отсканированных нотных текстов.Программа распознает ноты, после чего мелодию можно конвертировать в нужный формат. Также можно настраивать тональность, тембр, темп и ряд других параметров. Программой активно пользуются создатели минусовок, переписчики нот и музыканты.

 

 Обработка геофизических карт

 

 На рисунке выше – карта, на которой изображены результаты геофизических съемок, проведенных для геологического картирования, разведки, поиска полезных ископаемых и пр. Оцифровка одного такого изображения занимает примерно рабочую неделю кодировщика. Обработка программой, разработанной в МНУЦ ИТиС в содружестве с учеными Института геофизики НАНУ, занимает значительно меньше времени, после чего геофизик может просмотреть схему в следующем удобном для него виде. Технология используется в Институте геофизики для поиска разломов, полезных ископаемых и прочих нужд.

 

 Построение трехмерной модели по серии фотографий. Экспериментальная разработка Центра для киевского музея русского искусства. В белом зале музея было сделанооколо 100 фотографий обычным фотоаппаратом. После компьютерной обработки этих фотографий получилась целостная трехмерная модель помещения. В отличие от подобной технологии Google, здесь можно виртуально шагнуть в любое место, а не только туда, где стояла камера, и посмотреть на любую точку под любым углом. Программа автоматически моделирует, как бы выглядел объект, если бы на него смотрели сверху или, скажем, сбоку. Еще одна похожая разработка City3Dреалистичная 3D модель Парижа, сделанная по заказу французской фирмы MAPPY.

 

 Генерирование выражений человеческого лица. Программа автоматически синтезирует изображение лица конкретного человека с различной мимикой. Она моделирует, как бы выглядел этот человек если бы он удивлялся, радовался или  хмурился. Полезно для криминалистов и следователейJ

 

Технология Face3D позволяет автоматически создавать 3Dмодели человеческого лица по набору фотоснимков. Если сравнивать с аналогичными продуктами, у Face3D есть неоспоримое преимущество –  программа понимает и обрабатывает фотографии, снятые с любого ракурса, при любом освещении, в частности восстанавливает 3D модель и по одному единственному снимку.  Например, Джоконда могла бы выглядеть, как показано на рисунке, если бы ее портрет писали с другого ракурса.

 

Одна из разработок института – это сегментация по текстурам фотографий, полученных в результате аэрофотосъемки.

 

Система самообучается в процессе распознавания изображений и даже если пользователь дает ошибочное указание, она способна распознать ошибку и верно решить поставленную задачу.