Поворот в будущее: трудный путь дополненной реальности

Какие решения по разработке дополненной реальности предлагались за последние 20 лет и почему они не стали популярны?
 
 
Выход устройства дополненной реальности от компании Magic Leap все ближе. В конце июля она показала элементы интерфейса своей операционной системы Lumin OS. Весь софт написан заново. Какие платформы для создания дополненной реальности (Augmented Reality, AR) использовались раньше и что помешало им завоевать мир?
Начать стоит с того, что это вообще за зверь такой — дополненная реальность. Самое простое определение AR — технология, дополняющая нашу реальность виртуальными объектами. Среди базовых критериев, помимо прочего, работа в режиме реального времени и возможность интерактивного взаимодействия с виртуальными объектами.
Определение дополненной реальности достаточно расплывчатое: под него попадает множество практических реализаций, начиная от рамки-видоискателя лица в цифровом фотоаппарате и адаптивного голографического прицела в кокпите истребителя до самых технологичных шлемов и очков дополненной реальности на волноводной оптике.
Как говорил Билл Гейтс в своем AMA (Ask Me Anything, сессия вопросов и ответов) на Reddit: «VR — это экстремальный сценарий AR, в котором не подмешивается ничего из внешнего мира. Я не думаю, что эти две технологии в будущем будут иметь такую же четкую грань, как сегодня»
Как только смартфоны обзавелись камерами приемлемого качества, появился тренд на геолокационные сервисы с дополненной реальностью. Это были как навигационные сервисы, типа Nokia City Lens с поиском ближайших ресторанов и других объектов, так и различные простые игры, не снискавшие такого успеха, который достался Pokemon Go.
 
Инструментарий AR-разработчика
Для разработчиков на тот момент не было ни одного простого способа создать качественное приложение, так как удобных инструментов для этого было крайне мало, а функционал их был весьма ограничен, не говоря уже о кроссплатформенности. Поэтому разработка AR-проектов была крайне недешевым удовольствием, чаще всего сопряженным с изобретением собственного велосипеда.
Среди наиболее развитых и популярных инструментов до недавнего времени лидировали AR-платформы Vuforia, Metaio SDK, а также открытый проект OpenCV, созданный в недрах Intel Research (что любопытно, большую часть проекта разработали в России).
 
OpenCV
В 2000 году корпорация Intel начала инвестировать в разработку библиотек по работе c компьютерным зрением в рамках проекта OpenCV (Open Source Computer Vision). Наибольшую популярность набор библиотек получил среди проектов с основным фокусом на распознавание лиц, жестов или движущихся объектов.
OpenCV, как и многие другие проекты с открытым исходным кодом, развиваются благодаря инвестициям корпораций и энтузиастов. Примерно с 2008 года приоритеты Intel немного изменились, а команда ведущих разработчиков в области компьютерного зрения покинула корпорацию и организовала компанию Itseez. Новая компания продолжила развитие библиотеки уже в качестве партнера Intel в области компьютерного зрения и робототехники.
Примерно к 2012–2013 годам OpenCV вышел на уровень, когда его можно было использовать в качестве полноценного инструмента для разработки мобильных AR-приложений, а количество пользователей достигло 5 млн человек.
Открытость и функциональность проекта компенсируется достаточно высоким технологическим порогом для входа, так как требует от разработчиков достаточно глубокого понимания C++. Поэтому хоть OpenCV и занимает заметную нишу в области специализированной AR-разработки, но существенно уступает той же Vuforia по рыночной доле.
 
Vuforia
Платформа Vuforia была создана в недрах Qualcomm в 2012 году в качестве универсального кроссплатформенного средства разработки под AR (то есть она позволяет создавать программы под разные операционные системы). За многие годы развития она стала самым популярным решением в индустрии. Уже в 2015 году Qualcomm продала команду разработки технологическому холдингу PCB за $65 млн и сфокусировалась на разработке микроэлектроники, которая снижала бы нагрузку на процессор при работе с AR.
Основная функциональность платформы — предоставление разработчику возможности размещать 3D-объекты в окружающем пространстве и привязывать их к реальному окружению. На сегодняшний день, большинство мобильных AR-приложений на рынке, созданы при помощи Vuforia, а среди ключевых партнеров платформы — разработчики игр, производители автомобилей и микроэлектроники, а также любые другие компании, использующие AR в качестве маркетингового инструмента.
Основной сложностью в AR является распознавание внешнего мира и привязка сцены к физическим объектам. Vuforia предложила сразу несколько вариантов объектов-маркеров, за которые можно «зацепиться» при создании AR-проекта, тем самым сведя задачу создания AR-сцены до понятной работы с обычной 3D-сценой. Помимо прочего, можно было «цепляться» за фигуры типа куба или цилиндра, а также распознавать текст. В общем, отличный инструмент для работы с платформами iOS и Android.
По собственным данным, Vuforia до сих является лидирующей платформой на AR-рынке, хотя подтвердить это достаточно проблематично. Проект активно развивается в сторону поддержки новых устройств и форм-факторов, а также интеграции с большими промышленными игроками в области AR.
 
Metaio
Вторым большим игроком на рынке была немецкая компания Metaio с продуктом Metaio SDK, основным преимуществом которого была возможность безмаркерного трекинга и распознавания поверхностей, а также отслеживания трехмерных объектов по контурам. В отличие от Vuforia, помимо iOS и Android SDK был также доступен и на настольных ПК, что существенно расширяло целевую аудиторию.
В целом хоть Metaio SDK и был анонсирован на несколько месяцев раньше, чем Vuforia, отличия по части функциональности были не очень сильные, а порог вхождения в продукт был выше из-за отсутствия полнофункциональной бесплатной версии SDK, что отсеивало большое количество праздных экспериментаторов и уменьшало потенциальную аудиторию Metaio SDK.
Я пишу о Metaio SDK в прошедшем времени, так как в 2015 году компания Metaio была поглощена корпорацией Apple и через некоторое время прекратила поддержку своих продуктов, оставив собственную экосистему в подвешенном состоянии. Разработчики, сделавшие ставку на Metaio, были вынуждены мигрировать на другие платформы и нести непредвиденные убытки.
 
Заключение
Долгие годы разработка под AR была сопряжена с освоением достаточно сложного инструментария и изобретением многими разработчиками собственных велосипедов. Несколько лет назад ситуация начала немного выправляться и вместе с растущей экспертизой рынка AR начал более активно проникать в менее профессиональные сферы использования.
Несмотря на фрагментированность платформ и отсутствие структурированного спроса, AR-технологии развивались семимильными шагами как в области фундаментальных алгоритмов, так и в области аппаратного обеспечения. 

Автор: Андрей Ивашенцев

 
 
Поступить в МТИ