Институт в фотографиях

Научные и прикладные результаты лаборатории 13

Результаты за 2018 год

Исследование методов визуальной имитации закабинного пространства Международной космической станции с учетом особенностей деятельности космонавтов при проведении визуально-инструментальных наблюдений с борта МКС.

Разработан метод, позволяющий автоматически размещать датчики системы позиционирования, с учётом их диаграмм направленности и других характеристик, обеспечивающий отсутствие мертвых зон в рабочей области и максимальную обусловленность задачи определения положения и ориентации.Разработан метод, позволяющий автоматически размещать датчики системы позиционирования, с учётом их диаграмм направленности и других характеристик, обеспечивающий отсутствие мертвых зон в рабочей области и максимальную обусловленность задачи определения положения и ориентации.Разработанный метод позволил минимизировать количество датчиков, при этом повысить надежность и точность работы системы позиционирования.Этот же подход возможно использовать при проектировании и размещении датчиков систем позиционирования других типов.

 

 

Использование современных компьютерных архитектур для обработки данных на примере решения задачи распространения волн.

Задачу быстрой и достаточно детальной оценки ожидаемой высоты цунами вдоль побережья предлагается решать с помощью численного моделирования распространения волны, используя дифференциальную модель мелкой воды. Разработана программная архитектура для расчета системы мелкой воды без учёта внешних сил, являющейся эквивалентной используемой в пакете MOST для численного моделирования движения волны цунами по водной акватории.Численная реализация системы мелкой воды осуществлялась по схеме Мак-Кормака. Вычислительная схема была реализована на платформе вентильных матриц программируемых пользователем FPGA.Задачу быстрой и достаточно детальной оценки ожидаемой высоты цунами вдоль побережья предлагается решать с помощью численного моделирования распространения волны, используя дифференциальную модель мелкой воды. Разработана программная архитектура для расчета системы мелкой воды без учёта внешних сил, являющейся эквивалентной используемой в пакете MOST для численного моделирования движения волны цунами по водной акватории.Численная реализация системы мелкой воды осуществлялась по схеме Мак-Кормака. Вычислительная схема была реализована на платформе вентильных матриц программируемых пользователем FPGA.
Нля реализации алгоритма на FPGA была предложена архитектура поточного вычислителя, состоящая из процессорных элементов (ПЭ). Особенность архитектуры FPGA позволяет использовать внутреннюю память (BRAM) для организации соответствующего буфера данных и линии задержки, что позволяет реализовать конвейер при количестве  памяти до 〖2N〗_x.Математические операции, необходимые для алгоритма Мак-Кормака, реализованы вычислительным конвейером, обеспечивающим производительность обработки одной точки сетки за один такт. Полученное решение позволяет гарантировать производительность с точностью до такта.

Точность вычислений разработанного решателя была проверена сравнением с точным решением, известным в случае плоского наклонного дна. Достигнутая точность не уступает, а местами и превосходит точность известного программного пакета MOST.Архитектура предложенного ПЭ позволяет одновременно обрабатывать N точек входного потока данных одновременно, что дает возможность параметризовать ПЭ в зависимости от особенностей используемой вычислительной платформы для получения максимальной производительности.

Результаты за 2017 год

Исследование и разработка подходов одновременной локализации и построения карты для управления наземным транспортным средством.

Основной результат

Разработаны метод локализации управляемого объекта по визуальным маркерам, алгоритм начального предсказания позиции объекта, два подхода замыкания циклов. Предложенные подходы и методы позволили устранить или существенно снизить основные проблемы, препятствующие применению SLAM систем, основанных на использовании лидара, такие как:

  • накопление ошибки локализации со временем;
  • обязательное наличие одометра или инерциального датчика;
  • большие погрешности в определении позиции управляемого объекта на однородной местности.

Разработанные подходы универсальны и могут быть применены к различным SLAM системам, основаным на использовании лидара.

Содержание работы

В существующих системах CoreSLAM, Gmapping и др. используется лидар для нахождения статических объектов в окружающем пространстве, относительно которых происходит локализация управляемого объекта, но информации полученной от данного устройства недостаточно для локализации в однородной местности с небольшой погрешностью. В связи с этим было предложено внедрить в систему дополнительный оптический датчик – камеру. Для позиционирования камеры предлагается использовать визуальные маркеры, расположенные в окружающей местности, с известными координатами. Таким образом, в качестве дополнительных входных данных в фильтр частиц, который используется в CoreSLAM, добавляются рассчитанные позиция и ориентация объекта по маркерам. Итоговый вес частицы представлен как сумма весовых оценок локализации по данным с лидара и локализации по маркерам. Стоит отметить, что наличие визуальных маркеров в окружении не жесткое требование для корректной работы SLAM системы, а дополнительная возможность для более точной локализации управляемого объекта и построения карты местности.В существующих системах CoreSLAM, Gmapping и др. используется лидар для нахождения статических объектов в окружающем пространстве, относительно которых происходит локализация управляемого объекта, но информации полученной от данного устройства недостаточно для локализации в однородной местности с небольшой погрешностью. В связи с этим было предложено внедрить в систему дополнительный оптический датчик – камеру. Для позиционирования камеры предлагается использовать визуальные маркеры, расположенные в окружающей местности, с известными координатами. Таким образом, в качестве дополнительных входных данных в фильтр частиц, который используется в CoreSLAM, добавляются рассчитанные позиция и ориентация объекта по маркерам. Итоговый вес частицы представлен как сумма весовых оценок локализации по данным с лидара и локализации по маркерам. Стоит отметить, что наличие визуальных маркеров в окружении не жесткое требование для корректной работы SLAM системы, а дополнительная возможность для более точной локализации управляемого объекта и построения карты местности.Чтобы избежать требования на наличие внешнего устройства для получения одометрии, было предложено создать алгоритм для первоначальной оценки позиции объекта в случае отсутствия одометра. Основная идея заключается в следующем. На каждой итерации после использования фильтра частиц система сохраняет N частиц с наибольшими весами. Вначале каждой итерации, система располагает только двумя последними наборами частиц. То есть на шаге m система имеет два множества точек Km-1 и Km-2. Чтобы получить первоначальное предсказание позиции объекта (перед применением фильтра частиц), предлагается провести линейную экстраполяцию между всеми парами точек из двух множеств с последующим вычислением веса для каждой частицы из полученного набора с учетом текущих данных лидара и глобальной карты препятствий. Частица с наибольшим весом выбирается в качестве начального предсказания позиции управляемого объекта.Разработанный алгоритм замыкания циклов состоит из двух частей, которые направлены на уточнение позиции управляемого объекта, предсказанной с помощью фильтра частиц по глобальной карте препятствий (карта, содержащая все данные полученные с лидара). Первая часть сохраняет карту препятствий и текущую оценку позиции управляемого объекта на данной карте при условии, что объект находится в неисследованной области. Неисследованная область определяется с помощью проверки принадлежности предсказанной позиции к некоторой окрестности уже сохраненных точек. В случае попадания предсказанной позиции в окрестность сохраненной точки, выполняется вторая часть алгоритма замыкания циклов, которая проводит повторную локализацию по соответствующей сохраненной карте. Поскольку точность карты препятствий связана с погрешностью оценки позиции объекта и погрешность накапливается со временем, ранее сохраненная карта не менее точна, чем глобальная карта. Таким образом, проведя повторную оценку позиции по сохраненной карте можно сократить накопленную ошибку оценки позиции объекта (см. рис.).

pic 2017 1

Недостатком данного подхода является большой расход оперативной памяти, связанный с хранением глобальных карт препятствий. Для решения этой проблемы в алгоритме замыкания циклов было предложено сохранять не глобальные карты препятствий с обработанными данными лидара, а локальные, которые содержат некоторый набор сырых данных с лидара и позиции управляемого объекта в момент сбора информации. Для решения проблемы связанной с повторной локализацией управляемого объекта по сохраненной карте использовался метод выравнивания сканов, основанный на итеративном алгоритме ближайших точек.

 

Использование современных компьютерных архитектур для обработки данных на примере решения задачи распространения волн.

Основной результат

Разработаны аппаратные и программные методы значительного ускорения расчётов высот волны до момента прибытия цунами к берегу без ущерба для точности. Предложены методы  реализации разностных вычислительных схем Мак-Кормака на архитектуре FPGA. Предложенные методы  позволяют сократить время моделирования волны цунами для более раннего определения опасных прибрежных зон.

Содержание работы

В последние годы наблюдается рост числа катастрофических наводнений сейсмической природы в различных регионах мирового океана и существенное усиление их влияния на жизнедеятельность населения в прибрежной полосе. Современные средства компьютерного моделирования позволяют достаточно точно рассчитать профиль по крайней мере первого периода волны цунами по известной начальной форме волны в источнике (то есть над зоной подвижки морского дна). Однако, важнейшим параметром любой системы предупреждения об опасности цунами является время, необходимое для формирование обоснованного прогноза.В последние годы наблюдается рост числа катастрофических наводнений сейсмической природы в различных регионах мирового океана и существенное усиление их влияния на жизнедеятельность населения в прибрежной полосе. Современные средства компьютерного моделирования позволяют достаточно точно рассчитать профиль по крайней мере первого периода волны цунами по известной начальной форме волны в источнике (то есть над зоной подвижки морского дна). Однако, важнейшим параметром любой системы предупреждения об опасности цунами является время, необходимое для формирование обоснованного прогноза.Исходными данными для любой системы предупреждения о цунами являются параметры источника волны. После восстановления начального смещения водной поверхности в очаговой области следует решать прямую задачу распространения волны цунами от известного очага до защищаемых участков на побережье. Обычно этот процесс моделируется путём численного решения системы дифференциальных уравнений гидродинамики в рамках приближения теории мелкой воды, применяя один из разработанных и протестированных методов. Службой предупреждения о цунами США используется программный пакет MOST (Method of Splitting Tsunamis). Ввиду необходимости выполнения условия устойчивости, накладывающего ограничения на величину шага по времени, численный расчёт на достаточно детальной сетке может потребовать слишком много времени и может не дать оценок ожидаемых высот волны до момента прибытия цунами к берегу. В связи с этим авторами были разработаны аппаратные и программные методы значительного ускорения этих расчётов без ущерба для их точности.В пакете MOST для численного моделирования движения волны цунами по водной акватории используется следующий эквивалентный вид так называемой системы мелкой воды без учёта внешних сил (донное трение, сила Кориолиса и т.д.).

pic 2017 formula

Для моделирования был использован аппаратный вычислитель на базе FPGA  Xilinx Virtex-7 VC709. Блок-схема архитектура спецпроцессора представлена на рисунке.

pic 2017 2

Помимо самого вычислителя спецпроцессор имеет контроллеры памяти DDR3, контроллер PCIe, модуль DMA, обеспечивающий взаимодействие вычислителя с памятью компьютера-хоста в режиме прямого доступа. Данные поступают в вычислитель из памяти через FIFO, что позволяет легко варьировать частоту отдельных вычислительных блоков, подстраиваясь под конкретный кристалл FPGA и характеристики внешней памяти и интерфейсов. Сам вычислитель, в зависимости от доступных ресурсов FPGA, состоит из одного или нескольких процессорных элементов. Спроектированный вычислитель на уровне алгоритмов был протестирован с применением технологий HLS. Модули, обеспечивающие работу всего процессора, были протестированы с помощью RTL-симуляторов. Помимо самого вычислителя спецпроцессор имеет контроллеры памяти DDR3, контроллер PCIe, модуль DMA, обеспечивающий взаимодействие вычислителя с памятью компьютера-хоста в режиме прямого доступа. Данные поступают в вычислитель из памяти через FIFO, что позволяет легко варьировать частоту отдельных вычислительных блоков, подстраиваясь под конкретный кристалл FPGA и характеристики внешней памяти и интерфейсов. Сам вычислитель, в зависимости от доступных ресурсов FPGA, состоит из одного или нескольких процессорных элементов. Спроектированный вычислитель на уровне алгоритмов был протестирован с применением технологий HLS. Модули, обеспечивающие работу всего процессора, были протестированы с помощью RTL-симуляторов. Для практической реализации и тестирования были использованы платформа VC709 на базе кристалла Virtex-7 xc7vx690-2 и SLEDv7 на базе кристалла Virtex-6 xc6vsx315-1.

pic 2017 table

Тесты проводились на батиметрии южной части Японии (см. рис.):

  • Размер 3000х2496 точек
  • Шаги сетки 0.003 и 0.002 градуса (280.6 и 223 м)
  • границы массива от 131 до 140 градусов В Дот 30.01 до 35 градусов С Ш

Временной шаг составлял 0.5 секунд.

pic 2017 3

По результатам моделирования, время распространения волны от южной границы батиметрии до побережья составило 25секунд. При этом время достижения волной берега составило 3200 секунд модельного времени.По результатам моделирования, время распространения волны от южной границы батиметрии до побережья составило 25секунд. При этом время достижения волной берега составило 3200 секунд модельного времени.Данные результаты позволяют сделать вывод о целесообразности применения программно-аппаратного решения на базе FPGA для моделирования распространения волн цунами после произошедшего события.

Результаты за 2016 год

Разработка методов визуальной имитации процессов внекорабельной деятельности космонавтов на наружной поверхности орбитальной станции.

Основной результат

Проведены исследования особенностей внекорабельной деятельности космонавтов. Разработан метод визуальной имитации наружной поверхности Международной космической станции с использованием технологии мультифокальных дисплеев, направленный на устранение влияния основных факторов, присущих традиционным наголовным дисплейным системам: 

  • недопустимые ошибки оператора при определении расстояний и размеров объектов;
  • рассогласование стереоскопического и аккомодационного механизмов человеческого зрения;
  • ограничение времени тренировки в связи опасностью для зрения оператора.

Создан прототип системы визуализации для тренажеров внекорабельной деятельности с применением наголовного бифокального дисплея.

Содержание работы

В основе успешности применения классических компьютерных тренажеров лежит близость зрительного восприятия человеком  реальной и виртуальной визуальной обстановки в тех случаях, когда целевые объекты, на которые ориентируется человек,  находятся от него на значительном расстоянии. Такие типы визуальной обстановки успешно имитируются с помощью проекционных устройств, экраны которых устанавливаются на расстоянии  6 и более метров от обучаемого или с помощью коллимационной оптики, фокусирующей человеческих глаз на бесконечность. Для отработки непосредственного взаимодействия человека с близкими целевыми объектами (к которой в полной мере относится отработка деятельности космонавта на внешней поверхности космической станции) традиционные методы визуальной имитации не применимы, так как в них на малых расстояниях до целевых объектов перестают согласованно работать механизмы зрительного восприятия:  аккомодация -фокусировка глаза на близкий целевой объект и конвергенция - встречное движение глаз, в результате которого обе зрительные линии сходятся вместе на целевом объекте.

 2016-01

Особенности зрительного восприятия близких объектов.

F - точка пересечения зрительных осей;

Z- расстояния от глаз до плоскости монитора;

d - расстояние от глаз до точки фиксации взгляда на поверхности целевого объекта.

Попытка применения традиционных дисплейных стереосистем приводит к возникновению конфликта – глаз аккомодирует на фиксированное расстояние до плоскости экрана (Z - на схеме), независимо от того, в какой точке виртуального пространства (ближе или дальше) пересекаются зрительные оси глаз вследствие конвергенции (точка F - на схеме на расстоянии d от глаза). В результате у человека появляется бинокулярный стресс, утомление глаз, головная боль, тошнота и т.д. Кроме того, обучаемому прививаются ложные навыки, связанные с недопустимым ошибочным определением расстояний и размеров объектов.

Для устранения или существенного уменьшения перечисленных проблем был предложен метод, основанный на применении наголовного бифокального дисплея и разработана специализированная четырехканальная система визуализации. Оптическая схема и внешний вид дисплея приведены на рисунках:

 2016-02

Бифокальная схема, обладающая двумя планами фокусировки

2016-03

Внешний вид наголовного мультифокального дисплея

В отличии от традиционных стерео систем визуализации в разработанной системе генерируется по два изображения для каждого глаза. При этом каждое каждый пиксел генерируемого изображения наряду с плоскими координатами XY получает третью координату D=1/d, где D – глубина в диоптриях, d – расстояние до видимого участка объекта в метрах. Пара изображений для одного глаза соответствует двум фокусным планам -  1м и 4м. В целях оптимизации процесса отображения разработан специальный шейдер, который на этапе постобработки генерирует два изображения, соответствующие разным фокусным планам на основе одного готового изображения стереопары. Шейдер модифицирует яркость каждого пиксела в зависимости от разности между глубиной изображения в данном пикселе и целевым фокусным планом.  Зависимость яркости от глубины подобрана с учетом психофизиологических свойств зрения так, чтобы при оптическом смешивании изображений двух фокусных планов достигалась равномерность аккомодационного восприятия. На рисунках ниже проиллюстрированы два фокальных изображения для одного глаза в типичной сцене тренинга внекорабельной деятельности космонавтов.

 2016-04

 Cлева - изображение для дальнего фокусного плана, cправа - для ближнего плана.

Расстояние до антенн на ближнем плане ~ 1м.

2016-05

Точка наблюдения смещена на 2м назад от предыдущего рисунка

Четыре изображения предназначенные для одного кадра формируются в виде составного единого изображения и передаются посредством HDMI интерфейса на бифокальный дисплей, который с помощью окулярной оптоэлектронной схемы для каждого глаза формирует по два плана изображения.
Такая технология не имеет методической погрешности, как при монокулярном, так и при бинокулярном зрении. В первом случае виртуальное пространство воспринимается объёмным за счет аккомодации глаза на точки фиксации взгляда F с глубиной d. При этом изображение вокруг точки фиксации становится резким, а изображение удалённых (d<DF) или более близких точек (d>DF) в поле зрения естественным образом дефокусируется. Во втором случае, при стерео зрении аккомодация и конвергенция глаз приходится на одни и те же точки фиксации F. Возникает процесс стереопсиса, который усиливает объёмное ощущение пространства. Таким образом, в области интереса изображение оказывается и резким и слитным (без диплопии). Появление визуального дискомфорта принципиально невозможно. Дефокусировка изображений вне области фиксации остаётся, что является необходимой компонентой достоверного когнитивного восприятия пространства. Технология обеспечивают согласованное стереоскопическое и аккомодационное зрение при большом динамическом диапазоне расстояний до целевых объектов (от 80 см до бесконечности).
Опытный образец разработанной системы получил положительную оценку в ФГБУ «НИИ ЦПК имени Ю.А. Гагарина» в качестве перспективной технологии для создания тренажеров внекорабельной деятельности космонавтов. Поданы заявки на изобретение 2015147672 и на полезную модель PCT/RU 2015/000956.
Разработанный метод визуальной имитации может использоваться при создании перспективных систем дистанционного управления различными транспортными средствами, роботизированными манипуляторами, в авиационных тренажерах дозаправки в воздухе, в задачах микрохирургии и др.

Результаты за 2015 год

 Исследование методов построения и разработка технологической концепции виртуальной деятельностной коммуникационной среды, базирующейся на облачной архитектуре.

Основной результат

Разработана технологическая концепция образовательной платформы для смешанного обучения географически удаленных пользователей. Дистанционное очное обучение реализуется посредством переноса образовательного процесса в разделяемую трехмерную виртуальную среду, в которой участники способны взаимодействовать друг с другом и моделями учебных объектов. Предложенный подход позволил на порядок снизить требования к пропускной способности интернет каналов, повысив равнодоступность обучения.

Содержание работы

В настоящее время широкое распространение и признание в образовании получили  технологии Blending Learning. Blended Learning, или cмешанное обучение - это образовательная концепция, в рамках которой обучаемый получает знания и самостоятельно онлайн, и очно с преподавателем. Т.е. смешанное обучение позволяет совмещать традиционные методики очного обучения и инновационные интернет технологии передачи знаний.

Современные системы дистанционного обучения обладают мощными средствами организации, наглядного представления и интернет доставки учебных материалов, но не обладают адекватными инструментами для взаимодействия обучаемых с преподавателем и между собой. Таким образом применение смешанного обучения в полностью дистанционном режиме невозможно. Для решения этой задачи авторами предложена концепция дистанционной очности, базирующаяся на переносе процесса очного обучения в разделяемую трехмерную виртуальную среду, в которой преподаватель и обучаемые представлены собственными трехмерными аватарами, способными взаимодействовать друг с другом и самим виртуальным пространством (перемещаться, разговаривать, жестикулировать, работать с виртуальной классной доской, взаимодействовать с виртуальными моделями объектов и процессов, с абстрактными знаковыми моделями).

В отличие от таких широко применяемых инструментов взаимодействия как вебинары и веб конференции в предлагаемом подходе взаимодействие между пользователями достигается за счет эффекта погружения участников в виртуальную среду, применения голосового, эмоционального и жестового общения опосредованного через управление пользовательскими аватарами. Объемы обмениваемой через интернет информации, а следовательно и  требования к пропускной способности интернет каналов у конечных пользователей в этом случае снижаются на порядок, что создает предпосылки для общедоступности качественного смешанного обучения.

Предлагаемая технологическая платформа смешанного обучения обладает облачной архитектурой. Хранение данных и большинство вычислений, связанных функционированием виртуальной среды, осуществляется на специальных серверах виртуальной среды. Отображение традиционного образовательного контента на компьютерах конечных пользователей осуществляется с помощью стандартного интернет браузера, а для отображения виртуальной среды применяется тонкий клиент, что в свою очередь позволяет существенно снизить требования к компьютерам конечных пользователей.

2015 Архитектура ВДОС

 

Развитие технологий массового открытого онлайн обучения (MOOC технологий) диктует необходимость поддержки одновременного участия в обучении большого числа пользователей (вплоть до тысяч и десятков тысяч пользователей). Для реализации этой возможности авторами была разработана концепция распределенной виртуальной среды, в которой данные о среде и основные вычислительные операции могут распределяться на практически неограниченном количестве серверных станций. При этом пользователи разделяются на изолированные группы одновременно присутствующих в виртуальных аудиториях и взаимодействующих между собой обучаемых, поэтому требования к пропускной способности интернет каналов конечных пользователей по мере их общего роста не возрастает.

2015 Mekohall

 

Виртуальное очное обучение является важной, но не единственной необходимой компонентой смешанного обучения. Для успешного сочетания виртуального очного и заочного дистанционного обучения  авторами разработаны методы интеграции виртуальной среды с популярными системами управления обучением (например, со свободно распространяемыми системами Moodle или Оpen eDX) в единую платформу смешанного обучения.

Кроме того авторами предложены методы интеграции платформы смешанного обучения с автоматизированными системами управления учебными заведениями. В результате такой интеграции регистрация пользователей и предоставление доступа к образовательному контенту регламентируется не в рамках платформы, а на уровне автоматизированной системы управления ВУЗом, что устраняет дублирование информации и рутинных операций по ее ручному вводу, повышает общую эффективность и надежность функционирования всей IT-инфраструктуры учебного заведения.

2015 BL-АСУ

 

Разработка программно-аппаратного комплекса на базе FPGA для алгоритмов обработки сейсмологических данных в режиме реального времени

Основной результат

Разработаны архитектуры вычислительных конвейеров для решения СЛАУ большой размерности на базе программируемой логики FPGA, реализующие метод Якоби, блочное LU-разложение, стабилизированный метод BiCGSTAB. Разработанные конвейеры эффективны для вычислений с плавающей точкой на FPGA. Предложеные архитектуры применимы как для создания спецпроцессоров в составе ПК, так и для портативных вычислительный устройств для работы в полевых условиях.

Содержание работы

При обработке сейсмических данных, одним из самых трудоемких этапов является решение систем линейных алгебраических уравнений (СЛАУ) большой размерности. На данный момент, для решения систем линейных уравнений используются различные методы распараллеливания вычислений – применение вычислительных кластеров и использование GPGPU (General-Purpose Graphics Processing Units, вычисления на GPU). Современная программируемая логика FPGA (Field-Programmable Gate Array) обладает возможностью параллельно исполнять до сотен тысяч параллельных потоков исполнения, одновременно создавая специализированные вычислительные конвейерные архитектуры. Кроме того, современные FPGA имеют возможность эффективной работы над числами с плавающей запятой. Всё это позволяет создавать специализированные вычислители (спецпроцессоры), увеличивающие скорость решения различных математических задач.

В качестве основы спецпроцессора были предложены два устройства на базе FPGA: отладочная плата VC709 фирмы Xilinx на базе кристалла семейства Virtex-7 (XC7VX690T) и плата SLEDv7 на базе кристалла семейства Virtex-6 (XC6VSX315T), созданная в лаборатории 13 Института Автоматики и Электрометрии СО РАН. Обе платы имеют схожее устройство, и представляют собой модули расширения PCI Express для ПК, на которых, помимо FPGA, находятся два разъема SO-DIMM для модулей памяти DDR3. Всего, FPGA доступно два независимых банка памяти DDR3, c суммарным объемом до 8 ГБ. Различия плат заключаются в установленном кристалле FPGA, скоростью интерфейсов и набором периферийных устройств.

В ходе работы была разработана универсальная архитектура спецпроцессора, пригодная для использования в различных задачах, обеспечивающая:

  • обмен данными между памятью хоста и внешней памятью через PCIe в режиме DMA;
  • доступ к памяти вычислительным блокам по универсальному протоколу AXI;
  • управление вычислителем через набор регистров PCIe;
  • управление и обработку прерываний (Interrupt Request).

2015 FPGA

 

Архитектура спецпроцессора была реализована и протестирована на отладочных платах SLEDv7 и Xilinx VC709. Было произведено тестирование производительности с применением программного обеспечения для ОС Windows. Реальная скорость обмена данными между памятью спецпроцессора и компьютера составила 1200 - 1300 МБ/с. Также, в ходе тестировании архитектуры было выяснено, что при чтении из памяти большими блоками спецпроцессор обеспечивает 88%-ую загрузку каналов памяти –  реальная пропускная способность, доступная вычислителям составляет 10,7 ГБайт/с на канал.

Также, результатом работы является создание модулей матричных и векторных операций:

  • Скалярное произведение векторов
  • Умножение матрицы на вектор
  • LU-разложение блока матрицы
  • Перемножение блоков матрицы

С помощью этих блоков, возможна реализация различных алгоритмов, использующих матричные операции, в том числе алгоритмов решения СЛАУ. Ключевой особенностью  разработанных модулей является использование чисел с плавающей запятой двойной точности (64 бита) стандарта IEEE-754. Ценность разработанных вычислительных модулей заключается в масштабируемости, что позволяет адаптировать их к различным аппаратным решениям, не изменяя архитектуру.

В результате работы были созданы вычислители, реализующие методы решения СЛАУ: метод Якоби, блочное LU-разложение, стабилизированный метод бисопряжённых градиентов (BiCGSTAB).

Производительность реализаций итерационных методов (метода Якоби и BiCGSTAB) зависит от пропускной способности памяти спецпроцессора. Для спецпроцессора на базе платы VC709 время одной итерации метода Якоби для матрицы размера N=8192 составило 23.83 мс, метода Якоби – 47.78 мс. В среднем, спецпроцессор обеспечивает ускорение в 2.6 раз по сравнению с однопоточной реализацией на CPU Intel Core i7-3770K @ 3.40GHz. (Загрузка кристалла ~25%, Энергопотребление < 20W)

Производительность реализации LU-разложение зависит от выбранного размера блока, что в свою очередь зависит от объема использованного FPGA. Для кристалла  XC7VX690T максимальный  размер блока равен 64. В этом случае, разложение матрицы размером N=8192 занимает 15 секунд, что в 11.5 раз быстрее  однопоточной реализациии на CPU. (Загрузка кристалла ~75%, Энергопотребление < 20W)

Заключение

В работе показано, что применение современных FPGA позволяет эффективно реализовывать параллельное исполнение множества алгебраических операций с плавающей точкой. Результатом работы является архитектура вычислительных конвейеров для реализации ряда методов решения СЛАУ большой размерности. Ценность разработанных вычислительных конвейеров заключается в масштабируемости, что позволяет адаптировать их к различным аппаратным решениям, не изменяя архитектуру. Применение разработанных вычислительных конвейеров позволяет использовать спецвычислители на базе FPGA как в качестве ускорителя этапов решения задач в области сейсмологии, так и в качестве автономных мобильных вычислительные устройства для работы в полевых условиях.

Результаты за 2014 год

Исследование методов визуальной имитации технологических процессов орбитального мониторинга земной поверхности.

Созданы алгоритмическая и программная модели для отработки навыков визуально-инструментальных наблюдений (ВИН) и мониторинга поверхности Земли с борта космического аппарата.

Область применения: в системах компьютерной генерации изображения тренажеров для отработки навыков в области геофизических исследований и мониторинга Земли с борта космического аппарата методами ВИН.

В результате проведенных исследований установлено, что для обеспечения отработки космонавтом-оператором профессиональных навыков выполнения задач ВИН необходимо, чтобы система моделирования внешней визуальной обстановки обеспечивала формирование и отображение управляемых в реальном масштабе времени цветных динамических изображений земной поверхности,  соответствующих условиям наблюдения в  иллюминаторах  пилотируемых космических аппаратах (ПКА)  как невооруженным глазом, так и через бортовые инструментальные средства визуального наблюдения и отвечала следующим требованиям:

  • возможность формирования в поле зрения бортового средства наблюдения изображения подстилающей поверхности Земли по трассе полета ПКА для любого суточного витка, соответствующего заданным баллистическим параметрам орбитального полета;
  • высокий уровень географического подобия формируемого изображения земной поверхности;
  • возможность проективных преобразований формируемого изображения с учетом кривизны Земли при ведении оператором наблюдений невооруженным глазом от надира к горизонту и моделировании изменений пространственного положения оптической оси бортового средства наблюдения;
  • высокая точность координатной привязки объектов наблюдения, представленных в цифровой визуальной модели (ЦВМ) Земли;
  • высокий уровень детализации объектов земной поверхности;
  • воспроизведения объектов ВИН с учетом перекрытия элементами ПКА, времени года, уровня облачности и дымки.

Удовлетворить выявленные требования удается за счет создания реалистичной модели визуальной обстановки на основе реальных космических цифровых снимков земной поверхности, которые сведены по цвету и очищены от облачности. Для представления текстурных данных используется проекция Меркатора. На самом низком уровне детализации (первом уровне) текстура земной поверхности имеет размер 512×512 пикселей, а на каждом последующем уровне ширина и высота увеличиваются вдвое. При использовании проекции Меркатора пространственное разрешение (расстояние на поверхности Земли, которое представлено одним пикселем на текстуре) зависит от используемого уровня текстурной детализации и широты отображаемой точки.

Таким образом, из исходных снимков с разрешением 15-30 метров на тексел формируются данные для каждого из используемых уровней детализации текстуры земной поверхности. В каждом наборе данных в растровом формате представлены фрагменты изображений земной поверхности размером 256×256 пикселей. Фрагменты хранятся таким образом, что информация о двух географически близких точках в большинстве случаев находится рядом и на жестком диске ЭВМ. Это достигается за счет использования псевдо-Гильбертовых кривых для прямоугольных областей произвольного размера, алгоритм генерации которых был создан на основе работы Zhang J. et al. Такая организация данных позволяет эффективно осуществлять загрузку с диска необходимых участков текстур и визуализировать ЦВМ Земли от 85° южной широты до 85° северной широты с пространственным разрешением 15-30 метров на тексел. При этом возможна плавная трансфокация угла обзора от 110° до 2°. На практике система позволяет имитировать десятикратную скорость пролета ПКА, характерное время прохождения одного витка которых приблизительно составляет 90 минут.

 2014 ВИН

В ходе работы над проектом подготовлен ряд статей и докладов  на международных конференциях. Значимость результата исследований подтверждена патентом на полезную модель № 136618.

 

Результаты за 2013 год

Разработана архитектура вычислительного высокопроизводительного конвейера для решения задачи моделирования распространения волн цунами на базе спецвычислителей, имеющих в своем составе FPGA в качестве процессорного устройства и динамическую память.

Область применения: в области математического моделирования числовых и разностных схем с целью наблюдения и прогнозирования природных явлений.

Для моделирования распространения волны цунами применялась линейная система уравнений мелкой воды в виде, используемом мировыми центрами предупреждения (такая гиперболическая система, предложенная В.А. Титовым, допускает симметризацию с последующим использованием метода расщепления). В работе рассмотрен вариант решения задачи моделирования цунами с использованием FPGA и предложен масштабируемый вычислительный конвейер для FPGA семейств Virtex-5, Virtex-6 и Virtex/Kintex-7 на языке описания аппаратуры VHDL.

Предложенный вычислительный конвейер был реализован на базе двух спецвычислителей:

  • на базе спецвычислителя FD842 (FPGA Xilinx xc5vlx30t). Было выяснено, что вычислитель может работать на частоте 62.5 МГц. На реализацию предложенного базового конвейера было затрачено более 90% объема кристалла, что не позволило использовать внешнюю динамическую память. В ходе тестирования было выяснено, что предложенный метод взаимодействия без DRAM (последовательная постраничная запись в FPGA) не дает ожидаемого эффекта (по сравнению с использованием графических ускорителей) из-за накладных расходов на обработку прерываний в драйвере (85% времени вычислитель простаивает в ожидании данных от ПК).
  • на базе спецвычислителя SLEDv7 (FPGA Xilinx xc6vsx315t). Данный спецвычислитель имеет 2 независимых контроллера внешней динамической памяти DDR3. Емкость кристалла позволила реализовать вычислительный конвейер с коэффициентом масштабирования 10, а также использовать имеющуюся на борту внешнюю память для хранения исходных данных и промежуточных результатов. В данный момент происходит отладка программного обеспечения для запуска серии реальных тестов, но по результатам моделирования, итоговое увеличение производительности составит порядка 100 раз по сравнению с реализацией на базе спецвычислителя FD842.

В ходе работы был создан вычислительный конвейер для решения задачи моделирования распространения волны цунами. Данный конвейер разработан таким образом, что его можно легко масштабировать под используемый спецвычислитель, исходя из исполдьзуемого кристалла FPGA, а также наличия и количества внешней памяти. Также были разработаны принципы проектирования аппаратных спецвычислителей на базе FPGA для решения задач математического моделирования, особенностью которых являются многопроходность и  использование большого количества начальных и промежуточных данных.

В настоящий момент в лаборатории закончена разработка нового аппаратного решения SLEDv7 на базе кристалла xc6vsx315t. Данный аппаратный комплекс обладает большим объемом логических элементов и содержит в себе большое количество блоков DSP, что позволяет сократить затраты на логические элементы. Помимо этого, использование таких блоков позволяет повысить тактовую частоту вычислителя и, соответственно, производительность. По результатам моделирования, использование предложенного аппаратного комплекса позволяет увеличить конвейер в 10 раз. С учетом пропускной способности интерфейсов памяти DDR3, установленной на данной плате итоговое увеличение производительности по сравнению с реализацией на аппаратном решении FD842 составляет порядка 100 раз.

В ходе выполнения работы была подготовлена и опубликована статья "FPGA Based Hardware Accelerator for High Performance Data-Stream Processing" (Pattern Recognition and Image Analysis, 2013, Vol. 23, No. 1, pp. 26–34).

По результатам программного моделирования и практического тестирования на двух программно-аппаратных комплексах были выявлены основные особенности, которые необходимо учитывать при выборе аппаратной платформы для математического моделирования подобных задач:

  1. Необходимо наличие внешней динамической памяти, соединенной непосредственно с вычислителем FPGA.
  2. Наличие двух независимых банков памяти позволяет существенно увеличить производительность вычислительного конвейера за счет распараллеливания независимых этапов вычислений.
  3. Объем установленной динамической памяти менее чем 4 ГБ может быть недостаточен для хранения исходных и промежуточных данных моделирования.
  4. Логический объем вычислителя FPGA должен быть не менее чем FPGA xc5vlx50t.
  5. Программная реализация драйвера аппаратного комплекса должна учитывать необходимость обработки большого количества прерываний (не менее 100 Гц) и своевременного обеспечения данными вычислительного комплекса.

 Результаты за 2012 год

Предложены новые методы реализации системы частиц на стандартных графических акселераторах, обеспечивающие оптимальное соотношение между скоростью обработки частиц и  качеством визуализации спецэффектов. Для обеспечения быстродействия предложен метод распределенной обработки анимационных составляющих спецэффекта. Обработка параметров анимации частиц осуществляется на пиксельном конвейере графического акселератора, а параметров анимации формы – на вершинном конвейере видеокарты. Разработаны алгоритмы и программное обеспечение для реализации предложенных методов на стандартных графических акселераторах.

 

image001 image003 image005

Применение графического акселератора в качестве математического сопроцессора обеспечило пятикратное увеличение производительности по сравнению с классической реализацией.

image008

Разработаны имитационная модель и программно-алгоритмические средства для моделирования поведения плотных автомобильных потоков на сети дорог. Модель обеспечивает реалистичное динамическое распределение автомобилей в пределах видимости наблюдателя, стабильность, предсказуемость и управляемость в широком диапазоне параметров.

image009image011

Разработана интеллектуальная система управления виртуальным автомобилем в плотном дорожном трафике. Управление реализовано в виде набора допустимых маневров, применяемых в зависимости от текущей дорожной обстановки. Для каждого из автомобилей на каждом кадре принимается решение о продолжении выполнения текущего маневра или перехода на выполнение другого маневра.  Разработаны и реализованы алгоритмы, представляющие следующие манёвры: движение по заданному на графе маршруту, смена полосы, обгон, остановка, проезд ответвления, проезд перекрёстка (регулируемого и нерегулируемого), объезд препятствия (в том числе и динамического), препятствование движению другого транспортного средства (полицейский обгон и экстренное торможение). Каждый из манёвров на дороге представлен соответствующим геометрическим описанием, которое позволяет точно рассчитать поведение участвующих в нём автомобилей, что в свою очередь позволяет принять однозначно определённое решение по дальнейшему распределению маневров для каждой из машин.

Предложенные алгоритмические решения могут использоваться в автомобильных тренажерах, в системах планирования и организации дорожного движения в качестве легко конфигурируемого тестового инструмента.

 

Разработана архитектура платы на базе FPGA и создано устройство для ускорения решения задачи поиска олигонуклеотидного мотива (сигнала) в геномной последовательности, которая является весьма распространенной задачей в области выявления сайтов связывания транскрипционных факторов. Реализация на FPGA семейства Virtex5 позволяет значительно распараллеливать операции сравнения мотивов, а также хранить во внутренней памяти кристалла входного массива данных, что позволяет значительно уменьшить обмен данных с внешней памятью и добиться значительного роста производительности. Применение разработанного программно-аппаратного комплекса HDG позволит в 2 000 раз ускорить решение задачи по сравнению с универсальным ПК на базе процессора Core2Duo. Использование же решения на базе FPGA XC5VLX330T повысит производительность  в 20 000 раз.

image013

Реализация на FPGA поиска мотива в строке