Функционально-операторная aрхитектура

Основа нейроускорителя

Функционально-операторная aрхитектура

Архитектура, лежащая в основе нейроускорителя и построенная исходя из принципов функционального анализа, включающих понятия вычисления значения оператора над функциями или функционала как числового оператора над функциями.

При разработке архитектуры мы вдохновлялись подходом, который применялся при разработке советских суперкомпьютеров М-10/13. Суперкомпьютеры использовались для обработки входящей информации от радиолокационных установок и предназначалась для слежения за искусственными спутниками земли. Идейным вдохновителем и главным конструктором многопроцессорной машины М-10 был доктор т.н. Михаил Александрович Карцев. В теоретических исследованиях ученый дал характеристики многопроцессорным системам и принципам применения параллелизма при создании устройств подобного типа. Математические модели структурной обработки больших массивов информации, разрабатывались математиком, д.т.н. Еленой Валерьевной Гливенко.

Ученые, разработчики, математики Инновационного Центра Развития Образования и Науки разработали проект функционально-операторной архитектуры (ФОА). Главная особенность устройств, в которых применяются принципы нашей инновации, заключается в не последовательном расчете, а в расчете подготовленного массива значений функции в распределенной матрице, и характеризуется своей высокой функциональностью.

Вы можете поставить задачу, от которой будет зависеть выбор конкретного оборудования (например, количество FPGA) и возможности сборки указанных плат в единую платформу. В базовом варианте использованы две платы FPGA XILINX. Расчеты показали возможность обработки потоковой  информации 100 ГБ в секунду при тепловыделении не более 500 Вт.

ФОУ (функционально-операторный ускоритель)

ФОУ был спроектирован как периферийное устройство на базе платы ПЛИС (FPGA), чтобы использовать с моделями для применения инференса ИИ, машинного зрения, сложных математических вычислений в реальном времени при наличии большого количества вводных параметров. При разработке использовались наработки по построению математических алгоритмов функциональной алгебры. В расчет брались достижения современных компьютерных технологий, собственный компилятор и оригинальное ПО.

Форм-факторы устройства.

Исходя из поставленных задач, устройство конфигурируется в разные форматы.

Применимость устройства.

Стационарная форма устройства позволяет применять его как инструмент обработки крупных массивов информации для выделения тональностей, реагирования на изменение весов, обработки данных с большого количества датчиков и так далее в режиме реального времени. Так же его можно применять для развертывания и дообучения больших языковых моделей, задач связанных с проблематикой SAT.

Мы можем разработать архитектуру и для локального, переносного устройства, которое может быть применено в робототехнике, моделях машинного зрения, а так же решениях, связанных с ориентацией в пространстве.

На устройства могут загружаться данные любых форматов, в том числе с приложений для визуального поиска, типа окружения и управление механизмами в реальном времени.

Функциональная схема взаимодействия ФОУ с системами и устройствами:

В результате получаем конечное исполнительное устройство.

Комментарии к функциональной схеме:

1. На оборудование по сбору данных с датчиков и устройств поступают потоковые данные в виде видео, аудио, линейных сигналов) .

2. На коммуникационном/сигнальном процессоре происходит предобработка данных до вида функций/аргументов.

3. В устройстве (ФОУ) поступающие данные обрабатываются и с вида исполненных функций переводятся на язык конечного исполнительного устройства.

4. Конечное устройство принимает решение к реализации.

Архитектура ФОУ включает в себя семь модулей обработки потока информации и блок хранения математических алгоритмов (репозиторий).

Блок 1: получение и обработки первичной входящей информации в автоматическом режиме.

Функционал - через представления ИНС (например MNIST и YOLO), первичная информация в виде обученных алгоритмов  пополняет блок алгебраических функций. Применяется уникальное ПО, разработанное в ИЦРОН.

Блок 2: генерация функций. 

Перевод информации с языка алгебраических функций на оптимизированный функционально-операторной язык машины. В ней так же применяется наше уникальное разработанное ПО.

Блок 3: управление.

Задача - планирование и распределение ресурсов для ФОУ (Функционально-Операторного Устройства). Предоставление данных библиотеки математических алгоритмов. Согласование вычислительных процессов в Блоке 5 посредством уникального ПО, являющегося разработкой АО "ИЦРОН". На этой стадии устройство уже имеет представление о конфигурации применяемого оборудования, разрешение матриц, конфигурации системы.

Блок 4: хранение библиотечных данных.

• Задача: загрузка и хранение вычислительных алгоритмов, формирование мини-инструкций  при запросах из блока оптимизации вычислительного устройства.

• Вид: репозиторий с управляемым доступом.

Блок 5: оптимизация.

Задача - распределение результатов вычислений (см. Блок 2: генерация функций) в многомерный распределенный массив, посредством оптимизированного языка для   приобретения конечной формы решения. При окончательных расчетах, полученные данные отправляются для автоматического перевода на язык конечного исполнительного устройства в предполагаемой общей схеме оборудования. В устройстве применена наша уникальная архитектура (ФОА) и прошитое ПО, управляющее шиной и микроядрами устройства.

Принципиальное  описание функционирования  устройства.

Вычислительное устройство подключается к коммуникационному устройству, способному осуществлять (в зависимости от постановки задачи) функции связи, сбора первичной информации и предобработки, а так же осуществлять согласованные действия с ФОУчерез линейные или оптические вводы. На данное устройство поступает первичный потоковый массив информации, который подготавливается и поступает для обработки обученными алгоритмами инференса LLM. В стационарном исполнении большие потоки могут быть дополняемы алгоритмами инференса LLM с помощью облачных решений.

При мобильном исполнении, когда ставится определенная и конкретная задача, устройство в формате офф-лайн и режиме реального времени переводит массив входящей информации на операторный язык устройства и определяет ее как оптимизированные алгебраические функции. Вшитое программное устройство воспринимает параллельно соединенные платы FPGA как единое целое, и распределяет входящий и обработанный массив информации по всей площади рабочих микроядер устройства.

После кратной синхронизированной обработки загруженных данных, устройство почти мгновенно выдает оптимизированный результат в обрабатывающий блок для формирования конечного результата выполнимости задачи.
Свойства, позволяющие достигать высокой производительности:

  • Вычислительные действия производятся на устройстве с высокой тактовой частотой, без влияния и ограничений ОЦП сервера;

  • Все действия с перемножением матриц происходит в среде памяти устройства;

  • Устройство производит распределенный расчет всеми микроядрами, а при подключении нескольких устройств, всеми ядрами полученной платформы;

  • Встроенное ПО позволяет в режиме реального времени переводить полученную информацию ФОУ на язык конечного исполнительного устройства.

Главной особенностью устройства является не последовательный расчет, а расчет подготовленного массива значений функции в распределенной матрице, чем и определяется высокая функциональность.

Выбор конкретного оборудования (количество FPGA, например) зависит от поставленной задачи и возможности сборки указанных плат в единую платформу. В базовом  варианте, использованы две  платы FPGA XILINX. Расчеты показали возможность обработки потоковой  информации 100 ГБ в сек., при тепловыделении не более 500 Вт.