Архив статей журнала
Удаленные лаборатории вызывают растущий интерес у исследователей по всему миру. Такие лаборатории преимущественно создаются для конкретных учебных условий, поэтому невозможно в полной мере использовать стороннюю лабораторию для проведения онлайн-занятий в МИЭМ НИУ ВШЭ, на дисциплинах, где используются ПЛИС (программируемые логические интегральные схемы). Предлагаемое решение представляет собой удаленную лабораторию, состоящую из серверной и клиентской частей, а эксперименты - взаимодействие с платами ПЛИС с возможностью управления кнопками и переключателями, что позволяет максимально приблизить работу в удаленной лаборатории к практическим занятиям по изучению ПЛИС. Результаты экспериментов показывают, что удаленная лаборатория имеет ряд преимуществ перед существующими средствами для проведения практических занятий.
В основе функционирования сверточных нейронных сетей (СНС) лежит операция умножения вектора на матрицу, в связи с чем для построения производительных СНС требуется разработка быстродействующих вычислителей. Один из путей проектирования таких устройств связан с аппаратной реализацией алгоритмов быстрого умножения, в частности алгоритмов умножения на группу разрядов (алгоритмы Бута, Мак-Сорли и др.). Полученные матричные структуры могут быть оптимизированы при разработке топологии с целью минимизации площади кристалла. В статье рассматриваются варианты ускорения работы умножителей с использованием методов умножения на группу разрядов, предложены варианты топологических реализаций рассмотренных решений, позволяющие достичь компромисса между быстродействием и площадью кристалла.
В статье рассматриваются варианты отображения классической программной конструкции «цикл» в потоковую парадигму программирования, реализованную в архитектуре параллельной потоковой вычислительной системы (ППВС). Кратко описаны потоковая модель вычислений с динамически формируемым контекстом и реализующая её архитектура ППВС. Приведены примеры, поясняющие специфику использования вариантов отображения конструкции «цикл». Отдельно описаны методы контроля окончания циклов. Проанализированы преимущества и недостатки описанных вариантов и методов.
Предложена методика по созданию аппаратной реализации ускоренного приближённого матричного умножителя MADDNESS. Данный умножитель имеет хорошие показатели по точности и скорости работы и одновременно отличается простотой декодера, что позволяет его широко применять в аппаратной реализации нейронных сетей. В результате исследований удалось достичь очень высокой скорости работы умножителя на аппаратном уровне за счёт полного отказа от операции умножения как таковой. При этом качество полученных предсказаний остаётся высоким.
Целью исследования является анализ применения имеющихся свободно распространяемых программных инструментов с открытым исходным кодом для полного цикла проектирования цифровых микросхем от HDL описания до геометрии GDSII Результаты сравниваются с результатами коммерческого программного обеспечения Cadence.
Решение задачи оптимизации схемы получено на основе комбинации генетического алгоритма (ГА) и идеи обобщенной оптимизации, разработанной ранее для детерминированного случая. Показано, что такая модификация ГА позволяет преодолеть преждевременную сходимость к локальным минимумам и на несколько порядков повысить точность минимизации. В этом случае ГА формирует множество популяций, определяемых фитнес-функцией, заданной по-разному, в зависимости от стратегии, выбранной в рамках идеи обобщенной оптимизации. Способ задания фитнес-функций, а также длина и структура хромосом определяются искусственно введенным управляющим вектором в рамках обобщенной оптимизации. Этот вектор определяет количество независимых переменных задачи оптимизации и метод вычисления фитнесфункции. Он позволяет строить составные стратегии, значительно повышающие точность получаемого решения. Это, в свою очередь, позволяет уменьшить количество генераций, необходимых при работе ГА, и минимизировать процессорное время на решение задачи оптимизации схемы.
Рассматривается задача верификации реактивных систем управления с параллелизмом поведения. Полагается, что описание функционирования устройства, заданного на языке параллельных автоматов, корректно, проверке подлежит схемная (или программная) реализация. Генерация тестовой последовательности основана на обходе графа достижимых состояний параллельного автомата. Предлагается метод сокращения графа достижимости, который основан на предположении независимости параллельно происходящих переходов автомата. Усечение графа достижимости достигается за счет доопределения частичного порядка на множестве переходов, позволяющего существенно уменьшить число рассматриваемых состояний системы управления и, соответственно, число вершин графа. Получаемое сокращение графа достижимых состояний позволяет решать задачу построения тестов для более сложных систем управления.
Реконфигурируемые системы на кристалле (РСнК) занимают все большую долю на рынке микро- и наноэлектроники. Наличие программируемой части в совокупности с жесткими сложными функциональными (СФ) блоками на одном кристалле делает их универсальными и пригодными для выполнения разного рода задач. При проектировании интегральных схем (ИС) на основе РСнК остро стоит вопрос быстродействия схем. Оно зависит как и от архитектуры целевой реконфигурируемой системы, так и от результатов каждого этапа маршрута проектирования. Основополагающим фактором, влияющим на скорость распространения сигнала между логическими элементами, является их расположение относительно друг друга. Это определяется на этапе кластеризации и размещения элементов разрабатываемой схемы на базе РСнК. В данной статье эти два этапа рассматриваются совместно, т. к. они неразрывно связаны друг с другом и решают общую задачу распределения логических элементов схемы по группам логических элементов РСнК. Для выполнения кластеризации и размещения выбраны методы, использующие программный модуль KaHyPar, последовательный многоуровневый алгоритм размещения (ПМАР) и стандартный плоский алгоритм размещения (СПАР). Результатом работы является сравнительный анализ представленных методов. В качестве оценки используются такие параметры как количество трассировочных элементов в цепях, количество цепей с определенным числом трассировочных элементов, а также трассируемость схем. На основе полученных результатов показаны преимущества и недостатки представленных методов.
В работе приведен разработанный авторами алгоритм автоматизированного визуального контроля монолитных интегральных схем и описываются его модификации для повышения эффективности. Осуществленные модификации заключаются в изменение порядка расчёта карты дефектности, введении расчёта средневзвешенного пиксельного расстояния и в изменении веса слоёв фотошаблона. Проведенное тестирование модификаций на наборах микрофотографий монолитных интегральных схем различных топологий показало, что изменение порядка расчёта карты дефектности и изменение коэффициента веса слоёв фотошаблона позволили существенно повысить повторяемость ручного визуального контроля до 98%.
Растущая сложность современных систем обработки видеоинформации и ограниченные сроки их проектирования требуют применения новых инструментов разработки, используемых в современных системах автоматизированного проектирования и основанные на программируемых логических интегральных схемах (ПЛИС). В настоящее время в дополнение к традиционным языкам описания аппаратного обеспечения (hardware description languages - HDL) всё большую популярность набирают инструменты высокоуровневого синтеза (High Level Synthesis - HLS) микроархитектур, преимущество которых состоит в повышении уровня абстракции при разработке различных систем обработки сигналов, в частности изображений в области транспорта. Несмотря на простоту проектирования и тестирования в сравнении HDL, при использовании HLS необходимо учитывать недостатки, проявляющиеся при генерации описания аппаратного обеспечения, свойственные данному подходу. В статье на примере проектирования известного фильтра Кэнни, позволяющего выделить границы транспортных объектов на изображениях при решении задач обнаружения и распознавания, представлено сравнительное исследование двух методик синтеза цифровых устройств обработки изображений: HLS и HDL. Приведены результаты сравнения двух реализаций HDL и HLS, полученные на основании оценки вычислительных ресурсов и времени выполнения операций. Поскольку фильтр Кэнни, как и многие другие фильтры выделения контуров, является сверточным, данная работа позволяет оценить сильные и слабые стороны любого оператора в области обработки изображений. Исследование показало, что с учетом затрачиваемых ресурсов и времени отклика реализация HLS продемонстрировала более высокие показатели с точки зрения задействования ресурсов и времени отклика в сравнении с подходом HDL.
Современные системы автоматизации проектирования разрабатываются с использованием графических интерфейсов пользователя. Применение таких интерфейсов позволяет упростить и ускорить разработку устройств. В данной работе рассматривается проблема разработки алгоритмов визуализации, необходимых для создания инструмента графического проектирования цифровых интегральных схем на вентильном уровне. Предложена графовая модель представления схемы как основа для разработки алгоритмов. Рассмотрены алгоритмы размещения и трассировки, необходимые для построения графического представления схемы. Упомянутые алгоритмы реализованы в виде программного модуля на основе разработанной графовой модели. Представлены результаты работы программного модуля для некоторых схем из набора ISCAS’89.
Применимость методов машинного обучения для тестирования моделей процессора в настоящее время исследуется в крупнейших иностранных технологических компаниях (исследовательские центры ARM, Intel, IBM и другие) и институтах. Однако исследования проводятся только с точки зрения машинного обучения в области формальной верификации, генерации тестов с использованием символического выполнения и решения ограничений, а также для поиска нерегулярных ошибок в уже изготовленном кристалле СБИС микропроцессора. Новизна предлагаемого решения в применении машинного обучения для имитации поведения приложений пользователя с целью повышения качества тестирования RTL-модели микропроцессора направленными псевдослучайными методами генерации тестов. В рамках данной работы планируется показать применимость инструментов машинного обучения для функциональной верификации RTL-модели микропроцессора на системном уровне. Основным результатом проведенного исследования является возможность имитировать поведение набора пользовательских приложений на уровне машинного кода, а также автоматизация процесса анализа труднодостижимых в рамках классического маршрута верификации ситуаций с целью повышения тестового покрытия.