Адаптивные вычисления ускоряют наступление эры программно-определяемого оборудования

Выпуск на : 3 сент. 2021 г.

Адаптивные вычисления ускоряют наступление эры программно-определяемого оборудования
Оригинал Cheng Wenzhi Electronic Enthusiast Network Вчера
Раньше при разработке продукта вы должны сначала спланировать архитектуру оборудования.После завершения проектирования оборудования начнется разработка программной части, а затем будет выпущен полный продукт. Теперь, с развитием облачных вычислений, Интернета и распространения ИИ, 5G и автономного вождения, требования к процессу разработки оборудования и продуктов претерпевают беспрецедентные изменения, такие как более высокая производительность оборудования; более высокие требования к безопасности и конфиденциальности; увеличение числа датчиков. типы и интерфейсы; постоянно развивающиеся алгоритмы и модели ИИ; разработка программного обеспечения должна быть синхронизирована с разработкой оборудования и т. д.

В связи с этими новыми требованиями концепция «программно-определяемого оборудования» упоминалась много раз. Люди надеются, что контроль и планирование всех операций в микросхеме будет осуществляться программным обеспечением, что позволит снизить накладные расходы на соответствующее оборудование и его использование. сохраненная часть.Для вычислений и хранения на кристалле. Это желание выглядит очень хорошо, но есть еще много трудностей для его реализации.Например, FPGA может реализовать некоторые программно-определяемые аппаратные функции, но ее эффективность ниже, чем у ASIC, но ее энергопотребление выше, чем у ASIC. Есть ли способ лучше?
Преимущества адаптивных платформ

Для этого была создана платформа адаптивных вычислений Xilinx. Согласно официальному документу Xilinx по адаптивным вычислениям и области адаптивных вычислений, адаптивные вычисления основаны на технологии FPGA и поддерживают динамическое построение доменно-ориентированной архитектуры (DSA) на кристалле. Другими словами, адаптивные вычисления позволяют динамически обновлять DSA при изменении спроса, тем самым избегая ограничений, связанных с длительными циклами проектирования ASIC и высокими затратами на NRE. Благодаря постоянному совершенствованию распределенного уровня обработки, адаптивные вычисления могут поддерживать не только обновление программного обеспечения по беспроводной сети (OTA), но и обновление оборудования по беспроводной сети, и обновление может повторяться практически по беспроводной сети. .
«Адаптивная платформа» относится к любому типу продукта или решения, основанного на адаптивном оборудовании. Адаптивная платформа полностью основана на той же самой адаптивной аппаратной основе, но она включает в себя гораздо больше, чем аппаратное обеспечение микросхемы или устройства, но охватывает все оборудование и полный набор программного обеспечения для проектирования и операционного программного обеспечения.

«Белая книга по адаптивным вычислениям»

Отсканируйте код, чтобы скачать сейчас
Благодаря адаптивной платформе инженеры по аппаратному обеспечению могут освободиться от повторяющейся и низкокачественной проектной работы и сосредоточиться на разработке профессиональных функций, в которых они хорошо разбираются. Инженеры-программисты могут приступить к проектированию одновременно с инженерами по аппаратному обеспечению, не дожидаясь ожидания. В конце концов, оборудование спроектировано, оно начинает работать.
2
Рис.: Принципиальная схема ненастроенного и настроенного адаптивного оборудования (источник: Xilinx)
Конечно, помимо этого преимущества, адаптивная платформа имеет следующие преимущества:
Один из них - ускорить процесс запуска продукта. Например, один из продуктов адаптивной вычислительной платформы Xilinx, карта ускорителя центра обработки данных Alveo, использует карту ускорителя для создания приложений, которые могут быть ускорены для конкретных приложений без необходимости специальной настройки оборудования. И просто добавив карту PCIe к сервису, вы можете напрямую вызвать библиотеку ускорения из существующего программного приложения.
Второй - снизить эксплуатационные расходы. По сравнению с решениями на базе ЦП, из-за увеличения плотности вычислений, оптимизированные приложения на основе адаптивных платформ могут значительно повысить эффективность на каждом узле.
В-третьих, рабочую нагрузку можно настраивать гибко и динамично. Адаптивную платформу можно перенастроить в соответствии с текущими потребностями. Разработчики могут легко переключать развернутые приложения на адаптивной платформе и использовать одно и то же устройство для удовлетворения меняющихся требований рабочей нагрузки.
Четвертое - совместимость с будущим. Адаптивная платформа может непрерывно регулироваться. Если существующим приложениям требуются новые функции, можно перепрограммировать оборудование, чтобы реализовать эти функции наилучшим образом, уменьшив необходимость в обновлении оборудования и увеличив срок службы системы.
В-пятых, можно ускорить общее приложение. Поскольку логический вывод AI редко существует в одиночку, он, как правило, является частью более крупной цепочки анализа и обработки данных, часто сосуществующей с несколькими этапами восходящего и нисходящего потока, которые используют традиционные (не-AI) решения по реализации. Встроенный ИИ в этих системах частично выигрывает от ускорения ИИ, в то время как части, не относящиеся к ИИ, также могут извлекать выгоду из ускорения. Естественная гибкость адаптивных вычислений подходит для ускорения задач обработки ИИ и не-ИИ, что называется «общим ускорением приложений». По мере того как вычислительно-интенсивный вывод ИИ проникает во все большее количество приложений, его важность также возрастает.
Успешный кейс адаптивных вычислений

В прошлом, если инженеры хотели использовать ПЛИС, им приходилось создавать собственные аппаратные платы и настраивать FGPA с использованием языка описания оборудования (HDL). В настоящее время разработчикам адаптивных платформ необходимо использовать только знакомые им программные среды и языки (такие как C ++, Python, TensorFlow и т. Д.), Чтобы напрямую повысить эффективность адаптивных вычислений. Другими словами, разработчикам программного обеспечения и искусственного интеллекта не нужно создавать печатные платы или становиться экспертами по аппаратному обеспечению, чтобы свободно использовать адаптивные вычисления.

Что более удобно, так это то, что инженеры могут не только напрямую вызывать свой существующий программный код через API, но также использовать библиотеки с открытым исходным кодом, предоставляемые экосистемой и поставщиками независимого программного обеспечения (ISV). В библиотеке доступно большое количество ускоренных API .
В качестве примеров возьмем два продукта на базе адаптивных вычислительных платформ - Kria SOM и карты ускорителей Alveo, которые Xilinx выпускает серийно. Kria SOM построен на архитектуре Zynq UltraScale + MPSoC и поддерживает разработчиков в разработке периферийных приложений на адаптивной платформе под ключ. Благодаря стандартизации основных частей системы у разработчиков появляется больше времени, чтобы сосредоточиться на создании дифференцированных функций.
3

Первым серийно выпускаемым продуктом Kria SOM от Xilinx является K26 SOM. Что касается конфигурации оборудования, K26 SOM основан на архитектуре Zynq UltraScale + MPSoC, с общим размером 77 × 60 × 11 мм, оснащенный четырехъядерным рычагом. Процессор A53 и встроенная 64-разрядная память DDR4 объемом 4 ГБ с системной логикой 256K и производительностью процессора AI 1,4TOPS поддерживают видеокодек 4K 60p H.264 / 265.
Kria SOM спроектирован, изготовлен и испытан как готовый к массовому производству продукт, который может выдерживать различные суровые условия эксплуатации. В настоящее время Kria SOM делится на две категории: промышленный сорт и коммерческий сорт. Промышленный сорт поддерживает более высокую вибрацию и более экстремальные температуры, а также классы с более длительным сроком службы и обслуживания.
4

Kria SOM предназначена в основном для приложений интеллектуального зрения. Поэтому ее можно использовать для высокоскоростного обнаружения целей в умных городах, например, для распознавания автомобильных номеров. В то же время ее можно использовать для приложений машинного зрения на промышленных производственных линиях.
Для карты ускорителя Alveo он использует интерфейс PCI-e отраслевого стандарта, который может предоставить возможности аппаратной разгрузки для любого приложения центра обработки данных, а также может использоваться для хранилища SmartSSD для ускорения на точках доступа к хранилищу. Кроме того, его также можно использовать для SmartNIC для непосредственного ускорения сетевого трафика.
Например, Alveo SN1000 SmartNIC, который расширяет диапазон производительности SmartNIC, нацелен на центры обработки данных и периферийные вычислительные платформы, объединяет высокопроизводительные сети, кластеры ЦП и крупномасштабные ПЛИС, а также создает высокопроизводительные вычисления (HPC). значительная функция ускорения сети.
Кроме того, в Alveo SN1000 SmartNIC используется стандартизация и программная среда, нет необходимости напрямую заниматься программированием FPGA, она более удобна в использовании. Инженеры могут использовать Xilinx или сторонние компании для поддержки большей части прошивки, используемой в ПЛИС, и даже программного обеспечения, работающего на кластерах ЦП. Кластер ЦП может работать со стандартными дистрибутивами Linux, такими как Ubuntu и Yocto Linux. Драйвер SmartNIC можно использовать на хост-платформах, таких как Red Hat Enterprise Linux (RHEL), CentOS и Ubuntu.
С точки зрения приложения, Alveo подходит для анализа геномики, графической базы данных, обработки и анализа медицинских изображений, а также приложений для мониторинга изображений на основе видео. Что касается приземления приложений, то уже есть приложения в центрах обработки данных и приложения для секвенирования генов.
5

Technologies

Адаптивные вычисления ускоряют наступление эры программно-определяемого оборудования