Hardware Aware

Hardware-aware research focuses on designing and optimizing machine learning models and algorithms for specific hardware platforms, aiming to maximize efficiency (speed, energy consumption, memory usage) without sacrificing accuracy. Current efforts concentrate on large language models (LLMs), graph neural networks (GNNs), and deep neural networks (DNNs), employing techniques like neural architecture search (NAS) and hardware performance prediction to achieve optimal mappings between model architectures and hardware capabilities. This field is crucial for deploying computationally intensive AI applications on resource-constrained devices like edge computers and mobile phones, enabling broader accessibility and reducing the environmental impact of AI.

Papers

December 25, 2024

Recommending Pre-Trained Models for IoT Devices
Parth V. Patil, Wenxin Jiang, Huiyun Peng, Daniel Lugo, Kelechi G. Kalu, Josh LeBlanc, Lawrence Smith, Hyeonwoo Heo, Nathanael Aou, James C. Davis
Pre Trained Model Internet of Thing Device Resource Constrained Hardware Aware Hardware Design Optimization

November 5, 2024

P-MOSS: Learned Scheduling For Indexes Over NUMA Servers Using Low-Level Hardware Statistics
Yeasir Rayhan, Walid G. Aref
Resource Allocation Task Scheduling Coreset Size Hardware Aware Index Decomposition

October 6, 2024

Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective
Jinhao Li, Jiaming Xu, Shan Huang, Yonghua Chen, Wen Li, Jun Liu, Yaoxiu Lian, Jiayi Pan, Li Ding, Hao Zhou, Guohao Dai
LLM Inference Generative LLM Inference Performance Hardware Aware

September 9, 2024

Normalizing Energy Consumption for Hardware-Independent Evaluation
Constance Douwes, Romain Serizel
Machine Learning Power Consumption Adaptive Normalization Normalization Technique Hardware Aware

August 23, 2024

HGNAS: Hardware-Aware Graph Neural Architecture Search for Edge Devices
Ao Zhou, Jianlei Yang, Yingjie Qi, Tong Qiao, Yumeng Shi, Cenlin Duan, Weisheng Zhao, Chunming Hu
Edge Device Memory Efficient GNN Training GNN Framework Hardware Aware Graph Neural Architecture Search

May 16, 2024

HW-GPT-Bench: Hardware-Aware Architecture Benchmark for Language Models
Rhea Sanjay Sukthanker, Arber Zela, Benedikt Staffler, Aaron Klein, Lennart Purucker, Joerg K.H. Franke, Frank Hutter
Language Model Neural Architecture Search Surrogate Model Hardware Aware

March 3, 2024

MATADOR: Automated System-on-Chip Tsetlin Machine Design Generation for Edge Applications
Tousif Rahman, Gang Mao, Sidharth Maheshwari, Rishad Shafik, Alex Yakovlev
Field Programmable Gate Array Hardware Aware Edge Application SoC FPGA

January 20, 2024

PartIR: Composing SPMD Partitioning Strategies for Machine Learning
Sami Alabed, Daniel Belov, Bart Chrzaszcz, Juliana Franco, Dominik Grewe, Dougal Maclaurin, James Molloy, Tom Natan, Tamara Norman, Xiaoyue Pan, Adam Paszke, Norman A. Rink, Michael Schaarschmidt, Timur Sitdikov, Agnieszka Swietlik, Dimitrios Vytiniotis, Joel Wee
Machine Learning Large Scale Different PaRT Hardware Aware Parallelization Strategy Table Sharding

December 5, 2023

A Hardware Evaluation Framework for Large Language Model Inference
Hengrui Zhang, August Ning, Rohan Prabhakar, David Wentzlaff
LLM Inference Large Language Model Inference Hardware Aware Efficient Hardware

November 19, 2023

LifeLearner: Hardware-Aware Meta Continual Learning System for Embedded Computing Platforms
Young D. Kwon, Jagmohan Chauhan, Hong Jia, Stylianos I. Venieris, Cecilia Mascolo
Continual LEArning Embedded System Hardware Aware Meta Continual Learning

November 7, 2023

Hardware Aware Evolutionary Neural Architecture Search using Representation Similarity Metric
Nilotpal Sinha, Abd El Rahman Shabayek, Anis Kacem, Peyman Rostami, Carl Shneider, Djamila Aouada
Neural Architecture Search Representational Similarity Hardware Aware Hardware Aware Neural Architecture Search Differentiable Na

August 25, 2023

TpuGraphs: A Performance Prediction Dataset on Large Tensor Computational Graphs
Phitchaya Mangpo Phothilimthana, Sami Abu-El-Haija, Kaidi Cao, Bahare Fatemi, Mike Burrows, Charith Mendis, Bryan Perozzi
Hardware Aware Graph Property Prediction Tensor Graph

June 8, 2023

Precision-aware Latency and Energy Balancing on Multi-Accelerator Platforms for DNN Inference
Matteo Risso, Alessio Burrello, Giuseppe Maria Sarda, Luca Benini, Enrico Macii, Massimo Poncino, Marian Verhelst, Daniele Jahier Pagliari
Low Latency Hardware Accelerator DNN Inference Hardware Aware Multi Accelerator Heterogeneous System on Chip

November 13, 2022

HigeNet: A Highly Efficient Modeling for Long Sequence Time Series Prediction in AIOps
Jiajia Li, Feng Tan, Cheng He, Zikai Wang, Haitao Song, Lingfei Wu, Pengwei Hu
Performance Metric Long Range Dependency Efficient Model Data Driven Decision Hardware Aware AIOps Model

August 26, 2022

Hardware-aware mobile building block evaluation for computer vision
Maxim Bonnaerens, Matthias Freiberger, Marian Verhelst, Joni Dambre
Neural Network Computer Vision Hardware Aware Machine Learning Accelerator

May 31, 2022

MAD-EN: Microarchitectural Attack Detection through System-wide Energy Consumption
Debopriya Roy Dipta, Berk Gulmezoglu
Anomaly Detection Detection Method Hardware Aware Mad Icp

May 19, 2022

A Hardware-Aware Framework for Accelerating Neural Architecture Search Across Modalities
Daniel Cummings, Anthony Sarah, Sharath Nittur Sridhar, Maciej Szankin, Juan Pablo Munoz, Sairam Sundaresan
Neural Architecture Search Task Specific Different Modality Hardware Aware Super Network Training Sub Network

April 27, 2022

MAPLE-Edge: A Runtime Latency Predictor for Edge Devices
Saeejith Nair, Saad Abbasi, Alexander Wong, Mohammad Javad Shafiee
Edge Device Low Latency Hardware Aware Latency Prediction Latency Predictor

February 25, 2022

A Hardware-Aware System for Accelerating Deep Neural Network Optimization
Anthony Sarah, Daniel Cummings, Sharath Nittur Sridhar, Sairam Sundaresan, Maciej Szankin, Tristan Webb, J. Pablo Munoz
Neural Network Neural Architecture Search Hardware Aware Super Network Training

January 5, 2022

Comprehensive Efficiency Analysis of Machine Learning Algorithms for Developing Hardware-Based Cybersecurity Countermeasures
Darren Cobian
Machine Learning Algorithm Malware Classification Hardware Aware Novel Malware Malware Sample Hardware Attack Envelopment Analysis

Hardware Aware

Papers

Recommending Pre-Trained Models for IoT Devices

P-MOSS: Learned Scheduling For Indexes Over NUMA Servers Using Low-Level Hardware Statistics

Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective

Normalizing Energy Consumption for Hardware-Independent Evaluation

HGNAS: Hardware-Aware Graph Neural Architecture Search for Edge Devices

HW-GPT-Bench: Hardware-Aware Architecture Benchmark for Language Models

MATADOR: Automated System-on-Chip Tsetlin Machine Design Generation for Edge Applications

PartIR: Composing SPMD Partitioning Strategies for Machine Learning

A Hardware Evaluation Framework for Large Language Model Inference

LifeLearner: Hardware-Aware Meta Continual Learning System for Embedded Computing Platforms

Hardware Aware Evolutionary Neural Architecture Search using Representation Similarity Metric

TpuGraphs: A Performance Prediction Dataset on Large Tensor Computational Graphs

Precision-aware Latency and Energy Balancing on Multi-Accelerator Platforms for DNN Inference

HigeNet: A Highly Efficient Modeling for Long Sequence Time Series Prediction in AIOps

Hardware-aware mobile building block evaluation for computer vision

MAD-EN: Microarchitectural Attack Detection through System-wide Energy Consumption

A Hardware-Aware Framework for Accelerating Neural Architecture Search Across Modalities

MAPLE-Edge: A Runtime Latency Predictor for Edge Devices

A Hardware-Aware System for Accelerating Deep Neural Network Optimization

Comprehensive Efficiency Analysis of Machine Learning Algorithms for Developing Hardware-Based Cybersecurity Countermeasures