Edge AI Nereye Gidiyor? CIM, Nöromorifk Çipler ve On-Device Training — 2026 Araştırma Derlemesi / Where is Edge AI Heading? CIM, Neuromorphic Chips & On-Device Training — 2026 Research Review

akiferdem · June 6, 2026, 8:57am

https://www.mdpi.com/2072-666X/17/5/586

Genel Bakış

Yazar: Zhaoyun Zhang (DongGuan University of Technology)
Dergi: MDPI Micromachines, Cilt 17, Sayı 5 — Mayıs 2026
DOI: 10.3390/mi17050586
Erişim: Açık Erişim (Creative Commons CC BY)

Bu makale, 2023 yılında yayımlanan “Gömülü Yapay Zeka Araştırmaları” derlemesinin devamı niteliğinde olup 2023–2026 yılları arasındaki temel gelişmeleri sistematik biçimde ele alıyor. Gömülü AI’nın bu dönemde “teknik olarak mümkün” aşamasından “büyük ölçekli dağıtıma” geçişini belgeliyor.

Makalenin Kapsadığı Dört Ana Katman

Donanım Hızlandırma: Von Neumann dışı mimariler öne çıkıyor — bellek-içi hesaplama (Compute-in-Memory, CIM), nöromorifk çipler (SNN tabanlı), RRAM/PCM/FeRAM tabanlı bellek ortamları ve 3D heterojen entegrasyon. Bunların yanı sıra fotonik hesaplama ve kuantum-ilhamlı donanımlar araştırma gündemi olarak beliriyor.
Model Hafifletme: Statik sıkıştırmadan dinamik adaptasyona geçiş yaşanıyor. LLaMA, CLIP, diffusion modelleri gibi büyük modellerin edge’e taşınması; karışık-hassasiyet kuantizasyon, bilgi damıtma ve NAS (sinir mimarisi arama) ile mümkün hale geliyor. FPGA üzerinde çalışan kararlı diffusion modeli örneğinde ARM CPU’ya kıyasla 97.3× hız artışı elde edildiği raporlanıyor.
Dağıtım Paradigmaları: Bulut merkezli eğitimden “uç-bulut işbirliğine” geçiş. Cihaz üzerinde tam eğitim (on-device training), federated edge learning ve blokzincir entegrasyonlu gizlilik-koruyucu modeller tartışılıyor.
Uygulama Alanları: Endüstriyel IoT, giyilebilir sağlık, otonom araçlar, akıllı tarım ve cisimleşik zeka (embodied intelligence / robotik) için “algı–karar–eylem” boru hattı somut örneklerle açıklanıyor.

Öne Çıkan Teknik Bulgular

RRAM tabanlı CIM çip: 1.982 TOPS/W/bit enerji verimliliği — geleneksel ASIC’e kıyasla 1–2 büyüklük mertebesi iyileşme
PAICORE nöromorifk işlemci: 5.181 TSOP/W verimlilik, SNN + ANN + STDP öğrenmeyi tek çipte birleştiriyor
Raspberry Pi 5 üzerinde sıfır-atış yangın tespiti: 2.239 FPS (0,45 ms gecikme), 0,36 MB model boyutu

Dört Gelecek Araştırma Yönü

Aşırı senaryolar için ultra-düşük güç tasarımı (endüstriyel yüksek ısı, dış mekan)
Çok satıcılı cihazlar arasında çapraz-platform standardizasyonu
Edge tarafı veri güvenliği ve gizliliği
Karmaşık dinamik ortamlarda model sağlamlığı

T3 Gemstone ile Bağlantısı

TI AM67A tabanlı geliştirme kartımız; NPU hızlandırma, BSP geliştirme ve Linux üzerinde edge AI dağıtımı konularında doğrudan bu makalede ele alınan mimari katmanlarla örtüşüyor. Özellikle “algoritma–donanım eş tasarımı” ve “BSP-aware deployment” kavramları platform geliştirme süreçlerimiz için pratik çerçeve sunuyor.

Overview

Author: Zhaoyun Zhang (DongGuan University of Technology, China)
Journal: MDPI Micromachines, Vol. 17, Issue 5 — May 2026
DOI: 10.3390/mi17050586
Access: Open Access (Creative Commons CC BY)

This paper is a continuation of the 2023 “Review of Embedded AI Research” and systematically surveys core advances from 2023 to 2026, documenting embedded AI’s transition from “technically feasible” to “large-scale deployment”.

Four Layers Covered

Hardware Acceleration: Non-von Neumann architectures take center stage — Compute-in-Memory (CIM), neuromorphic chips (SNN-based), RRAM/PCM/FeRAM storage media, and 3D heterogeneous integration. Photonic and quantum-inspired hardware emerge as longer-horizon research directions.
Model Lightweighting: The shift from static compression to dynamic adaptation. Large models such as LLaMA, CLIP, and diffusion models are brought to the edge via mixed-precision quantization, knowledge distillation, and hardware-aware NAS. A stable diffusion model on FPGA achieves a reported 97.3× speedup over an ARM Cortex-A53 CPU.
Deployment Paradigms: The move from cloud-centric training to “edge-cloud collaboration.” Full on-device training, federated edge learning with blockchain integration, and three-tier “cloud–edge–device” cooperative intelligence are discussed.
Application Domains: The “perception–decision–execution” pipeline is illustrated across industrial IoT, wearable healthcare, autonomous driving, smart agriculture, and embodied intelligence (robotics).

Selected Technical Highlights

RRAM-based CIM chip: 1,982 TOPS/W/bit energy efficiency — 1–2 orders of magnitude improvement over traditional ASICs
PAICORE neuromorphic processor: 5.181 TSOP/W, unifying SNN, ANN, and on-chip STDP learning on a single die
Zero-shot fire detection on Raspberry Pi 5: 2,239 FPS (0.45 ms latency), 0.36 MB model size

Four Proposed Research Directions

Ultra-low-power design for extreme environments (industrial heat, outdoor low-power)
Cross-platform standardization across multi-vendor devices
Edge-side data security and privacy
Model robustness in complex dynamic environments

Relevance to T3 Gemstone

The T3 Gemstone O1, built around the TI AM67A with an integrated NPU, sits squarely within the architectural layers this paper addresses — BSP development, heterogeneous acceleration, and on-device AI deployment on embedded Linux. The paper’s emphasis on algorithm–hardware co-design and BSP-aware deployment frameworks directly maps to challenges in bringing AI workloads to the platform.

Full paper (Open Access): https://www.mdpi.com/2072-666X/17/5/586
PDF: https://www.mdpi.com/2072-666X/17/5/586/pdf