翻译的NVDLA 加速引擎的文档,学习交流,一块进步!PU
cPU
Microcontroller
DRAM
AVULA
NVD_A
DODI
SFAMI
Small NVDLA system
Large"NVDLA system
小NDLA模型
小型 NVDLA模型在以前不可行的领域开辟了深度学习技术。此模型非常适合对成本因素
比较敏感的物联网(IoT)类设备、A丨以及面向自动化的系统领域。这些系统具有明确的应
用方向,其成本、面积和功率是主要注意事项。通过N√DLA可配置实现资源节约(在成本
基于CUDA技术的卷积神经网络识别算法For idy=l To n Do
浮点运算能力表现平稳,呈线性态势。
使用共享存備器( shared memory)收集数据
Thread[idx*pitch+]i1 FMi[e(idx, idy)]=( shared double)
4039
result:
End for
x烂
2.0358
(2)算法结束
1.772
43识别分类算法DCL
识别分类算法DCL如下
(1)Fori1 To nxn do(并行地)
在 Device的共享内存内初始化分类