基于CUDA技术的卷积神经网络识别算法For idy=l To n Do
浮点运算能力表现平稳,呈线性态势。
使用共享存備器( shared memory)收集数据
Thread[idx*pitch+]i1 FMi[e(idx, idy)]=( shared double)
4039
result:
End for
x烂
2.0358
(2)算法结束
1.772
43识别分类算法DCL
识别分类算法DCL如下
(1)Fori1 To nxn do(并行地)
在 Device的共享内存内初始化分类
问题
你需要对浮点数执行精确的计算操作,并且不希望有任何小误差的出现。
解决方案
浮点数的一个普遍问题是它们并不能精确的表示十进制数。 并且,即使是最简单的数学运算也会产生小的误差,比如:
>>> a = 4.2
>>> b = 2.1
>>> a + b
6.300000000000001
>>> (a + b) == 6.3
False
>>>
这些错误是由底层CPU和IEEE 754标准通过自己的