您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 用GPU 加速求解线性方程组的高斯消元法

  2. 提出了应用图形处理器(GPU) 加速求解线性方程组的高斯消元法,用二维四通道纹理表示系数矩阵与常数向量构 成的矩阵,在该矩阵内完成归一化、消元等操作。提出了新的纹理缩减算法,该算法不要求纹理的边长是2 的幂,把该纹理算 法应用于高斯消元法的列主元搜索和确定主元行号。根据这些算法,使用OpenGL 着色语言编程,用图形处理器实现加速求 解线性方程组的高斯消元法,运算时间与基于CPU的算法比较,随着方程组未知量数量增多,基于GPU的算法具有较快的运 算速度,证实图形处理器能加速线性方程组的求解。
  3. 所属分类:其它

    • 发布日期:2010-01-24
    • 文件大小:196608
    • 提供者:nulng
  1. 稀疏矩阵与矢量的乘法

  2. 优化GPU的CSR稀疏矩阵与矢量的乘法加速提高加速比
  3. 所属分类:其它

    • 发布日期:2010-03-18
    • 文件大小:91136
    • 提供者:wangzhuowei
  1. 用CUDA编写的矩阵加法程序

  2. 在CUDA环境下编写的矩阵乘法程序,能够在GPU上运行,并得到加速。
  3. 所属分类:其它

    • 发布日期:2011-03-18
    • 文件大小:2048
    • 提供者:WANGYANYANGLIN
  1. 用gpu实现矩阵相乘,加速比达500

  2. 用GPU实现两矩阵相乘,与串行算法相比,加速比达到了500多。
  3. 所属分类:C/C++

    • 发布日期:2011-08-19
    • 文件大小:5120
    • 提供者:jingjie_111
  1. Atiken加速迭代 代码

  2. 矩阵与数值分析 第3章 Atiken加速法迭代程序
  3. 所属分类:C/C++

    • 发布日期:2012-03-12
    • 文件大小:661
    • 提供者:jaguarcxj
  1. C++矩阵乘优化程序

  2. 实现功能 1.C语言实现矩阵x向量算法 2.矩阵要求CSR压缩存储格式,测试集选用佛罗里达州立大学测试集 http://www.cise.ufl.edu/research/sparse/matrices// 3.SSE优化,LOOP unrolling,software prefetch软件预取,多线程并行 4.给出测试界面,运行时间及加速比结果 实验环境 操作系统(开发):Windows 7/Windows XP 编程软件(开发):Microsoft Visual Studio 2008
  3. 所属分类:C/C++

    • 发布日期:2013-03-11
    • 文件大小:3145728
    • 提供者:liubin_09
  1. cpu版矩阵乘法和cuda矩阵乘法 GPU加速

  2. 此程序是关于矩阵乘法的,有cuda矩阵乘法和cpu矩阵乘法的对比,可以作为参考
  3. 所属分类:C

    • 发布日期:2013-11-21
    • 文件大小:3145728
    • 提供者:yexuannan
  1. 并行处理实验报告:基于MPI实现的矩阵乘法的性能分析

  2. 并行处理实验报告:基于MPI实现的矩阵乘法的性能分析。里面包含MPI实现代码,稠密矩阵以及稀疏矩阵的加速比分析
  3. 所属分类:C++

    • 发布日期:2014-01-12
    • 文件大小:114688
    • 提供者:cz2009022107
  1. GPU并行加速矩阵乘法

  2. GPU并行加速矩阵乘法,有详细的程序、结果及分析
  3. 所属分类:C/C++

    • 发布日期:2014-12-01
    • 文件大小:793600
    • 提供者:woshifengsenlin
  1. python 使用矩阵加速计算斐波那契数列第N项

  2. 使用python实现的的计算线性齐次递推数列第N项的算法
  3. 所属分类:Python

    • 发布日期:2015-05-21
    • 文件大小:2048
    • 提供者:aaaxingruiaaa
  1. 基于改进加速鲁棒特征的井下视频拼接算法

  2. 针对加速鲁棒特征算法用于井下视频拼接时实时性不高的问题,通过降低特征点维度和仅在感兴趣区域提取特征点来改进加速鲁棒特征算法,在此基础上提出了一种井下视频拼接算法。首先,利用改进的加速鲁棒特征算法提取视频图像特征点;然后,动态追踪特征点数量,若非首帧图像特征点数量变化超过阈值,则重新进行特征点配准、提纯,以及投影变换矩阵计算及存储处理,否则采用前一帧图像所得的投影变换矩阵;最后,采用渐入渐出加权平均法进行图像融合处理,完成视频拼接。实验结果表明,基于改进加速鲁棒特征的井下视频拼接算法实时性高,拼接
  3. 所属分类:其它

    • 发布日期:2020-05-13
    • 文件大小:1048576
    • 提供者:weixin_38699613
  1. 浅谈矩阵加速.pdf

  2. 这个是矩阵加速的文章 最新版,下载 感谢支持,有题目详解
  3. 所属分类:C/C++

    • 发布日期:2020-04-07
    • 文件大小:441344
    • 提供者:woshidalaocxy
  1. 浅谈矩阵加速.pdf

  2. 矩阵快速幂的详解文章
  3. 所属分类:C/C++

    • 发布日期:2020-04-07
    • 文件大小:271360
    • 提供者:woshidalaocxy
  1. 求解双曲方程的隐式差分方程的加速并行迭代法

  2. 求解双曲方程的隐式差分方程的加速并行迭代法,郭瑜超,,本文主要研究双曲方程隐式差分格式并行迭代的加速方法,算法改进了分裂矩阵的方法,提高了迭代的收敛速度。理论分析证明了它的收
  3. 所属分类:其它

    • 发布日期:2019-12-29
    • 文件大小:229376
    • 提供者:weixin_38551143
  1. 在不加速的情况下实现100%的吞吐量以实现集成的单播和多播流量

  2. 随着高速交换器规模的扩大,旨在实现多播调度的100%吞吐量的虚拟队列的无限加速和指数增长需求,也解决了非加速或固定交叉点缓冲区大小下多播的低吞吐量问题。 受到负载均衡两阶段Birkhoff-von Neumann架构的启发,该架构可为各种单播流量提供100%的吞吐量,这是一种新颖的3阶段架构,包括用于多播扇出拆分的第一阶段,用于负载的第二阶段平衡,并提出了切换的最后阶段(FSLBS)。 第一阶段开发了专用的多播扇出拆分为单播(M2U)调度算法,而后两阶段的调度算法采用周期置换矩阵。 FSLBS可
  3. 所属分类:其它

    • 发布日期:2020-06-05
    • 文件大小:285696
    • 提供者:weixin_38631282
  1. 在Lorentz集团的李代数中沿世界线及其关联矩阵使用Tangent Boost

  2. 为了将提升的相对论概念推广到非惯性粒子和广义相对论的情况,我们仔细研究了Lorentz矩阵的Lie群及其Lie代数的定义,并研究了该群在Minskowski空间上的作用。 因此,我们定义了沿世界线的切线增强的概念。 这个非常笼统的概念在狭义相对论(对于非惯性粒子或/和非直线坐标系)和广义相对论中都提供了有用的工具。 我们还介绍了李代数矩阵,它与切线加速一起给出了所考虑系统的整体动力学描述(加速度和托马斯旋转)。 在研究了Lie代数矩阵的性质及其简化形式之后,我们证明了特殊Lorentz矩阵的Li
  3. 所属分类:其它

    • 发布日期:2020-06-04
    • 文件大小:672768
    • 提供者:weixin_38695751
  1. PYNQ-Z2矩阵乘法加速.rar

  2. 文件为PYNQ-Z2板实现矩阵乘法加速所需文件,详细操作流程可见博客:https://blog.csdn.net/qq_42334072/article/details/106769534
  3. 所属分类:硬件开发

    • 发布日期:2020-06-15
    • 文件大小:235520
    • 提供者:qq_42334072
  1. 基于云平台的矩阵分解协同过滤算法在煤炭销售系统中的研究

  2. 协同过滤技术被广泛地应用在推荐系统中。随着电子商务的快速发展,煤炭产业也引进了电子销售系统。近年来,矩阵分解的协同过滤算法得到了煤炭销售系统的广泛应用。但是,随着互联网的快速发展,煤炭电子销售记录呈现指数级增长,传统的基于矩阵分解的协同聚类算法不能有效、快速地完成销售系统的推荐工作。文章针对大规模煤炭数据推荐工作,提出了分布式矩阵分解协同过滤算法,该算法基于云计算平台,能够分布式、高效地完成推荐系统的推荐工作。通过实验结果进一步展示了本算法与传统协同过滤算法相比,具有很高的加速比以及很好的可扩展
  3. 所属分类:其它

    • 发布日期:2020-07-07
    • 文件大小:1048576
    • 提供者:weixin_38726007
  1. MaliT604 GPU的二维浮点矩阵运算并行优化方法

  2. 基于以三星的Exynos5250处理器为核心的Arndale Board嵌入式开发平台,对集成于处理器上的MaliT604嵌入式GPU的GPGPU(GeneralPurpose computation on GPU)技术进行研究,并对不同运算规模的浮点矩阵乘法进行并行加速优化,提供实际测试结果。
  3. 所属分类:其它

    • 发布日期:2020-07-26
    • 文件大小:108544
    • 提供者:weixin_38597300
  1. 基于FPGA加速的卷积神经网络识别系统

  2. 针对卷积神经网络(CNN)在通用CPU以及GPU平台上推断速度慢、功耗大的问题,采用FPGA平台设计了并行化的卷积神经网络推断系统。通过运算资源重用、并行处理数据和流水线设计,并利用全连接层的稀疏性设计稀疏矩阵乘法器,大大提高运算速度,减少资源的使用。系统测试使用ORL人脸数据库,实验结果表明,在100 MHz工作频率下,模型推断性能分别是CPU的10.24倍,是GPU的3.08倍,是基准版本的1.56倍,而功率还不到2 W。最终在模型压缩了4倍的情况下,系统识别准确率为95%。
  3. 所属分类:其它

    • 发布日期:2020-10-15
    • 文件大小:410624
    • 提供者:weixin_38701312
« 12 3 4 5 6 7 8 9 10 »