您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 稀疏矩阵与矢量乘积运算

  2. CUDA并行算法优秀源码。描述如何利用gpu快速进行稀疏矩阵与矢量乘积运算
  3. 所属分类:其它

    • 发布日期:2011-03-12
    • 文件大小:89kb
    • 提供者:wy_jackey
  1. 《 精通Visual C++数字图像处理典型算法及实现》随书源码

  2. 第1章 Visual C++数字图像编程基础 1 1.1 数字图像处理概述 1 1.2 图像和调色板 2 1.2.1 图像 2 1.2.2 调色板 3 1.2.3 色彩系统 4 1.2.4 灰度图 5 1.3 GDI位图 5 1.3.1 从资源中装入GDI位图 6 1.3.2 伸缩位图 8 1.4 与设备相关位图 10 1.5 设备无关位图(DIB) 15 1.5.1 BMP文件中DIB的结构 16 1.5.2 DIB访问函数 18 1.5.3 构造DIB类 22 1.5.4 使用DIB读写B
  3. 所属分类:C++

    • 发布日期:2014-05-21
    • 文件大小:416kb
    • 提供者:crsupport
  1. GPU高性能运算之CUDA源代码

  2. CUDA编程教学资源,里面含有各种CUDA源码实例,便于学习。
  3. 所属分类:C/C++

    • 发布日期:2014-12-16
    • 文件大小:36mb
    • 提供者:h1264354232
  1. 《 Verilog HDL 程序设计教程》135例,源码

  2. 《 Verilog HDL 程序设计教程》135例; 。【例 3.1】4 位全加器 【例 3.2】4 位计数器 【例 3.3】4 位全加器的仿真程序 【例 3.4】4 位计数器的仿真程序 【例 3.5】“与-或-非”门电路 【例 5.1】用 case语句描述的 4 选 1 数据选择器 【例 5.2】同步置数、同步清零的计数器 【例 5.4】用 initial过程语句对测试变量 A、B、C 赋值 【例 5.5】用 begin-end 串行块产生信号波形 【例 5.6】用 fork-join 并行
  3. 所属分类:硬件开发

    • 发布日期:2015-05-27
    • 文件大小:127kb
    • 提供者:feng1o
  1. ParallelProductStabilizers-源码

  2. 稳定状态的并行高效内部产品 该项目最初是2021年1月11日提交给并行算法MasterMath课程的最终项目。 在这个项目中,我们并行化了与稳定器状态的内积计算相关的一些算法,这是处理经典量子计算机模拟时的常用计算。 该项目基于HJGarcía,IG Markov和AW Cross的文章。 我们的实现与实现之间存在一些差异,因为它们考虑了Pauli文字的( nxn )矩阵,而我们将此矩阵的每一行映射为长度为2n的二进制字符串。 那么每一行都是GF(2)的元素,因此应根据该字段考虑算法期间执行的
  3. 所属分类:其它

    • 发布日期:2021-03-26
    • 文件大小:672kb
    • 提供者:weixin_42139429
  1. CS33Parallel:为了优化而遭受的苦难-源码

  2. CS 33并行实验室 为了优化而遭受的苦难。 学习如何使用OpenMP优化和并行化代码。 如何运行代码: 将文件下载到一个空目录中。 make编译 ./Test运行 make clean以删除除源文件以外的所有内容 代码的作用是: 在main.c中:将3D数组的所有元素初始化为0到999之间的随机值。 在work_it函数中: 对于该3D数组中的每个元素,避免使用原始3D数组/多维数据集的外壳:将元素乘以we_need_the_func()返回的值,然后除以gimmie_the_fun
  3. 所属分类:其它

  1. Balanced-DataParallel:这里是改进了pytorch的DataParallel,使用了平衡第一个GPU的显存使用量-源码

  2. 平衡数据并行 这里是改进了pytorch的DataParallel,使用了平衡第一个GPU的显存使用量 本代码来自transformer-XL: : 代码不是本人写的,但是感觉很好用,就分享一下。 怎么使用: 这个BalancedDataParallel类使用起来和DataParallel类似,下面是一个示例代码: my_net = MyNet() my_net = BalancedDataParallel(gpu0_bsz // acc_grad, my_net, dim=0).cuda
  3. 所属分类:其它

  1. daceml:由DaCe支持的以数据为中心的机器学习-源码

  2. DaceML 由以数据为中心的并行编程提供动力的机器学习。 该项目为DaCe添加了PyTorch和ONNX模型加载支持,SDFG IR添加了ONNX操作员库节点。 通过访问DaCe丰富的转换库和高效的开发环境, DaceML可以生成可在CPU,GPU和FPGA上执行的高效实现。 白盒方法使我们可以看到所有粒度级别的计算:从粗略运算符到内核实现,甚至到每个标量运算和内存访问。 库节点 DaceML通过机器学习运算符扩展了DaCe IR。 添加的节点执行ONNX规范指定的计算。 DaceML利
  3. 所属分类:其它

  1. 并行运算-源码

  2. 并行运算
  3. 所属分类:其它

  1. warp-ctc:快速并行CTC-源码

  2. 经编 在CPU和GPU上快速并行实现CTC。 介绍 主义者的是一种损失函数,可用于对序列数据进行监督学习,而无需在输入数据和标签之间进行对齐。 例如,CTC可用于训练用于,这就是我们在百度的硅谷AI实验室中一直使用的方式。 上图显示了CTC计算输出序列“ THE CAT”的概率,作为可能映射到“ THE CAT”的输入序列的所有可能比对的总和,同时考虑到标签可能会重复,因为它们可能会延伸多个输入数据的时间步长(由图像底部的频谱图表示)。 由于所涉及的组合运算法则,显式地计算所有这些概率的和将是
  3. 所属分类:其它

    • 发布日期:2021-02-28
    • 文件大小:269kb
    • 提供者:weixin_42175516
  1. nessi:非平衡系统模拟软件包-源码

  2. 欢迎使用非平衡系统仿真(NESSi)软件包! 什么是NESSi? NESSi是一个开源软件包,用于处理在Kadanoff-Baym轮廓上定义的非平衡Green函数。 格林函数方法在其与时间有关的公式中是一个通用的框架,用于解决不平衡状态下相互作用的多体问题。 NESSi提供了代表Green函数各种类型的类,在这些函数上实现了基本运算,并允许求解相应的运动方程。 该库旨在研究由时变模型参数引起的初始平衡状态的瞬态动力学。 概述: NESSi提供了用于构造Feynman图和求解Kadanoff
  3. 所属分类:其它

    • 发布日期:2021-02-19
    • 文件大小:663kb
    • 提供者:weixin_42117622
  1. PC:并行计算-源码

  2. 个人电脑 并行运算
  3. 所属分类:其它

    • 发布日期:2021-02-18
    • 文件大小:17mb
    • 提供者:weixin_42139460
  1. 并行运算-源码

  2. 并行运算
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:33mb
    • 提供者:weixin_42175035
  1. 并行计算:使用CUDA C ++实现各种并行计算算法-源码

  2. 并行运算 使用CUDA C ++实现各种并行计算算法 要编译: !nvcc 运行: ./a.out 矩阵乘法与加法 点积的总和 Hillis-Steele扫描 Blelloch扫描 最大尺寸方形子矩阵
  3. 所属分类:其它

  1. LiteQTL.jl-源码

  2. LiteQTL LiteQTL是一个利用GPU的计算能力几乎实时运行全基因组QTL扫描的软件包。 LiteQTL使用新算法,可以对多达一百万个特征进行近实时全基因组QTL扫描。 通过使用易于并行化的运算(包括矩阵乘法,向量化运算和逐元素运算),我们的方法比使用16个线程的R / qtl线性模型基因组扫描快300倍。 纸: 要了解有关使用的方法以及加速技术的更多信息,请参阅我们关于Biorxiv的论文: 切尔西·特罗特(Chelsea Trotter),金贤eon(Hyeonju Kim)
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:47mb
    • 提供者:weixin_42128963
  1. SkMMag:计算二维晶格中自旋的时间演化-源码

  2. Skytomion原子动力学 作者:Amel Derras-Chouk 该存储库中的代码通过评估每个晶格位置处的Landau-Lifshitz-Gilbert方程来计算二维晶格中磁矩的演变。 代码用Julia 1.0.4编写。 所需的库: HDF5(用于以.h5格式保存文件。) FFTW(用于计算偶极-偶极相互作用的傅立叶变换包)。 PaddedViews(也用于计算偶极-偶极相互作用)。 LinearAlgebra(用于矢量运算。) 分布式(并行化) 背景 编写该代码的目的是研究
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:213kb
    • 提供者:weixin_42113552
  1. vectorbt:Python库,用于大规模回测和分析交易策略-源码

  2. 向量 vectorbt是一个针对类固醇的回测库-它完全在熊猫和NumPy对象上运行,并由加速以快速,大规模地分析交易策略 :fire: 与传统库相反,vectorbt将交易数据表示为nd-arrays。 这样可以使用NumPy的矢量化运算和Numba的非矢量化但编译运算实现超快速计算。 它还集成了和以在Jupyter笔记本中显示类似于Tableau的复杂图表和仪表板。 由于具有高性能,即使没有GPU和并行化(两者都在进行中),vectorbt仍能够处理大量数据,并且使用户能够与需要大量数据的
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:60mb
    • 提供者:weixin_42157188
  1. QuickRef:快速参考有关特定主题的注释及其基本介绍-源码

  2. 广泛使用的框架和概念的快速参考 该存储库仍在开发中,但是其主要目的是提供对应用程序中广泛使用的现有框架和概念的快速浏览。 请注意,这些文件只是其中的实际内容的一瞥。 请参考所提供的链接以获取有关其的详细说明。 提供的链接是内容的来源,而这些说明仅在其中总结了关键概念。 构架: Docker和Docker Swarm Kubernetes Apache生态系统的大数据 Golang介绍 NodeJS中的示例 论文摘要 概念: 计算机网络 机器学习 操作系统 数据分析 异构并行 编译器设计 云
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:16mb
    • 提供者:weixin_42149145
  1. CNTK:Microsoft认知工具包(CNTK),一种开源的深度学习工具包-源码

  2. CNTK 聊天室 Windows构建状态 Linux构建状态 Microsoft认知工具包( )是一个统一的深度学习工具包,它通过有向图将神经网络描述为一系列计算步骤。 在此有向图中,叶节点表示输入值或网络参数,而其他节点则表示对其输入的矩阵运算。 CNTK允许用户轻松实现和组合流行的模型类型,例如前馈DNN,卷积网(CNN)和递归网络(RNN / LSTM)。 它实现了随机梯度下降(SGD,错误反向传播)学习,并在多个GPU和服务器之间实现了自动区分和并行化。 自2015年4月以来,CN
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:190mb
    • 提供者:weixin_42122988
  1. KaHIP:图分区框架KaHIP-Karlsruhe高品质分区-源码

  2. KaHIP v3.10 图分区框架KaHIP-Karlsruhe高质量分区。 图分区问题要求将图的节点集划分为k个相等大小的块,以使在块之间延伸的边的数量最小化。 KaHIP是一系列图形分区程序。 它包括KaFFPa(卡尔斯鲁厄快速流分区程序),这是一种多级图分区算法,其变体Strong,Eco和Fast,KaFFPaE(KaFFPaEvolutionary)是一种并行进化算法,使用KaFFPa提供组合和变异操作, KaBaPE扩展了进化算法。 此外,还包括专门的技术来划分道路网络(Buff
  3. 所属分类:其它

« 12 3 »