您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. cuda_cudpp源码

  2. cudpp是gpgpu下面的一个开源工程,集合了最基本的算法,比如排序之类的,当然电脑上面必须有支持cuda的GPU 做GPGPU的强烈建议看一下。。 另外,强烈鄙视资源分不是0的资源上传者!!
  3. 所属分类:其它

    • 发布日期:2008-12-19
    • 文件大小:2097152
    • 提供者:c_jwx
  1. gpgpu:通用GPU实验室(CUDA)-源码

  2. gpgpu 通用GPU实验室(CUDA)
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:1024
    • 提供者:weixin_42127937
  1. gpgpu-源码

  2. gpgpu
  3. 所属分类:其它

    • 发布日期:2021-03-10
    • 文件大小:93184
    • 提供者:weixin_42128988
  1. 闪存:LSH-GPU ANN程序包-源码

  2. 闪光 FLASH(使用HPC加速的相似搜索的快速LSH算法)是用于稀疏向量的大规模近似最近邻搜索的库。 它目前可用C ++进行CPU并行计算,并支持启用OpenCL的GPGPU计算。 有关理论和基准测试的详细信息,请参见。 **即将推出:**稀疏数据集上的完整GPU ANNS,可提供比当前基准测试更高的速度。 重现性 要在论文中重现准确的结果,请参见根文件夹中reproducibility.pdf中的详细步骤。 表现 我们测试我们的系统在几个大型数据集,疏,包括, 和 。 质量计量学 R k
  3. 所属分类:其它

    • 发布日期:2021-03-01
    • 文件大小:416768
    • 提供者:weixin_42122340
  1. webdnn:Web浏览器上最快的DNN运行框架-源码

  2. WebDNN:Web浏览器上最快的DNN执行框架 WebDNN是一个开源软件框架,用于在Web浏览器上执行深度神经网络(DNN)预训练模型。 WebDNN可以执行通过遵循Web浏览器上的深度学习框架训练的DNN模型。 ( v1.2.0 - v1.4.0 ) ( v2.1.3 ) ( v0.3.0 - v0.4.1 ) ( v1.23.0 - v4.0.0 ) 为什么需要WebDNN? 深度神经网络(DNN)在许多应用中得到越来越多的关注。 但是,它需要大量的计算资源,并且有许多巨
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:6291456
    • 提供者:weixin_42157166
  1. GPGPU_Sim-Enabled-Turing-WMMA-API:当前(2020.12)的GPGPU-Sim支持多达第一代NVIDIA张量内核。 此发行版包括最多支持第二代张量核心(Turing arch)的模拟器-源码

  2. 抽象的 这是我的本科学位论文库,具有实验功能的NVIDIA Turing体系结构建模Tensor核心微体系结构。 在这项研究中,提出了图灵架构中的Tensor Core的微体系结构。 由于NVIDIA没有公开张量核心的内部,因此有必要通过微基准测试进行剖析。 在先前的研究中也已经剖析了NVIDIA GPU。 但是,并没有透露有关Turing体系结构的实验特性,即INT4(int 4位)操作模式和B1(二进制1位)操作模式。 在这项研究中分析了所有这些功能。 档案结构 基准每个目录代表每个数据类型
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:299892736
    • 提供者:weixin_42117116
  1. grunnur:PyCuda和PyOpenCL的统一接口-源码

  2. Grunnur,GPGPU的基础层 名字叫什么 “ Grunnur”在冰岛语中的意思是“基金会”。 它有什么作用? Grunnur是和之上的一薄层,使编写与平台无关的程序更加容易。 它是一个经过改进的cluda的子模块 ,提取到一个独立的模块。 警告:当前版本不是很稳定,公共API可能会发生变化,因为我正在从Reikna转移功能并将其扩展为支持多GPU配置。 我们欢迎您报告错误,尤其是关于公共API的任何建议。 主要特点 在大多数情况下,允许编写与平台无关的代码。 简单使用多个GPU(特别
  3. 所属分类:其它

    • 发布日期:2021-02-16
    • 文件大小:130048
    • 提供者:weixin_42181319
  1. glcompute-源码

  2. glcompute 使用WebGL在浏览器中进行GPGPU(通用GPU)计算。 这主要是为运行gpu片段着色器程序而设计的,这些程序在一层或多层空间分布状态下运行(例如2D物理模拟或细胞自动机)。 它还将增长到包括对大型一维数据阵列执行操作(通过转换反馈以及对片段着色器实现的回退)。 该库支持直接渲染到屏幕。 它还具有一些内置实用程序,例如仅在屏幕边界或指定区域(用于处理鼠标/触摸事件)上运行程序。 该库是为WebGL 2.0(如果有)而设计的,具有支持WebGL 1.0的后备功能-因此它应
  3. 所属分类:其它

    • 发布日期:2021-02-13
    • 文件大小:71680
    • 提供者:weixin_42106357
  1. pentoo-overlay:安全工具的Gentoo叠加层以及Pentoo Livecd的核心-源码

  2. Pentoo渗透测试叠加 Gentoo叠加层用于安全工具以及Pentoo Livecd的核心 Pentoo是Live CD和Live USB,用于渗透测试和安全评估。 Pentoo基于Gentoo Linux,提供32位和64位可安装livecd。 Pentoo还可以作为现有Gentoo安装的覆盖图。 它具有数据包注入修补的wifi驱动程序,GPGPU破解软件以及用于渗透测试和安全评估的许多工具。 Pentoo内核包括grsecurity和PAX强化以及额外的补丁-二进制文件由强化的工具链编译
  3. 所属分类:其它

    • 发布日期:2021-02-12
    • 文件大小:5242880
    • 提供者:weixin_42099087
  1. tinygrad通用-源码

  2. Tinygrad与Cuda / OpenCL 基于 环境变量: GPU-0/1-使用GPU作为默认设备 GPAPI-'cuda'/'opencl' -GPGPU API 检测结果:
  3. 所属分类:其它

    • 发布日期:2021-02-11
    • 文件大小:76800
    • 提供者:weixin_42144199
  1. gpgpu-rs:一个基于OpenCL的简单GPU计算库-源码

  2. 加油站 一个基于OpenCL的简单GPU计算库。 开发正在进行中。 可以随意进行实验,但是请记住,gpgpu-rs可能不够稳定,无法用于生产目的。 可以执行示例cargo run --example [name] 。 例如: cargo run --example random 产品特点 意见和文件 全球: 内核 算法 功能 文件加载(CPU) 文件加载(GPU)的最大元素:8192 文件加载插值(不包括极值) 巨大的文件加载(GPU) 序列化/反序列化内核和函数 整合
  3. 所属分类:其它

    • 发布日期:2021-02-10
    • 文件大小:43008
    • 提供者:weixin_42099936
  1. 多GPU-源码

  2. 开始之前在setup_environment文件中修改$ GPGPUSIM_ROOT。 确保$ CUDA_INSTALL_PATH设置为正确的路径。 export CUDA_INSTALL_PATH=/usr/local/cuda-4.0 建立 make make 因为对头文件的依赖关系检查尚未完成,所以请清理; 如果头文件被修改,则必须运行。 跑步 source setup_environment ./multikernel-sim -l launcher.config -g gpgpus
  3. 所属分类:其它

    • 发布日期:2021-02-07
    • 文件大小:346030080
    • 提供者:weixin_42139252
  1. BurstWig:C#作业系统和Burst编译器的“假发”效果-源码

  2. 爆发假发 这个项目是尝试使用Unity的最新技术翻新我的旧假发效果(KvantWig)。 旧的实现使用过时的GPGPU方法,这是Unity 5.x时代中最可移植的方法。 现在,Unity具有C#作业系统和Burst编译器,它们可以非常高效地处理顶点动画。 最新版本的VFX Graph支持粒子条带,方便绘制发束。 因此,现在效果分为两个部分: 动态(CPU):使用C#作业系统运行头发仿真并将结果烘焙到纹理中。 渲染(GPU):通过烘焙纹理接收顶点位置,并使用VFX Graph中的粒子条
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:129024
    • 提供者:weixin_42098104
  1. GPGPU上的Unity-Boids-Behavior-行为:修改了Boids行为计算代码,以利用Microsoft Direct Compute大大提高了性能。利用Compute Shader实现Boids模拟-源码

  2. GPGPU上的Unity Boids行为 更新资料 添加GitHub Action CI / CD管道,您可以在Actions页面找到最新的exe文件。 描述: 使用Compute Shader实现Boids仿真。 受到Joachim Ante在启发。 Joachim展示了使用新的Job系统时,如何充分利用boids仿真性能,充分利用了多CPU /核心架构 取而代之的是,我制作了基于GPU的植绒系统。 修改了Boids行为计算代码,以利用Microsoft Direct Compute,从
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:39936
    • 提供者:weixin_42173218
  1. mu:用于Rust的一次写入可在任何地方运行的GPGPU库-源码

  2. mu:用于Rust的一次写入可在任何地方运行的GPGPU库
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:142606336
    • 提供者:weixin_42140710
  1. blinkjs:由WebGL 2.0驱动的浏览器中的Easy GPGPU-源码

  2. blink.js 由WebGL 2.0驱动的Web上的Easy GPGPU。 blink.js (请勿与Chromium渲染引擎混淆)是一个小型,易于使用的GPGPU库,可利用WebGL 2.0的强大功能在网络上使用。 请注意: blink.js使用其自己的WebGL 2.0上下文。 这意味着它不能与其他WebGL框架插入。 尽管从理论上讲,您可以使用blink.js的上下文作为您的主要WebGL上下文。 目录 安装 从dist文件夹下载blink.min.js文件。 然后使用[remov
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:49152
    • 提供者:weixin_42110469
  1. metal-gpgpu:有关如何使用Apple的Metal API进行计算任务的注释的集合-源码

  2. metal-gpgpu:有关如何使用Apple的Metal API进行计算任务的注释的集合
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:2048
    • 提供者:weixin_42132325
  1. Zeckoxe-Engine:Vulkan中的引擎-源码

  2. Zeckoxe引擎 Zeckoxe Engine是实现的2D / 3D渲染器 该代码由MIT许可。 随意将其用于任何目的。 低级渲染后端 该引擎旨在测试和研究图形,物理和GPGPU技术,包括游戏。 游戏并不是该项目背后的真正动机。 渲染后端完全专注于Vulkan,但是引擎极大地简化了编写Vulkan的最痛苦的步骤。 特征: 光线追踪-> -VK_KHR_acceleration_structure -VK_KHR_ray_tracing_pipeline -VK_KHR_ray_qu
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:383778816
    • 提供者:weixin_42146888
  1. gpu.js:GPU加速JavaScript-源码

  2. GPU.js GPU.js是一个Javascr ipt加速库,用于Web和NodeJavascr ipt中的GPGPU(GPU上的通用计算)。 GPU.js会自动将简单Javascr ipt函数转换为着色器语言,并对其进行编译,使其在您的GPU上运行。 如果没有GPU,则这些功能仍将在常规Javascr ipt中运行。 有关更多快速概念,请参见Wiki上的。 这是什么法术? 创建一个从javascr ipt函数转换而来的GPU加速内核,该javascr ipt函数计算512 x 512矩阵(
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:10485760
    • 提供者:weixin_42130786
  1. gorgonia:Gorgonia是一个有助于在Go中促进机器学习的图书馆-源码

  2. Gorgonia是一个有助于在Go中促进机器学习的图书馆。 轻松编写和评估涉及多维数组的数学方程式。 如果听起来像或 ,那是因为想法很相似。 具体来说,该库是像Theano这样的低级库,但具有更高的目标(如Tensorflow)。 Gorgonia: 可以执行自动区分 可以执行符号区分 可以执行梯度下降优化 可以进行数值稳定 提供许多便利功能来帮助创建神经网络 相当快(与Theano和Tensorflow的速度相比) 支持CUDA / GPGPU计算(尚不支持OpenCL,发送拉取请求)
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:82837504
    • 提供者:weixin_42151729
« 12 »