您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 《精通direct3d图形及动画程序设计》附书源代码

  2. 第一部分 基础篇  第1章 DirectX与Direct3D简介    1.1 什么是DirectX和Direct3D    1.2 DirectX的发展历史    1.3 DirectX 9.0的安装与配置     1.3.1 DirectX 9.0的安装     1.3.2 选择调试或发布库     1.3.3 在Visual Studio.NET IDE中配置DirectX     1.3.4 浏览DirectX SDK示例程序   1.4 DirectX功能组件   1.5 Direc
  3. 所属分类:C

    • 发布日期:2010-10-06
    • 文件大小:18mb
    • 提供者:j1223jesus
  1. CUDA 的经典入门.doc

  2. 目 录 第 1 章 简介 1 1.1 CUDA:可伸缩并行编程模型 1 1.2 GPU:高度并行化、多线程、多核处理器 1 1.3 文档结构 3 第2章 编程模型 4 2.1 线程层次结构 4 2.2 存储器层次结构 6 2.3 主机和设备 6 2.4 软件栈 7 2.5 计算能力 8 第 3 章 GPU 实现 9 3.1 具有芯片共享存储器的一组 SIMT 多处理器 9 3.2 多个设备 11 3.3 模式切换 11 第 4 章 应用程序编程接口 12 4.1 C 编程语言的扩展 12 4.
  3. 所属分类:硬件开发

    • 发布日期:2011-10-15
    • 文件大小:1mb
    • 提供者:lzfsailor
  1. 精通direct3d图形及动画程序设计

  2. 第一部分 基础篇  第1章 DirectX与Direct3D简介    1.1 什么是DirectX和Direct3D    1.2 DirectX的发展历史    1.3 DirectX 9.0的安装与配置     1.3.1 DirectX 9.0的安装     1.3.2 选择调试或发布库     1.3.3 在Visual Studio.NET IDE中配置DirectX     1.3.4 浏览DirectX SDK示例程序   1.4 DirectX功能组件   1.5 Direc
  3. 所属分类:C++

    • 发布日期:2011-12-27
    • 文件大小:18mb
    • 提供者:dd00bb
  1. GPU精粹2:高性能图形芯片和通用计算编程技...part1.rar

  2. 本书目录 第Ⅰ部分 几何复杂性 第1章 实现照片级真实感的虚拟 植物 5 1.1 场景管理 6 1.1.1 种植栅格 6 1.1.2 种植策略 6 1.1.3 实时优化 7 1.2 草层 7 1.2.1 通过溶解模拟Alpha透明 9 1.2.2 变化 10 1.2.3 光照 11 1.2.4 风 12 1.3 地面杂物层 12 1.4 树和灌木层 13 1.5 阴影 14 1.6 后处理 15 1.6.1 天空圆顶辉散 16 1.6.2 全场景辉光 16 1.7 本章小结 17 参考文献 1
  3. 所属分类:硬件开发

    • 发布日期:2012-02-07
    • 文件大小:59mb
    • 提供者:on__no
  1. 面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究

  2. 随着超大规模集成电路技术的不断进步,单芯片上集成了越来越多的晶体管, 目前已达到10亿的量级。然而,受到CMOS工艺特征尺寸的限制,芯片的主频 在达到4GHz之后继续提升的空间有限,多核并行逐渐成为提升处理器计算性能, 同时也是充分利用丰富的片上资源的主要技术途径。4-8核的通用CPU目前已 成为市场主流,而一些专用的处理器如流处理器则包含数十到数百个处理核心。 本文选取目前非常流行也极具发展潜力的一种商用流处理器体系结构——GPU (Graphics Processing Unit)展开相关
  3. 所属分类:专业指导

    • 发布日期:2013-06-08
    • 文件大小:2mb
    • 提供者:xiaoxio006
  1. 面向大规模科学计算的CPU-GPU异构并行技术研究

  2. 大规模科学计算对科学研究具有及其重要的意义,是计算机学科面临的重大 任务。近年来,随着GPU硬件及其编程模型的快速发展,使用GPU来加速大规 模科学计算应用己成为必然趋势。GPU擅长进行计算密集型操作,而且具有极高 的性价比,非常适合高性能科学计算。然而,如何有效地把科学计算应用移植到 GPU上运行仍是一个很大的挑战。在由CPU和GPU构建的异构系统中,CPU负 责进行复杂的逻辑运算和事务管理等不适合数据并行的计算,GPU负责进行计算 密集度高、逻辑分支简单的大规模数据计算。本文从两个层面研究
  3. 所属分类:专业指导

    • 发布日期:2013-06-08
    • 文件大小:5mb
    • 提供者:xiaoxio006
  1. 精通DirectX.3D图形与动画程序设计.王德才.part1

  2. 第一部分 基础篇 第1章 DirectX与Direct3D简介 1.1 什么是DirectX和Direct3D 1.2 DirectX的发展历史 1.3 DirectX9.0的安装与配置 1.3.1 DirectX9.0的安装 1.3.2 选择调试或发布库 1.3.3 在VisualStudio.NETIDE中配置DirectX 1.3.4 浏览DirectXSDK示例程序 1.4 DirectX功能组件 1.5 DirectX的几种开发方式 1.6 小结 第2章 Direct3D程序设计基础
  3. 所属分类:游戏开发

    • 发布日期:2013-09-28
    • 文件大小:40mb
    • 提供者:noreasth
  1. 精通DirectX.3D图形与动画程序设计.王德才.part3

  2. 第一部分 基础篇 第1章 DirectX与Direct3D简介 1.1 什么是DirectX和Direct3D 1.2 DirectX的发展历史 1.3 DirectX9.0的安装与配置 1.3.1 DirectX9.0的安装 1.3.2 选择调试或发布库 1.3.3 在VisualStudio.NETIDE中配置DirectX 1.3.4 浏览DirectXSDK示例程序 1.4 DirectX功能组件 1.5 DirectX的几种开发方式 1.6 小结 第2章 Direct3D程序设计基础
  3. 所属分类:游戏开发

    • 发布日期:2013-09-28
    • 文件大小:34mb
    • 提供者:noreasth
  1. OpenCL编程与优化Part I

  2. 来自AMD的资深工程师谢海波从GPU的体系结构、线程与调度、内存层次结构、以及指令吞吐等方面讲解了GPU编程优化的一般技巧。
  3. 所属分类:讲义

    • 发布日期:2014-05-29
    • 文件大小:7mb
    • 提供者:zhangoi391
  1. Shader优化

  2. 非常实用的GPU指令优化参考资料
  3. 所属分类:其它

  1. aida64extreme_build_2514

  2. AIDA64是一款测试软硬件系统信息的工具,它可以详细的显示出PC每一个方面的信息。AIDA64不仅提供了诸如协助超频,硬件侦错,压力测试和传感器监测等多种功能,而且还可以对处理器,系统内存和磁盘驱动器的性能进行全面评估。 AIDA64 Extreme Edition V3.00 更新日志: - 对多线程缓存和内存基准测试,AVX2、AVX以及SSE等指令集进行了优化; - 新增块随机缓存和内存延迟测试; - 对AMDKabini/Temash系列APU的64位基准测试进行了优化; -对Int
  3. 所属分类:桌面系统

    • 发布日期:2014-10-24
    • 文件大小:15mb
    • 提供者:busterian123
  1. CUDA中文手册.rar

  2. CUDA中文手册 NVIDIA CUDA 统一计算设备架构 编程指南 第1章 CUDA简介 1.1 作为数据并行计算设备的图形处理器 1.2 CUDA:一种GPU计算的新架构 1.3 文档结构 第2章 编程模型 2.1 高度多线程协处理器 2.2 线程分批 2.2.1 线程块 2.2.2 线程块网格 2.3 内存模型 第3章 硬件实现 3.1 具有片上共享内存的一组SIMD多处理器 3.2 执行模型 3.3 计算
  3. 所属分类:C++

    • 发布日期:2020-01-20
    • 文件大小:2mb
    • 提供者:hslinux
  1. 《安防+AI 人工智能工程化白皮书》.pdf

  2. 『安防+AI 人工智能工程化白皮书』集合了中科院自动化所、浙江 宇视科技有限公司的技术专家及行业专家的研究成果、实践经验。本报告从当前 人工智能技术与产业发展的背景、智慧安防生态圈、智慧安防典型应用、智慧安 防规模化应用存在的问题,以及智慧安防未来趋势等五个维度,系统梳理总结了 当前安防+AI 的发展现状,尤其重点分析指出了智慧安防领域存在的八大限制性 因素,以及智慧安防的八大新的发展趋势,供学术界及实业界的学者、专家参考。第四章智慧安防规模应用的八大限制性因素 24 4.1成本高昂 25 4.
  3. 所属分类:机器学习

    • 发布日期:2019-10-20
    • 文件大小:4mb
    • 提供者:yutong_zhou
  1. 如何在AMD Ryzen Threadripper上运行优化的HPL Linpack基准

  2. 如何在AMD Ryzen Threadripper上运行优化的HPL Linpack基准2019/8117 如何在 AMD Ryzen Threadrippe上运行优化的 HPL Linpack基准-2990W×32核性能 Threadripper 2 32-Core Layout (Unofficial) 2x16 PCle 2x16 PCle x Zen L2 L2 Zen Zen L2 L2 Zen 8M 8M 为zenL/<3 L3 L2 Zen i Zen L2L2 Zen F
  3. 所属分类:群集服务

    • 发布日期:2019-08-17
    • 文件大小:905kb
    • 提供者:student_slc
  1. 基于CUDA技术的卷积神经网络识别算法

  2. 基于CUDA技术的卷积神经网络识别算法For idy=l To n Do 浮点运算能力表现平稳,呈线性态势。 使用共享存備器( shared memory)收集数据 Thread[idx*pitch+]i1 FMi[e(idx, idy)]=( shared double) 4039 result: End for x烂 2.0358 (2)算法结束 1.772 43识别分类算法DCL 识别分类算法DCL如下 (1)Fori1 To nxn do(并行地) 在 Device的共享内存内初始化分类
  3. 所属分类:机器学习

    • 发布日期:2019-04-19
    • 文件大小:953kb
    • 提供者:suiyu_eran
  1. 多处理器交互式GPU的设计和优化

  2. 为了实现并行度的最大化,渲染任务的有效分配,图形处理管道中性能和灵活性之间的平衡,本文介绍了多核交互式图形处理单元(MIGPU)的设计,性能分析和优化。 该处理器将具有特定指令集体系结构的十二个处理内核以及许多复杂的特定于应用程序的加速器集成到3D图形引擎中。 它在XC6VLX550T现场可编程门阵列(FPGA)上实现。 MIGPU支持带有可编程前端处理器,顶点着色器,平面裁剪器,几何转换器,3D裁剪器和像素着色器的OpenGL2.0。 为了提高MIGPU的性能,在原始类型,顶点,像素以及剔除,
  3. 所属分类:其它

    • 发布日期:2021-03-03
    • 文件大小:128kb
    • 提供者:weixin_38702339
  1. sgminer-phi2-branch:sgminer的一个分支,在AMD上使用GCN交叉通道指令进行了优化(ethash,phi2,lyra2Z [z],葱属,x25x,lyra2REv2v3,argon2d,yescrypt,neosc

  2. sgminer-phi2-branch 介绍 这是一个多线程多池GPU矿工,具有ATI GPU监控,超频以及对基于scrypt的加密货币的风扇速度支持。 它基于Con Kolivas(ckolivas)的cgminer,而后者又基于Jeff Garzik(jgarzik)的cpuminer。 这是一个旨在支持lyra2系列算法(例如phi2和lyra2Z)的分支。 基本代码是从复制的。 另外,一些代码是从和复制而来的,还有一些是从。 许可证:GPLv3。 有关详细信息,请参见COPYING
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:11mb
    • 提供者:weixin_42143221
  1. FPSim2:用于快速分子相似性搜索的简单包装-源码

  2. FPSim2:用于快速分子相似性搜索的简单包装 FPSim2是一个基于NumPy的小型Python / C ++ RDKit软件包,用于运行快速化合物相似性搜索。 FPSim2在较高的搜索阈值(> = 0.7)时表现更好。 当前在界面中使用。 强调: 使用CPU POPCNT指令 次线性加速的界限从 一种基于和具有优化读取速度的压缩文件格式 快速的多核CPU和GPU相似性搜索 内存和磁盘搜索模式 距离矩阵计算 安装 conda install -c conda-forge fpsim2
  3. 所属分类:其它

    • 发布日期:2021-02-15
    • 文件大小:10mb
    • 提供者:weixin_42099755
  1. CUDA——性能优化(一)

  2. CUDA全局内存的合并访问(个人理解) 每个warp去访问全局内存,会有400-600个时钟周期的内存延迟,这个代价很昂贵,所以为了减少访问全局内存的指令次数,我们将满足字节大小和对齐要求的warp合并起来访问全局内存,从而减少对全局内存的访问次数,提高GPU性能。 关于warp指令基础知识 1)什么是warp? 一个线程warp包括32条线程(我的电脑是1个warp包括32条线程)。它位于多处理器中。 2)warp指令 发射warp的一个指令,即该warp的32条线程一起执行的该条指令。多处理
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:51kb
    • 提供者:weixin_38657102
  1. 使用Python写CUDA程序的方法

  2. 使用Python写CUDA程序有两种方式: * Numba * PyCUDA numbapro现在已经不推荐使用了,功能被拆分并分别被集成到accelerate和Numba了。 例子 numba Numba通过及时编译机制(JIT)优化Python代码,Numba可以针对本机的硬件环境进行优化,同时支持CPU和GPU的优化,并且可以和Numpy集成,使Python代码可以在GPU上运行,只需在函数上方加上相关的指令标记, 如下所示: import numpy as np from tim
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:47kb
    • 提供者:weixin_38655309
« 12 »