搜索资源 - GPU指令优化 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - GPU指令优化

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

《精通direct3d图形及动画程序设计》附书源代码
第一部分　基础篇　第1章　DirectX与Direct3D简介　　　1.1　什么是DirectX和Direct3D　　　1.2　DirectX的发展历史　　　1.3　DirectX 9.0的安装与配置　　　　1.3.1　DirectX 9.0的安装　　　　1.3.2　选择调试或发布库　　　　1.3.3　在Visual Studio.NET IDE中配置DirectX　　　　1.3.4　浏览DirectX SDK示例程序　　1.4　DirectX功能组件　　1.5　Direc
所属分类：C
- 发布日期：2010-10-06
- 文件大小：18mb
- 提供者：j1223jesus

CUDA 的经典入门.doc
目录第 1 章简介 1 1.1 CUDA：可伸缩并行编程模型 1 1.2 GPU：高度并行化、多线程、多核处理器 1 1.3 文档结构 3 第2章编程模型 4 2.1 线程层次结构 4 2.2 存储器层次结构 6 2.3 主机和设备 6 2.4 软件栈 7 2.5 计算能力 8 第 3 章 GPU 实现 9 3.1 具有芯片共享存储器的一组 SIMT 多处理器 9 3.2 多个设备 11 3.3 模式切换 11 第 4 章应用程序编程接口 12 4.1 C 编程语言的扩展 12 4.
所属分类：硬件开发
- 发布日期：2011-10-15
- 文件大小：1mb
- 提供者：lzfsailor

精通direct3d图形及动画程序设计
第一部分　基础篇　第1章　DirectX与Direct3D简介　　　1.1　什么是DirectX和Direct3D　　　1.2　DirectX的发展历史　　　1.3　DirectX 9.0的安装与配置　　　　1.3.1　DirectX 9.0的安装　　　　1.3.2　选择调试或发布库　　　　1.3.3　在Visual Studio.NET IDE中配置DirectX　　　　1.3.4　浏览DirectX SDK示例程序　　1.4　DirectX功能组件　　1.5　Direc
所属分类：C++
- 发布日期：2011-12-27
- 文件大小：18mb
- 提供者：dd00bb

GPU精粹2：高性能图形芯片和通用计算编程技...part1.rar
本书目录第Ⅰ部分几何复杂性第1章实现照片级真实感的虚拟植物 5 1.1 场景管理 6 1.1.1 种植栅格 6 1.1.2 种植策略 6 1.1.3 实时优化 7 1.2 草层 7 1.2.1 通过溶解模拟Alpha透明 9 1.2.2 变化 10 1.2.3 光照 11 1.2.4 风 12 1.3 地面杂物层 12 1.4 树和灌木层 13 1.5 阴影 14 1.6 后处理 15 1.6.1 天空圆顶辉散 16 1.6.2 全场景辉光 16 1.7 本章小结 17 参考文献 1
所属分类：硬件开发
- 发布日期：2012-02-07
- 文件大小：59mb
- 提供者：on__no

面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究
随着超大规模集成电路技术的不断进步，单芯片上集成了越来越多的晶体管，目前已达到10亿的量级。然而，受到CMOS工艺特征尺寸的限制，芯片的主频在达到4GHz之后继续提升的空间有限，多核并行逐渐成为提升处理器计算性能，同时也是充分利用丰富的片上资源的主要技术途径。4-8核的通用CPU目前已成为市场主流，而一些专用的处理器如流处理器则包含数十到数百个处理核心。本文选取目前非常流行也极具发展潜力的一种商用流处理器体系结构——GPU （Graphics Processing Unit）展开相关
所属分类：专业指导
- 发布日期：2013-06-08
- 文件大小：2mb
- 提供者：xiaoxio006

面向大规模科学计算的CPU-GPU异构并行技术研究
大规模科学计算对科学研究具有及其重要的意义，是计算机学科面临的重大任务。近年来，随着GPU硬件及其编程模型的快速发展，使用GPU来加速大规模科学计算应用己成为必然趋势。GPU擅长进行计算密集型操作，而且具有极高的性价比，非常适合高性能科学计算。然而，如何有效地把科学计算应用移植到 GPU上运行仍是一个很大的挑战。在由CPU和GPU构建的异构系统中，CPU负责进行复杂的逻辑运算和事务管理等不适合数据并行的计算，GPU负责进行计算密集度高、逻辑分支简单的大规模数据计算。本文从两个层面研究
所属分类：专业指导
- 发布日期：2013-06-08
- 文件大小：5mb
- 提供者：xiaoxio006

精通DirectX.3D图形与动画程序设计.王德才.part1
第一部分　基础篇第1章　DirectX与Direct3D简介 1.1 什么是DirectX和Direct3D 1.2 DirectX的发展历史 1.3 DirectX9.0的安装与配置 1.3.1 DirectX9.0的安装 1.3.2 选择调试或发布库 1.3.3 在VisualStudio.NETIDE中配置DirectX 1.3.4 浏览DirectXSDK示例程序 1.4 DirectX功能组件 1.5 DirectX的几种开发方式 1.6 小结第2章　Direct3D程序设计基础
所属分类：游戏开发
- 发布日期：2013-09-28
- 文件大小：40mb
- 提供者：noreasth

精通DirectX.3D图形与动画程序设计.王德才.part3
第一部分　基础篇第1章　DirectX与Direct3D简介 1.1 什么是DirectX和Direct3D 1.2 DirectX的发展历史 1.3 DirectX9.0的安装与配置 1.3.1 DirectX9.0的安装 1.3.2 选择调试或发布库 1.3.3 在VisualStudio.NETIDE中配置DirectX 1.3.4 浏览DirectXSDK示例程序 1.4 DirectX功能组件 1.5 DirectX的几种开发方式 1.6 小结第2章　Direct3D程序设计基础
所属分类：游戏开发
- 发布日期：2013-09-28
- 文件大小：34mb
- 提供者：noreasth

OpenCL编程与优化Part I
来自AMD的资深工程师谢海波从GPU的体系结构、线程与调度、内存层次结构、以及指令吞吐等方面讲解了GPU编程优化的一般技巧。
所属分类：讲义
- 发布日期：2014-05-29
- 文件大小：7mb
- 提供者：zhangoi391

Shader优化
非常实用的GPU指令优化参考资料
所属分类：其它
- 发布日期：2014-08-19
- 文件大小：6mb
- 提供者：david_bill_jobs

aida64extreme_build_2514
AIDA64是一款测试软硬件系统信息的工具，它可以详细的显示出PC每一个方面的信息。AIDA64不仅提供了诸如协助超频，硬件侦错，压力测试和传感器监测等多种功能，而且还可以对处理器，系统内存和磁盘驱动器的性能进行全面评估。 AIDA64 Extreme Edition V3.00 更新日志： - 对多线程缓存和内存基准测试，AVX2、AVX以及SSE等指令集进行了优化； - 新增块随机缓存和内存延迟测试； - 对AMDKabini/Temash系列APU的64位基准测试进行了优化； -对Int
所属分类：桌面系统
- 发布日期：2014-10-24
- 文件大小：15mb
- 提供者：busterian123

CUDA中文手册.rar
CUDA中文手册 NVIDIA CUDA 统一计算设备架构编程指南第1章 CUDA简介 1.1 作为数据并行计算设备的图形处理器 1.2 CUDA：一种GPU计算的新架构 1.3 文档结构第2章编程模型 2.1 高度多线程协处理器 2.2 线程分批 2.2.1 线程块 2.2.2 线程块网格 2.3 内存模型第3章硬件实现 3.1 具有片上共享内存的一组SIMD多处理器 3.2 执行模型 3.3 计算
所属分类：C++
- 发布日期：2020-01-20
- 文件大小：2mb
- 提供者：hslinux

《安防+AI 人工智能工程化白皮书》.pdf
『安防+AI 人工智能工程化白皮书』集合了中科院自动化所、浙江宇视科技有限公司的技术专家及行业专家的研究成果、实践经验。本报告从当前人工智能技术与产业发展的背景、智慧安防生态圈、智慧安防典型应用、智慧安防规模化应用存在的问题，以及智慧安防未来趋势等五个维度，系统梳理总结了当前安防+AI 的发展现状，尤其重点分析指出了智慧安防领域存在的八大限制性因素，以及智慧安防的八大新的发展趋势，供学术界及实业界的学者、专家参考。第四章智慧安防规模应用的八大限制性因素 24 4.1成本高昂 25 4.
所属分类：机器学习
- 发布日期：2019-10-20
- 文件大小：4mb
- 提供者：yutong_zhou

如何在AMD Ryzen Threadripper上运行优化的HPL Linpack基准
如何在AMD Ryzen Threadripper上运行优化的HPL Linpack基准2019/8117 如何在 AMD Ryzen Threadrippe上运行优化的 HPL Linpack基准-2990W×32核性能 Threadripper 2 32-Core Layout (Unofficial) 2x16 PCle 2x16 PCle x Zen L2 L2 Zen Zen L2 L2 Zen 8M 8M 为zenL/<3 L3 L2 Zen i Zen L2L2 Zen F
所属分类：群集服务
- 发布日期：2019-08-17
- 文件大小：905kb
- 提供者：student_slc

基于CUDA技术的卷积神经网络识别算法
基于CUDA技术的卷积神经网络识别算法For idy=l To n Do 浮点运算能力表现平稳,呈线性态势。使用共享存備器( shared memory)收集数据 Thread[idx*pitch+]i1 FMi[e(idx, idy)]=( shared double) 4039 result: End for x烂 2.0358 (2)算法结束 1.772 43识别分类算法DCL 识别分类算法DCL如下 (1)Fori1 To nxn do(并行地) 在 Device的共享内存内初始化分类
所属分类：机器学习
- 发布日期：2019-04-19
- 文件大小：953kb
- 提供者：suiyu_eran

多处理器交互式GPU的设计和优化
为了实现并行度的最大化，渲染任务的有效分配，图形处理管道中性能和灵活性之间的平衡，本文介绍了多核交互式图形处理单元（MIGPU）的设计，性能分析和优化。该处理器将具有特定指令集体系结构的十二个处理内核以及许多复杂的特定于应用程序的加速器集成到3D图形引擎中。它在XC6VLX550T现场可编程门阵列（FPGA）上实现。 MIGPU支持带有可编程前端处理器，顶点着色器，平面裁剪器，几何转换器，3D裁剪器和像素着色器的OpenGL2.0。为了提高MIGPU的性能，在原始类型，顶点，像素以及剔除，
所属分类：其它
- 发布日期：2021-03-03
- 文件大小：128kb
- 提供者：weixin_38702339

sgminer-phi2-branch：sgminer的一个分支，在AMD上使用GCN交叉通道指令进行了优化（ethash，phi2，lyra2Z [z]，葱属，x25x，lyra2REv2v3，argon2d，yescrypt，neosc
sgminer-phi2-branch 介绍这是一个多线程多池GPU矿工，具有ATI GPU监控，超频以及对基于scrypt的加密货币的风扇速度支持。它基于Con Kolivas（ckolivas）的cgminer，而后者又基于Jeff Garzik（jgarzik）的cpuminer。这是一个旨在支持lyra2系列算法（例如phi2和lyra2Z）的分支。基本代码是从复制的。另外，一些代码是从和复制而来的，还有一些是从。许可证：GPLv3。有关详细信息，请参见COPYING
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：11mb
- 提供者：weixin_42143221

FPSim2：用于快速分子相似性搜索的简单包装-源码
FPSim2：用于快速分子相似性搜索的简单包装 FPSim2是一个基于NumPy的小型Python / C ++ RDKit软件包，用于运行快速化合物相似性搜索。 FPSim2在较高的搜索阈值（> = 0.7）时表现更好。当前在界面中使用。强调：使用CPU POPCNT指令次线性加速的界限从一种基于和具有优化读取速度的压缩文件格式快速的多核CPU和GPU相似性搜索内存和磁盘搜索模式距离矩阵计算安装 conda install -c conda-forge fpsim2
所属分类：其它
- 发布日期：2021-02-15
- 文件大小：10mb
- 提供者：weixin_42099755

CUDA——性能优化（一）
CUDA全局内存的合并访问（个人理解）每个warp去访问全局内存，会有400-600个时钟周期的内存延迟，这个代价很昂贵，所以为了减少访问全局内存的指令次数，我们将满足字节大小和对齐要求的warp合并起来访问全局内存，从而减少对全局内存的访问次数，提高GPU性能。关于warp指令基础知识 1）什么是warp? 一个线程warp包括32条线程（我的电脑是1个warp包括32条线程）。它位于多处理器中。 2)warp指令发射warp的一个指令，即该warp的32条线程一起执行的该条指令。多处理
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：51kb
- 提供者：weixin_38657102

使用Python写CUDA程序的方法
使用Python写CUDA程序有两种方式： * Numba * PyCUDA numbapro现在已经不推荐使用了，功能被拆分并分别被集成到accelerate和Numba了。例子 numba Numba通过及时编译机制（JIT）优化Python代码，Numba可以针对本机的硬件环境进行优化，同时支持CPU和GPU的优化，并且可以和Numpy集成，使Python代码可以在GPU上运行，只需在函数上方加上相关的指令标记，如下所示： import numpy as np from tim
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：47kb
- 提供者：weixin_38655309

« 12 »