您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于可编程图形硬件加速的若干技术研究

  2. 目前图形硬件中的图形处理器(GPU)计算能力的增长速度已经超过了中央处理器 (CPU)计算能力的增长速度,主流图形硬件制造商声称,现在每隔 12 个月 GPU 的性 能就会增长一倍。图形硬件技术一个最主要的突破就是在图形硬件中引入了可编程功 能,此功能允许用户编制自定义的着色器程序(Shader program)来替换原来固定流水线 中的某些功能模块,使得 GPU 在功能上更像一个通用处理器. 虽然 GPU 具有非常高 的计算速度,但并不能直接将以前在 CPU 中实现的算法照搬到 GPU 中来
  3. 所属分类:其它

    • 发布日期:2011-01-26
    • 文件大小:2097152
    • 提供者:chinachips
  1. GPU通用计算详细概述.pdf

  2. GPU的全称是Graphic Processing Unit,即为图形 处理单元。与通常用于复杂计算的CPU不同,GPU最 初设计的用途是用于进行图像的渲染和输出,GPU更 多的是进行SIMD(Single Instruction Multiple Data,即 单指令流多数据流)处理,这种操作模式使GPU在 进行高密集计算和高数据吞吐的操作时有极大的优 势。而且因为在功能上弱于传统的CPU,GPU少了大 量束缚,所以能够取得比CPU更快的计算性能的提 升。GPGPU是General-Purp
  3. 所属分类:专业指导

    • 发布日期:2011-04-28
    • 文件大小:629760
    • 提供者:huopo125
  1. GPU精粹2:高性能图形芯片和通用计算编程技...part1.rar

  2. 本书目录 第Ⅰ部分 几何复杂性 第1章 实现照片级真实感的虚拟 植物 5 1.1 场景管理 6 1.1.1 种植栅格 6 1.1.2 种植策略 6 1.1.3 实时优化 7 1.2 草层 7 1.2.1 通过溶解模拟Alpha透明 9 1.2.2 变化 10 1.2.3 光照 11 1.2.4 风 12 1.3 地面杂物层 12 1.4 树和灌木层 13 1.5 阴影 14 1.6 后处理 15 1.6.1 天空圆顶辉散 16 1.6.2 全场景辉光 16 1.7 本章小结 17 参考文献 1
  3. 所属分类:硬件开发

    • 发布日期:2012-02-07
    • 文件大小:61865984
    • 提供者:on__no
  1. 面向CPU-GPU异构并行系统的编程模型与编译优化关键技术研究

  2. 随着超大规模集成电路技术的不断进步,单芯片上集成了越来越多的晶体管, 目前已达到10亿的量级。然而,受到CMOS工艺特征尺寸的限制,芯片的主频 在达到4GHz之后继续提升的空间有限,多核并行逐渐成为提升处理器计算性能, 同时也是充分利用丰富的片上资源的主要技术途径。4-8核的通用CPU目前已 成为市场主流,而一些专用的处理器如流处理器则包含数十到数百个处理核心。 本文选取目前非常流行也极具发展潜力的一种商用流处理器体系结构——GPU (Graphics Processing Unit)展开相关
  3. 所属分类:专业指导

    • 发布日期:2013-06-08
    • 文件大小:2097152
    • 提供者:xiaoxio006
  1. 面向大规模科学计算的CPU-GPU异构并行技术研究

  2. 大规模科学计算对科学研究具有及其重要的意义,是计算机学科面临的重大 任务。近年来,随着GPU硬件及其编程模型的快速发展,使用GPU来加速大规 模科学计算应用己成为必然趋势。GPU擅长进行计算密集型操作,而且具有极高 的性价比,非常适合高性能科学计算。然而,如何有效地把科学计算应用移植到 GPU上运行仍是一个很大的挑战。在由CPU和GPU构建的异构系统中,CPU负 责进行复杂的逻辑运算和事务管理等不适合数据并行的计算,GPU负责进行计算 密集度高、逻辑分支简单的大规模数据计算。本文从两个层面研究
  3. 所属分类:专业指导

    • 发布日期:2013-06-08
    • 文件大小:5242880
    • 提供者:xiaoxio006
  1. mic与gpu对比

  2. mic与gpu对比,GPGPU与MIC定位相似,两者都是相对于CPU具有较高性价比的高性能解决方案,甚至连外形都是一样使用PCI-E插槽的板卡。但对于“核”这个概念来说,两者却有很大的不同。GPGPU中所说的核,以CUDA为例,是指一个SP(即流处理器),SP的功能只有计算,以NVIDIA的Fermi GPU为例,32个SP组成一个SM(流处理器群),一个SM 才有两个控制单元。也就是说每16个GPU的“核”,必须执行同一条指令。而MIC得设计思路与GPGPU完全不同。MIC的每个“核”,可以
  3. 所属分类:专业指导

    • 发布日期:2015-12-21
    • 文件大小:1048576
    • 提供者:qingchunhuore
  1. tensorflow_gpu-1.5.0-cp35-cp35m-win_amd64.whl

  2. Tensorflow 1.5 GPU版 适用于python3.5 若CPU不支持AVX指令集,则此版本为Tensorflow GPU的最高版本!
  3. 所属分类:Python

    • 发布日期:2018-03-26
    • 文件大小:81788928
    • 提供者:wudalongqiang
  1. tensorflow_gpu-1.5.0-cp36-cp36m-win_amd64.whl

  2. Tensorflow 1.5 GPU版 适用于python3.6 若您的CPU不支持AVX指令集,则此版本为可用的Tensorflow GPU最高版本!
  3. 所属分类:Python

    • 发布日期:2018-03-26
    • 文件大小:81788928
    • 提供者:wudalongqiang
  1. Tensorflow 1.6 GPU版 适用于python3.5

  2. Tensorflow 1.6 GPU版 适用于python3.5。 安装步骤(Windows 7 64bit 测试通过): 1.下载并安装tensorflow_gpu-1.6.0-cp35-cp35m-win_amd64.whl 2.安装CUDA® Toolkit 9.0。完成后可运行deviceQuery例程来检测是否成功连接GPU。若成功,请把Cuda 路径名称(即系统变量CUDA_PATH的值)添加到用户的 PATH环境变量中。 3.安装cuDNN v7.0。然后把cudnn64_7.d
  3. 所属分类:Python

    • 发布日期:2018-03-27
    • 文件大小:84934656
    • 提供者:wudalongqiang
  1. 机器学习tensorflow源码编译GPU+cpu指令mavx2 mess mfma tensorflow-1.8.0-cp36-cp36m-linux8664

  2. gcc4.8.5 Ubuntu 18.04 LTS \n \l CUDA 9.0 cuDNN 7.0 编译项bazel build --jvmopt="-server -Xms20480m" -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-mfpmath=both --copt=-msse4.2 --config=cuda -k //tensorflow/tools/pip_package:build_pip_package
  3. 所属分类:深度学习

    • 发布日期:2018-07-04
    • 文件大小:89128960
    • 提供者:jie_linux
  1. 解决并修复opencl出错intel_sdk_for_opencl_2017_7.0.0.2567

  2. 众所周知,opengl在GPU以及CPU显卡软件的各种程序编译中起着决定性的作用,很多挖矿软件亦是运用opengl的强大调动CPU或者GPU的浮点指令集合,从而实现算力提升的目标。然而很多老旧CPU和GPU却不曾拥有这一功能,为此intel公司针对旗下的CPU扩展了sdk_for_opencl,以此解决相应问题。软件很好用,大家可以试试,很快解决opengl drivers缺失的问题。
  3. 所属分类:比特币

    • 发布日期:2019-06-09
    • 文件大小:68
    • 提供者:u013232022
  1. S7-300STL指令注释.pdf

  2. 西门子S7-300语句表STL指令参考手册,深入了解西门子PLC控制的资料!JZ:跳转指令若零,则珧转 :装入传送指令装入 L DBLG:装入传送指令将共享数据块的长度装入累加器1中 L DBNO:装入/传送指令将共享数据块的块号装入累加器1口 LDG:裝入传送指令将背景数据块的长度装入累加器1屮 LDN○:装入/佧送指令将背景数据块的块号装入累加器1中 LSTW:装入/传送指令将状态字装入累加器1 L:定时器指令将当前定时值作为整数装入累加器1(当前定时值可以是0-255之间的 个数宇,例如L
  3. 所属分类:嵌入式

    • 发布日期:2019-07-15
    • 文件大小:951296
    • 提供者:zyiccccc
  1. check-cpu.rar

  2. 检测CPU是否支持AVX2指令集。安装tensorflow之前,检测CPU是否支持AVX2指令集,选择相适应的tensorflow-GPU版本。
  3. 所属分类:互联网

    • 发布日期:2020-04-29
    • 文件大小:1048576
    • 提供者:mountianfire123
  1. 寒武纪 AI 指令集 论文

  2. 寒武纪发布在ISCA 2016上的一篇论文,设计了一个通用的神经网络指令集;Table i. an overview to cambricon instructions Instruction Type Examples Operands Control jump, conditional branch register (scalar value), immediate Matrix matrix load/store/move register (matrix address/size, s
  3. 所属分类:深度学习

    • 发布日期:2019-03-02
    • 文件大小:856064
    • 提供者:u011831874
  1. GPU程序设计、软件移植.ppt

  2. GPU系统结构与程序设计,一个入门级的知识梳理,GPU与CPU在访存方面各采取什么措施应对存储访问的长延时? 为什么只有Block内允许共享存储器? 为什么GPU与CUDA设计中引入warp? 为什么每个Block 需要多个warp? 为什么每个Block中线程数目并非越多越好? 为什么要允许一个MP运行多个Block? Warp与向量指令的区别?
  3. 所属分类:互联网

    • 发布日期:2020-08-06
    • 文件大小:1048576
    • 提供者:yanghg1980
  1. 通信与网络中的GPU的作用及工作原理

  2. 在上一篇文章《什么是GPU?GPU有什么用?》曾提及可编程着色器,可编程着色器对于 3D 游戏的设计者来说可谓有巨大的优点,不过同时也给 GPU 工程师带来了一些和 CPU 类似的有趣的问题。因需要发送指令(instruction)运行,解码(decode)和执行指令(execute)过程必不可少,而着色器代码中判断语句和循环语句也会引起执行次序的小问题等等。这意味着着色器核心已经能成为一个小型的计算引擎去执行任何的编程任务,尽管不如 CPU 那么灵活多变,但也能执行有用的、非图形相关的任务。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:286720
    • 提供者:weixin_38607864
  1. DSP中的基于CPU-GPU 异构机群的FDTD 并行算法加速研究(二)

  2. 2 GPU 并行加速算法   GPU 具有高度并行的多流水线架构,使其非常适宜于FDTD 加速运算。与CPU 运算的多次循环逐网格迭代更新方式不同,GPU 可以实现多网格的同时迭代更新,配合GPU 的线程集指令执行机制,可以高效地利用流水线资源,隐藏流处理器与设备内存间的场量读写延时,从而实现FDTD 运算加速。   2.1 GPU 核心函数的并行   2.1.1 数据并行优化   OpenCL 支持按数据并行的编程模型和按任务并行的编程模型。数据并行是一种普遍意义上的并行方式,在程序中
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:189440
    • 提供者:weixin_38514526
  1. Tensorflow不支持AVX2指令集的解决方法

  2. 这几天研究了一下FCN(全卷积网络),由于电脑配置不够,用GPU训练直接报OOM(内存溢出)了, 于是转战CPU,当然,这样会很慢,之后会继续搞一下,减小一下网络的复杂度,对一些参数设置一波,看能不能正常跑下来。 记得一开始没有装GPU版的tensorflow时用CPU版本跑程序的时候总是报警告:Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2,当时没有太在意,
  3. 所属分类:其它

    • 发布日期:2020-12-20
    • 文件大小:220160
    • 提供者:weixin_38681628
  1. CPURasterizer:基于CPU的光栅引擎-源码

  2. CPU光栅器 基于CPU的高效光栅化器 一个非常高效的光栅化器的CPU实现,该光栅化器利用了AVX2指令和无锁多线程编程。使用平铺渲染时,程序同时消耗8个像素,这与std::execution线程库一起使它变得非常快速和强大。该项目的查看器是一个非常简单的OpenGL应用程序,可将纹理渲染为四边形。纹理由CPU Renderer.h类生成。该管道包含大多数现代GPU光栅化程序阶段。 当前的开发可在下进行。有关该项目的讨论可。 实施阶段包括: - Vertex Shader - Clipping
  3. 所属分类:其它

    • 发布日期:2021-03-21
    • 文件大小:95232
    • 提供者:weixin_42097208
  1. GPU的作用及工作原理

  2. 在上一篇文章《什么是GPU?GPU有什么用?》曾提及可编程着色器,可编程着色器对于 3D 游戏的设计者来说可谓有巨大的优点,不过同时也给 GPU 工程师带来了一些和 CPU 类似的有趣的问题。因需要发送指令(instruction)运行,解码(decode)和执行指令(execute)过程必不可少,而着色器代码中判断语句和循环语句也会引起执行次序的小问题等等。这意味着着色器已经能成为一个小型的计算引擎去执行任何的编程任务,尽管不如 CPU 那么灵活多变,但也能执行有用的、非图形相关的任务。
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:355328
    • 提供者:weixin_38660624
« 12 3 »