您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. NVIDIA_CUDA_Programming_Guide_2.0Final

  2. 多核 CPU 和众核( manycore ) GPU 尔性定的应律用,其软并件行,以性利还用会日不益断增扩加展的。处这理给器的我内出们核现带数意来量味了着,严这主峻种流的情处挑况理战正器—如芯片我已们进需入要并开行发时出代可。透此明外地扩,展根并 据行摩 3D 行以支持配备各种数量的内核众核图形应用程序其GPU 。 CUDA 是一种并行编程模型和软件环境,用于应对这种挑战。而对于熟悉 C 程序员来说,迅速掌
  3. 所属分类:C

    • 发布日期:2009-11-05
    • 文件大小:3mb
    • 提供者:fanfanstar19
  1. 从多核到众核

  2. 处理器从多核到众核的详细叙述文章 其实“多核”这个词已经流行很多年了,世界上第一款商用的非嵌入式多 核处理器是2002年IBM推出的POWER4。当然,多核这个词汇的流行主 要归功与AMD和Intel的广告,Intel与AMD的真假四核之争,以及如今的 电脑芯片市场上全是多核处理器的事实。接下来,学术界的研究人员开 始讨论未来成百上千核的处理器了。有一个与多核匹配的词叫片上网络 (Networks on Chip),讲的是多核里的网络式互连结构,甚至有人预 测未来将互连网集成到片上这种概念了。
  3. 所属分类:硬件开发

    • 发布日期:2018-08-31
    • 文件大小:966kb
    • 提供者:dingkelll
  1. 刘文志--科学计算与企业级应用的并行优化

  2. 本书系统、深入讲解了科学计算及企业级应用的并行优化方法与最佳实践。第1章介绍了常见的并行编程基于的多核/众核向量处理器架构。第2章介绍了如何在X86、ARM和GPU上优化常见的线性代数运算。第3章介绍了如何在X86和GPU处理器上优化偏微分方程的求解。第4章介绍了如何在X86处理器和GPU上优化常见的分子动力学算法。第5……
  3. 所属分类:C++

    • 发布日期:2018-02-11
    • 文件大小:94mb
    • 提供者:lu2027074
  1. 基于opencv3.1库的JAVA源码

  2. 第1章 Java概述、安装及简易教学 14 1-1 Java概述 14 1-2 Java安装 16 1-3 Eclipse安装 18 1-4 GUI设计工具WindowBuilder 18 1-5 在Eclipse开发第一个Java程式 23 1-6 在Eclipse开发第一个Java视窗程式-显示影像 26 1-7 在Eclipse开发视窗程式-slider控制元件 34 1-8 在Eclipse开发视窗程式-按钮控制元件 39 1-9 好用的Eclipse热键 41 第2章 OpenCV概
  3. 所属分类:图像处理

    • 发布日期:2018-09-29
    • 文件大小:1mb
    • 提供者:caozhenguan
  1. 异构众核系统综述

  2. 《异构众核系统》该篇论文由西交大的巨涛、朱正东、董小社所写。他们首先从不同方面分析对比了当前不同异构系统的特点,揭示了异构众核系统相对传统多核并行系统的优势及其发展趋势。然后分析了异构系统编程模型以及性能优化的研究现状、所存在的问题和面临的挑战,提出了进一步的研究方向。接着对GPU 和MIC两种异构系统进行性能测试,验证了两种异构系统不同的应用特点,为用户选择具体异构系统提供参考。最后作者提出了将GPU和MIC结合的混合异构系统,分析了在该混合异构系统下必须要研究和解决的问题。
  3. 所属分类:其它

    • 发布日期:2018-12-10
    • 文件大小:2mb
    • 提供者:qq_37592482
  1. 统计学习方法_李航

  2. 统计学习是计算机及其应用领域的一门重要的学科。本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与最大熵模型、支持向量机、提升方法、em算法、隐马尔可夫模型和条件随机场等。除第1章概论和最后一章总结外,每章介绍一种方法。叙述从具体问题或实例入手,由浅入深,阐明思路,给出必要的数学推导,便于读者掌握统计学习方法的实质,学会运用。为满足读者进一步学习的需要,书中还介绍了一些相关研究,给出了少量习题,列出了主要参考文献。 《统计学习方法
  3. 所属分类:机器学习

  1. 基于嵌入式Linux的视频采集系统设计.pdf

  2. 随着信息技术的迅速发展 , 计算机产业的发展 己经到了所谓的后 时代川 。 嵌入式系 统在各行业 的应用 , 特别是工业现场、 信息家电、 机顶盒等方面的广泛使用, 使嵌入式系统 的研究开发成为计算机领域的一个热点。 嵌入式 操作系统 〔 是从 衍生 出来 的一 种操作系统 , 它支持众 多嵌入式处 理器 〔 , 并具有 的很多优点, 而成 为当前主流的嵌 入式操作系统 本文选择龙珠为处理器, 它是公 司推出的具有 核 的多媒体嵌入式处理器 , 并以嵌入式为操作系统 , 研究在嵌入式
  3. 所属分类:嵌入式

    • 发布日期:2020-01-07
    • 文件大小:6mb
    • 提供者:u010352129
  1. 富士电机多功能型变频器FRENIC-MEGALite系列样本.pdf

  2. 富士电机多功能型变频器FRENIC-MEGALite系列样本pdf,本资料是关于富士电机高性能多功能型变频器FRENIC-MEGALite系列样本,更多详细内容请点击下载!FRENID MEGA LiiE ■广泛的用途 简单操作维护保养支持的提高 防止物品滑落的功能 具有利于速度指令工作的功能 搭载UsB接口实现Pc加载器简易信息管理!(选配件)型号:TPE1U 在上下撇运等过程中,提高了制动信号 将脉冲列翰入功能作为标准配置 提高现场作业性能 ●在生产现场,从操作面板上的US日接口可直接向计算
  3. 所属分类:其它

  1. MATLAB 7.X 系统建模与仿真.pdf

  2. MATLAB 7.X 系统建模与仿真.pdfMATLAB 7.X 系统建模与仿真.pdf录 第1章 MATLAB仿真技术与应用简介 1.l系统衍真技术概述………… 12Ⅵ ATLAB仿真技术的发展与应用… 4 13 MATLAB仿真技术的特点 口■JL■p电p自l电dd山甲 ■■1■1上山■ 1,4仿真应用实例筒介 第2章 Slink60快速入门…… 2, Simulink简介…… 2.1.1什么是 Simulink 2L2 Simulink6D的新特点 ■看p电1p电鲁看 2.3 Simuli
  3. 所属分类:教育

    • 发布日期:2019-08-17
    • 文件大小:15mb
    • 提供者:ktz517
  1. “神威·太湖之光”上Tend_lin并行优化

  2. 大气环流模式是中科院地球系统模式中最为复杂的模式,在当前主流的众核异构平台上开展大气环流模式的众核并行化是高性能计算的热点研究问题。针对AGCM4.0热点程序动力框架的适应过程Tend_lin,利用神威OpenACC编程模型在"神威·太湖之光"高性能计算平台上实现并行化,并从循环分布、循环分块、数据传输的表达、函数调用的从核化等方面提升应用性能。详细讨论了不同场景下的数据传输表达,对比测试了不同分块尺寸对程序性能的影响。相比主核串行,两种测试规模下,Tend_lin应用的单核组多线程并行均获得6
  3. 所属分类:其它

  1. 嵌入式系统/ARM技术中的GE智能平台使应用GPGPU的数字信号处理得到更快的开发实施

  2. GE智能平台今日在NVIDIA GTC上宣布AXISLib产品家族又添新成员。AXISLib-GPU支持在GE的支持NVIDIA CUDA的GPGPU平台(如IPN250、NPN240和GRA111)上开发(并最终加快部署)高性能DSP和多处理应用。典型应用包括雷达、声纳、图像处理、信号智能和ISR(智能、监视、侦察)。一套信号和矢量处理库针对NVIDIA的众核GPU提供了500多个更高性能的数字信号处理和矢量数学函数,并有助于开发人员充分提高系统和应用性能。AXISLib-GPU提供符合代码可
  3. 所属分类:其它

    • 发布日期:2020-10-22
    • 文件大小:61kb
    • 提供者:weixin_38537777
  1. 众核多计算模式系统的构建

  2. 摘要:复杂应用领域中的一些具体计算任务不仅需要计算平台具备高效的计算能力,而且也应具有与计算任务特点相匹配的计算模式。依据NVIDIA Kepler GK110架构中Hyper-Q特性与CUDA流的关系,提出单任务并行、多任务并行与多任务流式计算三种计算模式。采用空位标记的方法对计算模式进行构建与切换,结合数据缓冲机制和计算任务加载方式,设计了众核多计算模式处理系统,实现了众核处理机多模式计算的功能。   0 引言   在航空航天、医疗服务、地质勘探等复杂应用领域,需要处理的数据量急剧增大,
  3. 所属分类:其它

    • 发布日期:2020-10-20
    • 文件大小:215kb
    • 提供者:weixin_38632624
  1. 基于Tilera众核平台的流媒体流量发生系统的设计

  2. 设计了一种基于Tilera众核平台高强度的流媒体流量发生系统架构,其主要包括:系统界面管理模块、服务承载模块和流媒体流量发生模块。系统以流媒体用户行为模型为基础,针对Tilera众核平台进行合理的任务并行的划分,进而完成系统整体框架的并行化设计。经实际测试验证,该系统模拟产生的流媒体流量在不同情景下具有网络吞吐率高、并发用户数多、流媒体流量更为真实的优点,可以对科研人员的网络设备性能测试、网络协议评估等提供更好的支持。
  3. 所属分类:其它

    • 发布日期:2020-10-16
    • 文件大小:468kb
    • 提供者:weixin_38608189
  1. 面向对称多核体系结构的FPGA仿真模型

  2. 本文提出了面向对称多核体系结构的FPGA仿真模型,以及基于该模型的多核/众核、SIMD体系结构的执行模式。相对于软硬件联合仿真方法,该仿真模型减少了软硬件协同逻辑并避免了设计复杂的软件划分算法。实验结果表明,面向对称多核体系结构的FPGA仿真模型能有效地减少仿真系统FPGA资源的需求,增大FPGA的仿真规模,并且其带来的仿真时间增量是可接受的。但该仿真模型主要是面向对称体系结构,而不适用于异构多核系统等非对称结构。
  3. 所属分类:其它

    • 发布日期:2020-10-23
    • 文件大小:265kb
    • 提供者:weixin_38678773
  1. Pytorch 高效使用GPU的操作

  2. 前言 深度学习涉及很多向量或多矩阵运算,如矩阵相乘、矩阵相加、矩阵-向量乘法等。深层模型的算法,如BP,Auto-Encoder,CNN等,都可以写成矩阵运算的形式,无须写成循环运算。然而,在单核CPU上执行时,矩阵运算会被展开成循环的形式,本质上还是串行执行。GPU(Graphic Process Units,图形处理器)的众核体系结构包含几千个流处理器,可将矩阵运算并行化执行,大幅缩短计算时间。随着NVIDIA、AMD等公司不断推进其GPU的大规模并行架构,面向通用计算的GPU已成为加速可并
  3. 所属分类:其它

    • 发布日期:2020-12-17
    • 文件大小:148kb
    • 提供者:weixin_38611230
  1. 实施并行编程的五大障碍

  2. 近期看见一篇来自Intel的很有意思的分析文章,作者提到在他向45名与会的各公司程序员/开发经理/战略师提问“什么是实施并行编程的大障碍”时,下面五个因素被提及的次数多:遗留代码(legacy code)、教育(education)、工具(tools)、对众核趋势的恐惧(fear of many cores)以及可维护性(maintainability)。文章虽然是一篇Intel Parallel Studio的软文,但是其中提及的这五大障碍却非常值得讨论,下面是我对这五大障碍的一些粗浅看法,希
  3. 所属分类:其它

    • 发布日期:2020-12-22
    • 文件大小:99kb
    • 提供者:weixin_38739744
  1. 实施并行编程的五大障碍

  2. 并行编程的.近期看见一篇来自Intel的很有意思的分析文章,作者提到在他向45名与会的各公司程序员/开发经理/战略师提问“什么是实施并行编程的最大障碍”时,下面五个因素被提及的次数最多:遗留代码(legacycode)、教育(education)、工具(tools)、对众核趋势的恐惧(fear   近期看见一篇来自Intel的很有意思的分析文章,作者提到在他向45名与会的各公司程序员/开发经理/战略师提问“什么是实施并行编程的最大障碍”时,下面五个因素被提及的次数最多:遗留代码(legacyco
  3. 所属分类:其它

    • 发布日期:2021-03-23
    • 文件大小:100kb
    • 提供者:weixin_38729685
  1. 众核多计算模式系统的构建

  2. 摘要:复杂应用领域中的一些具体计算任务不仅需要计算平台具备高效的计算能力,而且也应具有与计算任务特点相匹配的计算模式。依据NVIDIA Kepler GK110架构中Hyper-Q特性与CUDA流的关系,提出单任务并行、多任务并行与多任务流式计算三种计算模式。采用空位标记的方法对计算模式进行构建与切换,结合数据缓冲机制和计算任务加载方式,设计了众核多计算模式处理系统,实现了众核处理机多模式计算的功能。   0 引言   在航空航天、医疗服务、地质勘探等复杂应用领域,需要处理的数据量急剧增大,
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:212kb
    • 提供者:weixin_38685538
  1. 面向大数据异构系统的神威并行存储系统

  2. 随着大数据应用和传统高性能计算应用的融合以及异构计算的引入,传统面向高性能计算的并行存储系统面临着异构计算I/O支持差、性能干扰和效率低等问题。通过在系统架构引入多层次存储架构、设计缓存映射机制来减轻I/O负载。在转发服务层,调整I/O转发策略,均衡I/O负载。在后端存储层,对系统高可用功能进行调整,解决大数据I/O访问模式与原有高可用措施的冲突。经过优化设计和完善后的并行存储系统更好地适应了异构众核架构,使得某些应用获得了10倍以上的I/O性能提升。
  3. 所属分类:其它

  1. GE智能平台使应用GPGPU的数字信号处理得到更快的开发实施

  2. GE智能平台今日在NVIDIA GTC上宣布AXISLib产品家族又添新成员。AXISLib-GPU支持在GE的支持NVIDIA CUDA的GPGPU平台(如IPN250、NPN240和GRA111)上开发(并终加快部署)高性能DSP和多处理应用。典型应用包括雷达、声纳、图像处理、信号智能和ISR(智能、监视、侦察)。一套信号和矢量处理库针对NVIDIA的众核GPU提供了500多个更高性能的数字信号处理和矢量数学函数,并有助于开发人员充分提高系统和应用性能。AXISLib-GPU提供符合代码可移
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:59kb
    • 提供者:weixin_38668160
« 12 »