面向未来计算-异构开发技术社区

技术文档

GPU/APU加速库、算法及应用

通过和全球业界伙伴、高校、研究机构之间的广泛合作,AMD一直致力于异构计算生态系统的建立和发展。我们将APU/GPU异构开发资源分享于此,并持续更新中,给开发人员以启发和参考;同时,我们希望能抛砖引玉,期待大家的参与与贡献,不断丰富和完善异构开发资源!

【案例】基于OpenCL的自适应快速傅立叶变换(FFT)算法

采用快速算法能使计算机计算离散傅立叶变换所需的乘法次数大为减少,特别是被变换的抽样点数N越多,FFT算法计算量的节省就越明显。

【案例】基于OpenCL的并行K-means聚类算法

本文提出了基于CPU的并行Global K-means算法,首先并行了最为耗时的聚类中心的选取,又引入了非规则归约方法来并行聚类中心的更新。

【案例】三维人体运动视觉重建与跟踪系统的GPU实现

人体运动三维重建与跟踪的主要目的是从图像和视频信息中恢复和估计以参数表示的人体姿态,求解真实人体在三维世界坐标系中的位置和姿态参数。

【OpenCL 】ATI HD Graphics与OpenCL

本文主要归纳AMD HD Graphics(R700以后的架构)中的一些官方提出的术语以及与OpenCL中的术语的一些联系。主要从硬件架构和执行模型的角度做些讲解。

【OpenCL 】采用OpenCL标准实现FPGA设计

OpenCL应用程序含有两部分。OpenCL主程序是纯软件例程,以标准C/C++编写,可以运行在任何类型的微处理器上。例如,这类处理器可以是FPGA中的嵌入式软核处理器、硬核ARM处理器或者外置x86处理器。

【OpenCL 】基于OpenCL的mean filter性能

对于一个标准的3*3 均值滤波,kernel代码如下:使用buffer/image缓冲对象。

【OpenCL 】使用 OpenCL.Net 进行 C# GPU 并行编程

在初探 C# GPU 通用计算技术 中,我使用 Accelerator 编写了一个简单的 GPU 计算程序。也简单看了一些 Brahma 的代码,从它的 SVN 最新代码看,Brahma 要转移到使用 OpenCL.Net 作为底层了,于是也去网上搜索了一下,发现了 OpenCL.Net 和另一个相关的项目 OpenCLTemplate。

【C++ AMP 】 Hello C++ AMP!(2)

矩阵运算也许对于大多数程序员并不重要,所以下面来个更通俗版本的AMP。

【C++ AMP 】Hello C++ AMP!

C++ AMP是微软提供的一套利用GPU并行计算的API。GPU运算不是新概念,用GPU运算比较有名的已有NVIDIA的CUDA,AMD的stream。同时对于OpenCL这个标准大家也一定没见过也听说(AMP同样与近日放出了开放标准)。

【C++ AMP 】C++ AMP实战:绘制曼德勃罗特集图像

C++ AMP全名C++ Accelerated Massive Parallelism(加速大规模并行计算)。是微软提出的基于C++的异构化并行计算平台。它将随Visual Studio 11一起发布,目前为预览版本。所谓异构并行计算,主要的需求就来自于GPU通用计算的崛起。

【OpenCL 】AMD OpenCL大学教程(University Programs)中文版

AMD OpenCL大学课程是非常好的入门级OpenCL教程,通过看教程中的PPT,我们能够很快的了解OpenCL机制以及编程方法。