面向未来计算-异构开发技术社区

博文

0clang 分析OpenCL 代码

本人为大家介绍一下clang 分析OpenCL 代码。目前仅实现了对参数qualifier的提取,可以很方便在ast上加入其他操作。欢迎给我留言,一起交流。

0OpenCL性能探讨之if

最近还是在搞OpenCL的内核程序性能优化,一个比较大的发现是:if语句在GPU计算中代价挺大的。采用?的三目运算符和if语句会产生非常大的性能差距。

0OpenCL案例研究之一<矩阵乘法>

本案例讲述使用OpenCL计算矩阵乘法:C = A * B 。设A、B、C分别是大小为N*P、P*M和N*M的矩阵,那么顺序实现的C代码可以如下所示:

0通过OpenCL内核代码猜测设备寄存器个数

在OpenCL标准中,没有给出查看计算设备一共有多少寄存器,至少能分配给每个work-item多少寄存器使用的特征查询。而由于一个段内核代码是否因寄存器紧缺而导致性能严重下降也是一个比较重要的因素,因此我这边提供一个比较基本的方法来猜测当前计算设备至少能为每个work-item分配多少可用的寄存器。

0OpenCL 错误代码

为大家列举了多种OpenCL常见的错误代码,仅供参考。更多的错误代码描述见OpenCL编程指南P39。

1迈克老狼_教程:OpenCV 脸部跟踪(2)

前面一篇文章中提到,我们在一副脸部图像上选取76个特征点来描述脸部形状特征,本文中我们会把这些特征点映射到一个标准形状模型。

1迈克老狼_教程:OpenCV 脸部跟踪(1)

本文实施的脸部跟踪算法都是基于数据驱动的,主要包括两个部分,训练和测试。训练就是通过脸部标记点的采样数据,通过训练得到一个标准的脸部模型,而测试部分就是把检测到的脸部和标准脸部模型比较,求得眼睛,鼻子等脸部特征。

0opencv中cvFindContours函数两个测试程序

本章博文为大家介绍一下:opencv中cvFindContours函数两个测试程序,大家可以在文章下方给我留言,共同讨论。

0OpenCL如何判定一个work-group的最大Local Memory大小

最近有不少朋友提及到如何能在运行时获悉一个GPU的最大local memory的尺寸。由于OpenCL对各类处理器开放,因此不同处理器所拥有的local memory大小也各不相同。即便是GPU,甚至同一家公司出的GPU,不同的架构,其Local Memory的尺寸也各不相同。

0OpenGL4.x学习之开发环境的选择

OpenGL发展快,知识点很多,我自认为学了这一点知识并不够,于是花了一段时间读了几本OpenGL编程书籍,包括了《OpenGL ES2.0 Programming Guide》以及《OpenGL超级宝典(第六版)》。但是看的书总归还要实践才行,于是过了年后我尝试着写一些OpenGL的程序。首先我开始研究可编程渲染管线和OpenGL4.x。

0opencv2灰度图像的变换

刚开始学习opencv2实,不知道怎么将彩图装换成灰度图像,因为,我的变量是cv::mat类型的,但是cvcvtcolor的形参是iplimage*类型的,所以就查找了很多文章,终于找到了二者直接的转换方法。

0基于Nvidia显卡的OpenCL开发环境搭建与入门程序示例 ing

参考《详细程序注解学OpenCL一 环境配置和入门程序》和《VS2010 NVIDIA OpenCL 开发环境配置》,为大家详细介绍OpenCL开发环境搭建与入门程序示例...

立即注册,成为异构开发社区会员!

免费获取社区newsletter,优先获取技术支持和活动信息,独享社区 贡献积分政策

特别推荐

你问我答

您所提出的问题,需要管理员审核后才能展示。发布规则

每月红人榜

  • weixin_35758379

    所得积分:10

  • 2yanlingzhen10
  • 3qq_3233752710

微博活动