文件大小:
软件介绍
NVIDIA CUDA Toolkit for Mac是Mac平台上一款提供了创建高性能的GPU加速应用程序的开发环境。借助CUDA Toolkit,您可以在GPU加速的嵌入式系统,台式机工作站,企业数据中心,基于云的平台和HPC超级计算机上开发,优化和部署应用程序。该工具包包括GPU加速库,调试和优化工具,C / C ++编译器以及用于部署应用程序的运行时库。
GPU加速的CUDA库支持跨多个领域的加速插入,例如线性代数,图像和视频处理,深度学习和图形分析。为了开发自定义算法,可以将可用的集成与常用的语言和数字包以及发布良好的开发API结合使用。您的CUDA应用程序可以部署在本地和云中GPU实例上可用的所有NVIDIA GPU系列中。利用内置的功能在多GPU配置之间分配计算,科学家和研究人员可以开发从单个GPU工作站扩展到具有数千个GPU的云安装的应用程序。
NVIDIA CUDA Toolkit for Mac功能特点:
GPU时间戳:开始时间戳
方法:GPU方法名称。这是内存副本的“ memcpy *”或GPU内核的名称。内存副本的后缀描述了内存传输的类型,例如“ memcpyDToHasync”表示从设备内存到主机内存的异步传输
GPU时间:这是该方法在GPU上的执行时间
CPU时间:启动该方法所需的GPU时间和CPU开销之和。在驱动程序生成的数据级别,CPU时间只是启动非阻塞方法的CPU开销;对于阻塞方法,它是GPU时间和CPU开销的总和。默认情况下,所有内核启动都是非阻塞的。但是,如果启用了探查器计数器,则内核启动将被阻止。不同流中的异步内存复制请求是非阻塞的
流ID:流的标识号
仅适用于内核方法的列
占用率:占用率是每个多处理器的活动扭曲数与最大活动扭曲数之比。
探查器计数器:请参阅探查器计数器部分以获取支持的计数器列表
网格大小:沿X,Y和Z维度的网格中的块数在单列中显示为[num_blocks_X num_blocks_Y num_blocks_Z]
块大小:沿X,Y和Z维度的块中的线程数在单列中显示为[num_threads_X num_threads_Y num_threads_Z]
dyn smem每块:每块动态共享内存大小(以字节为单位)
每块sta smem:每块的静态共享内存大小(以字节为单位)
每个线程的reg:每个线程的寄存器数
仅用于记忆复制方法的列
mem传输大小:内存传输大小(以字节为单位)
主机内存传输类型:指定内存传输使用“可分页”还是“页面锁定”内存
软件截图
版权声明:
1 本站所有资源(含游戏)均是软件作者、开发商投稿,任何涉及商业盈利目的均不得使用,否则产生的一切后果将由您自己承担!
2 本站将不对任何资源负法律责任,所有资源请在下载后24小时内删除。
3 若有关在线投稿、无法下载等问题,请与本站客服人员联系。
4 如侵犯了您的版权、商标等,请立刻联系我们并具体说明情况后,本站将尽快处理删除,联系QQ:2499894784
点击加载更多评论>>