英特尔在 Sapphire Rapids 之前发布 oneDNN 3.0

82次阅读
没有评论

英特尔连夜发布了 oneDNN 3.0 作为这个开源项目的最新主要版本,用于协助构建深度学习应用程序。这个 oneAPI 软件组件已经可以被 PyTorch、ONNX、MATLAB 和其他著名软件使用,同时 v3.0 版本为未来的英特尔硬件做好了准备。

之前的 oneDNN 2.x 版本已经围绕第 4 代 Xeon 可扩展“Sapphire Rapids”处理器进行了优化,而据说这个 oneDNN 3.0 版本提供了改进的性能。看起来 oneDNN 3.0 对 Sapphire Rapids 来说状态良好,特别是考虑到 Sapphire Rapids 一月份宣布的时间提前。

oneDNN 3.0 版本还为下一代至强可扩展“Granite Rapids”处理器引入了 FP16 支持和其他优化。如果 oneDNN 过去的节奏是正确的,那么预计接下来的几个 oneDNN 版本将进一步优化 Granite Rapids 的神经网络库。

oneDNN 3.0 版本还提高了英特尔数据中心 GPU Max 系列“Ponte Vecchio”以及英特尔 Arc Graphics DG2/Alchemist 和英特尔数据中心 GPU Flex 系列的性能。

英特尔在 Sapphire Rapids 之前发布 oneDNN 3.0
英特尔的 oneAPI 努力继续提供非常有用和有价值的开源软件的优秀集合。

很长一段时间以来,oneDNN 一直支持非 x86_64 CPU,而 oneDNN 3.0 也有许多 PowerPC 和 AArch64 改进。在 AArch64 方面,这个用于深度学习软件的英特尔库在可扩展矢量扩展 (SVE) 的使用方面进行了性能改进,并通过 Arm 的计算库 (ACL) 改进了 FP16 性能。在硬件方面,oneDNN 3.0 也对 AMD 和 NVIDIA GPU 的使用进行了更多改进。

除了新的硬件支持和优化之外,oneDNN 3.0 还增加了新的量化方案,带来了实验性的 Graph API,增加了对 Intel DPC++/C++ 2023.0 的支持,扩展了其线程池 API,还有其他变化。

正文完
 
Windows12系统管理员
版权声明:本站原创文章,由 Windows12系统管理员 2022-12-20发表,共计781字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)