发布日期 : 2019/04/15

OpenACC GPU Applicaton Hackathon 2019 顺利召开,现场教你如何进行GPU移植和优化


由中国科学院计算机网络中心主办、英伟达&丽台科技协办的OpenACC GPU Applicaton Hackathon 2019年中国区活动于4月15日在北京中国科学院计算机网络信息中心顺利召开。该活动旨在普及面向GPU并行程序开发的OpenACC技术,提升广大用户在GPU应用移植领域的水平 。

活动于2019年4月15-19日举行。在为期五天的活动中,参与团队将有机会与指导者(Mentors)通过密集讨论与共同工作,对自己的应用进行GPU移植或优化。活动邀请了来自中科院、各大高校及英伟达等机构的一线GPU应用开发者担当本次Hackathon的指导老师,其中包括GPU编译器开发成员、OpenACC及OpenMP等业界标准的参与制定者等资深开发者在内。参与队伍将在五天的活动时间内初步实现所提交应用的GPU移植,或至少得到完成该目标的清晰路线图。

本次活动针对3-5人的开发团队,开发团队和指导老师一起进行代码编写和优化,帮助团队所携带的一种应用程序进行实现或优化GPU加速。在为期五天的活动中,各个团队对OpenACC有了进一步的了解,对如何更有效地利用时间也有所受益。

NVIDIA GPU 助力开发团队研究

丽台科技是国内领先的GPU整体解决方案提供商,携手英伟达,为广大的开发者们整理并精选了两款GPU产品,助力人工智能研究。

NVIDIA TESLA T4

为 TensorRT 超大规模推理平台赋能

NVIDIA® Tesla® T4 GPU 是世界上极其先进的推理加速器。搭载 NVIDIA Turing™ Tensor Core 的 T4 提供革命性的多精度推理性能,以加速现代人工智能的各种应用。T4 封装在节能的小型 70 瓦 PCIe 中,可针对横向扩展服务器进行优化,并且旨在实时提供极其先进的推理。

Tesla T4 引入革命性的 Turing Tensor Core 技术,具备人工智能推理的多精度计算性能。从 FP32 到 FP16 再到 INT8,又到 INT4 精度,T4 的性能比 CPU 高出 40 倍,实现性能的重大突破。

NVIDIA DGX-2

AI 企业的必要基础设施

NVIDIA DGX-2 是 NVIDIA 首款 2-petaFLOPS 系统,它整合了 16 个完全互联的 GPU,使深度学习性能提升 10 倍,突破了人工智能速度和规模的障碍。它采用 NVIDIA® DGX™ 软件和基于 NVIDIA NVSwitch 技术构建的可扩展架构,可以帮您应对众多复杂的人工智能挑战。

利用 RAPIDS 和 NVIDIA DGX-2 为数据科学和机器学习工作流程带来突破性性能。专为加速数据加载、数据操作和算法训练进行优化,利用 NVIDIA DGX-2 的高性能和较大的 GPU 显存占用量更快地获得见解。