Mark Collier briefed me on two updates under embargo at KubeCon Europe 2026 last month: Helion, which opens up GPU kernel ...
本文旨在梳理作者学习路径,带领读者共同探索 GPU Kernel 性能分析从宏观到微观的技术演进。 引言 作为一名使用eBPF进行CPU性能分析的工程师,在转向学习GPU性能优化分析时,一直在思考GPU上是否有技术也可以实现用户自定义探针式性能分析?学习NVIDIA Nsight ...
一般而言,机器学习团队理解GPU使用情况的常见度量标准是GPU利用率,通常通过在终端中运行nvidia-smi来查看。许多集成的可观测性工具也将GPU利用率作为其主要性能指标进行跟踪。 然而,AI Infra团队Trainy在实操中发现,GPU利用率并不总是理解GPU性能的最佳指标。
这项由香港科技大学、字节跳动、香港中文大学(深圳)以及南洋理工大学联合开展的研究发表于2026年,研究团队开发出了一套完整的训练系统,让大语言模型学会编写高性能的GPU内核代码。这项突破性工作首次系统性地解决了用强化学习训练AI模型编写内核 ...