【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。 试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰? 又有多少开发者曾因为频频闪烁的警报「 ...
【导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。 试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰? 又有多少开发者曾因为频频闪烁的警报「CUDA版本 ...
机器之心报道 编辑:张倩 用 AI 提高 AI 的效率,它们就能变得像人类大脑一样高效? 我们的大脑只用了 20 瓦的能量就能完成复杂思考,而现代 AI 系统却需要成排的高功率 GPU 和惊人的电力消耗。这种差距如何缩小? 日本 AI 初创公司 Sakana AI 团队提出了一个大胆 ...
点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 随着NVIDIA不断推出基于新架构的GPU产品,机器学习框架需要相应地更新以支持这些硬件。本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,并详细分析了问题根源及其解决方案,以期为遇到类似情况的 ...
科技行者 on MSN
DeepReinforce突破:AI生成超越英伟达官方性能的CUDA核心代码
这项由DeepReinforce团队完成的突破性研究发表于2025年12月,研究编号为arXiv:2512.02551v1。论文的主要作者包括苏松桥、孙晓飞、李小雅、王阿尔伯特、李机伟和沈克里斯等研究人员。这项研究首次证明了人工智能可以在矩阵计算这一GPU最核心的操作上超越英伟达官方优化库,对整个人工智能和高性能计算领域具有重大意义。 想象一下你在厨房做菜,需要快速切菜、炒菜、调味等各种操作。在计 ...
多年以来,英伟达为 GPU 开发的 CUDA 软件工具包始终缺少原生 Python 支持,现如今这种情况终于有所转变。在近期的 GTC 大会上,英伟达宣布其 CUDA 工具包将为 Python 提供原生支持并全面与之集成。也就是说,开发人员能够使用 Python 直接在 GPU 上执行算法式计算。 据悉,2025 年被英伟达视为“CUDA Python ...
前阵子看到 Anthropic 要花 210 亿美元买 100 万块谷歌 TPU v7 芯片的消息时,我正在和运维同事争论要不要给新服务升级英伟达 B200。他坚持 “CUDA 生态成熟,出了问题好找解决方案”,我却觉得 ...
近日,一则有关英伟达试图在其CUDA软件中封杀第三方GPU公司的消息,正引起国内外人工智能及芯片行业的关注。在CUDA 11.6版本开始,安装的时候会在EULA(最终用户许可协议)中看到相关警告条款:“你不能逆向工程、反编译或反汇编使用此SKD生成的任何结果 ...
快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。 新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...
目前ZLUDA还处于alpha版本,但它已经被证实能够支持多种原生CUDA应用程序,如Geekbench、3DF Zephyr、Blender、Reality ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果