在intel 600系列和700系列的一些主板中,你会在BIOS中看到Above 4G Decoding和Re-Size Bar两个选项,有人说这两个选项是为搭配A卡使用时准备的,N卡没有必要开启;有人说只要你有独立显卡,不管是A卡还是N卡,都有必要开启,会为显卡带来性能方面的提升;还有人说 ...
推测解码(Speculative Decoding)是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下,获得 3 倍以上的加速比。GPT-4 泄密报告也提到 OpenAI 线上模型推理使用了它。针对如此妙的方法,香港理工大学、北京大学、MSRA 以及阿里共同推出 ...