根据论文,DeepSeek通过U型扩展定律解决平衡问题,在总参数和算力预算固定的情况下,研究团队系统性地调整MoE和Engram的比例,得出将20%至25%的稀疏参数分配给Engram的最优平衡点。