1+1等于几?
现在的大推理模型(LRMs)已经展现出了非凡的推理能力。但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400+的tokens来思考。
那么有办法让LRMs在推理思考时更快更强吗?
来自港科大、港城、滑铁卢大学和Apple的研究人员,最近提出了Laser系列新方法,实现了更好的模型效率和准确率平衡,做到了两者的共同显著提升。
经过Laser和它的进阶方法Laser-D、Laser-DE训练后的模型,相较于训练前模型或者其他方法训练的模型,在准确率(Accuracy)和Tokens使用效率(Efficiency)上,同时取得了显著的提升。