05
2025/08

ACL2025|AdaGroPE:免训练即插即用扩窗至128k

引言:为什么大模型需要更长的“记忆”? 在人工智能的浪潮之巅,大型语言模型(LLM)无疑是最耀眼的明星。从回答复杂问题到创作诗歌剧本,它们展现出的强大能力正深 ...

ACL2025|大模型响应采样理论:「描述性」与「规定性」

引言:当LLM面临选择,它会如何“思考”? 近年来,大型语言模型(Large Language Models, LLMs),例如我们熟知的 GPT-4、Cla ...