05
2025/08
ACL2025|AdaGroPE:免训练即插即用扩窗至128k
引言:为什么大模型需要更长的“记忆”?
在人工智能的浪潮之巅,大型语言模型(LLM)无疑是最耀眼的明星。从回答复杂问题到创作诗歌剧本,它们展现出的强大能力正深
...
ACL2025|大模型响应采样理论:「描述性」与「规定性」
引言:当LLM面临选择,它会如何“思考”?
近年来,大型语言模型(Large Language Models, LLMs),例如我们熟知的 GPT-4、Cla
...