05

2025/08

ACL2025｜AdaGroPE：免训练即插即用扩窗至128k

引言：为什么大模型需要更长的“记忆”？在人工智能的浪潮之巅，大型语言模型（LLM）无疑是最耀眼的明星。从回答复杂问题到创作诗歌剧本，它们展现出的强大能力正深 ...

6 天前

32 0

引言：当LLM面临选择，它会如何“思考”？近年来，大型语言模型（Large Language Models, LLMs），例如我们熟知的 GPT-4、Cla ...

6 天前

33 0