Meta开源“记忆层”,重塑Transformer架构大模型 11月3日凌晨三点,全球社交巨头Meta分享了一个创新研究——Memory layers(记忆层)。目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆... 花花2025-01-068 阅读0 评论