谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作 想挑战 Transformer 的新架构有很多,来自谷歌的“正统”继承者 Titan 架构更受关注。英伟达把测试时间计算(Test-time Computing)称为大模型的第三个 Scaling Law。Ope... 花花2025-01-157 阅读0 评论
中国最受瞩目的具身智能公司 发布首个基础大模型 说要打破行业瓶颈 1月10日消息,近日,银河通用联合北京智源人工智能研究院(BAAI)及北京大学和香港大学研究人员,郑重发布首个全面泛化的端到端具身抓取基础大模型 GraspVLA。据介绍,GraspVLA 的训练包含预训练和后训... 花花2025-01-106 阅读0 评论
OpenAI o3 ARC-AGI测试结果 这标志着AI能力的一次重要的阶跃式提升,令人惊喜地展现了此前GPT系列模型从未具备的新型任务适应能力。相比之下,ARC-AGI-1从2020年的GPT-3的0%进步到2024年GPT-4o的5%,用了整整四年。为了o... 花花2024-12-2241 阅读0 评论