正文

斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准

花花