新测试基准发布,最强开源Llama 3尴尬了 梦晨 发自 凹非寺量子位 | 公众号 QbitAI如果试题太简单,学霸和学渣都能考90分,拉不开差距……随着Claude 3、Llama 3甚至之后GPT-5等...