Cointime

扫码下载App
iOS & Android

最新发表

我们做了一个大模型测试集「Z-Bench」,300个问题全方位考察大语言模型能力

自 ChatGPT 发布以来,我们经常会在使用它时发出惊叹:“啊,这个居然它也能答出来!”与此同时,我们也欣喜地看到,越来越多的大模型团队和产品如雨后春笋般出现。
我们做了一个大模型测试集「Z-Bench」,300个问题全方位考察大语言模型能力