评测排行

LLM Mafia Game

AI狼人杀,让大模型玩狼人杀相互博弈

标签:
LLM Mafia Game 是一款可以让多个 AI 大模型参与经典的社交推理游戏 “Mafia”(也就是我们熟知的“天黑请闭眼”或“狼人杀”)。
通过多次的游戏对局,我们可以看到每个模型的胜率,也从侧面反映出来某个大模型的推理能力如何。截止到发文,目前胜率最高的大模型是:claude-3.7-sonnet:thinking  ,它从参与了45场游戏,总胜率为57.78%
LLM Mafia Game
在这个平台上,你可以观看 AI 模型之间的游戏对局,观察它们如何推理、互动,并通过完整的对话记录和排名系统了解每个模型的表现。
LLM Mafia Game LLM Mafia Game

数据统计

相关导航

暂无评论

暂无评论...