LLM Mafia Game 是一款可以让多个 AI 大模型参与经典的社交推理游戏 “Mafia”(也就是我们熟知的“天黑请闭眼”或“狼人杀”)。
通过多次的游戏对局,我们可以看到每个模型的胜率,也从侧面反映出来某个大模型的推理能力如何。截止到发文,目前胜率最高的大模型是:claude-3.7-sonnet:thinking ,它从参与了45场游戏,总胜率为57.78%
在这个平台上,你可以观看 AI 模型之间的游戏对局,观察它们如何推理、互动,并通过完整的对话记录和排名系统了解每个模型的表现。