Escribe para buscar · Enter para resultados completos

7.6 Global

gpt-oss:20b

Judge: qwen3.6:latest · 144/160 tests · 55 min 13 s · 48.2 tok/s

20.9B · MXFP4 · 12.8 GB · 131K ctx

ToolsThinking

Desglose por categoría

surprise 10.0
long-context 9.9
organization 9.5
agentic 9.3
code 9.0
math 8.2
reasoning 8.2
instruction 8.0
frontend 7.2
roleplay 6.9
multilingual 6.4
writing 4.8
safety 4.4