Running Agents 7 Polish Cultural Vision Benchmark (PCVB) 🏆 7 Show model benchmark scores in an interactive table and plot
Paused Agents 28 MT Bench PL 📊 28 Przeglądaj i porównuj odpowiedzi modeli językowych w języku polskim
Running on CPU Upgrade Agents 77 Open PL LLM Leaderboard 🏆 77 Explore LLM benchmark leaderboard with searchable filters