LLM Rankings e Preços
Ranking
模型 | 分数 |
---|---|
GPT-4-Turbo-2024-04-09 | 1258 |
Claude 3 Opus | 1253 |
Gemini 1.5 Pro API-0409-Preview | 1249 |
Meta Llama 3 70b Instruct | 1213 |
Claude 3 Sonnet | 1201 |
Command R+ | 1192 |
Claude 3 Haiku | 1181 |
Mistral-Large-2402 | 1158 |
Qwen1.5-72B-Chat | 1153 |
Command R | 1150 |
Mistral Medium | 1147 |
Meta Llama 3 8b Instruct | 1147 |
Mixtral-8x22b-Instruct-v0.1 | 1145 |
Qwen1.5-32B-Chat | 1134 |
GPT-3.5-Turbo-0613 | 1119 |
Qwen1.5-14B-Chat | 1119 |
Mixtral-8x7b-Instruct-v0.1 | 1114 |
Yi-34B-Chat | 1109 |
WizardLM-70B-v1.0 | 1108 |
Critérios de avaliação
Score do RAG
https://mp.weixin.qq.com/s/EdoA5fcyzgTw3LarMMe00g
LMSYS é
🏆 LMSYS Chatbot Arena Leaderboard
梯队 | 分数 | 代表 |
---|---|---|
第一梯队 | 200分以上 | GPT-4 Claude 3中杯和大杯 |
第二梯队 | 150分以上 | Mistral中杯和大杯 Claude 3小杯 千问72B |
第三梯队 | 110分以上 | GPT-3.5 |
12% de aumento em GPT - 4 em comparação com GPT - 3.5
Claude 3 Cups 6% de aumento em comparação com GPT - 3.5
Avaliação do CLUE chinês
https://mp.weixin.qq.com/s/cI92Fp2ic13_BKaRSgZw4g
Preço
Gemini:暂时只有 1.0 Pro的价格