انتقل إلى المحتوى الرئيسي

تصنيف LLM والأسعار

المرتبة

LMSYS

模型分数
GPT-4-Turbo-2024-04-091258
Claude 3 Opus1253
Gemini 1.5 Pro API-0409-Preview1249
Meta Llama 3 70b Instruct1213
Claude 3 Sonnet1201
Command R+1192
Claude 3 Haiku1181
Mistral-Large-24021158
Qwen1.5-72B-Chat1153
Command R1150
Mistral Medium1147
Meta Llama 3 8b Instruct1147
Mixtral-8x22b-Instruct-v0.11145
Qwen1.5-32B-Chat1134
GPT-3.5-Turbo-06131119
Qwen1.5-14B-Chat1119
Mixtral-8x7b-Instruct-v0.11114
Yi-34B-Chat1109
WizardLM-70B-v1.01108

图片

معايير تقييم

baichuan13B-表格

تقييم RAG

https://mp.weixin.qq.com/s/EdoA5fcyzgTw3LarMMe00g

image-20240424170230823

LMSYS

🏆 LMSYS Chatbot Arena Leaderboard

梯队分数代表
第一梯队200分以上GPT-4
Claude 3中杯和大杯
第二梯队150分以上Mistral中杯和大杯
Claude 3小杯
千问72B
第三梯队110分以上GPT-3.5

زيادة بنسبة 12% في GPT-4 مقارنة بـ GPT-3.5

كوب Claude 3 يزيد بنسبة 6% مقارنة بـ GPT-3.5

image-20240329152610807

image-20240329152736938

تقييم CLUE الصينية

CLUE中文语言理解测评基准

https://mp.weixin.qq.com/s/cI92Fp2ic13_BKaRSgZw4g

图片

السعر

Claude

Mistral

Gemini:暂时只有 1.0 Pro的价格