Phát hànhtháng 12, 2025
Giá input$0.1/1M
Giá output$0.3/1M
Thứ hạng
Đánh giá
MiMo-V2-Flash là model flash nổi bật trong mảng toán học và AI agent, phù hợp với developer cần một model nhanh cho automation và giải toán cạnh tranh. Tuy nhiên, với các tác vụ đòi hỏi suy luận cực khó (Humanity's Last Exam) hoặc lập trình khoa học chuyên sâu (SciCode), model còn khoảng cách so với các flagship. Phù hợp nhất cho nhóm cần hiệu năng/chi phí tốt ở toán học và agent task.
Điểm mạnh
- Toán học xuất sắc: AA Math Index 96.3 và AIME 2025 đạt 0.963 — top tier cho các bài toán cạnh tranh
- AI Agent mạnh vượt trội: τ²-bench đạt 0.950, phù hợp cho các tác vụ tự động hóa nhiều bước
- Lập trình cạnh tranh tốt: LiveCodeBench 0.868 và AA Coding Index 33.5 cho thấy khả năng code thực chiến cao
- Suy luận khoa học vững: GPQA Diamond 0.846 và MMLU-Pro 0.843 thể hiện nền tảng kiến thức đa ngành chắc chắn
Điểm yếu
- Suy luận cực khó còn hạn chế: Humanity's Last Exam chỉ 0.211 — yếu ở các bài toán đòi hỏi suy luận đỉnh cao vượt ngoài phân phối
- Lập trình khoa học và terminal thấp: SciCode 0.394 và Terminal-Bench Hard 0.310 cho thấy điểm nghẽn với các task coding phức tạp, đặc thù
- Long Context Reasoning trung bình: 0.643 — xử lý ngữ cảnh dài chưa ổn định
Use case
Giải toán thi đấu, học thuật, thi AIME/AMC và các bài toán STEM có cấu trúc rõXây dựng AI agent tự động hóa workflow — đặc biệt các pipeline nhiều bước cần ra quyết định liên tụcHỗ trợ lập trình thông thường: viết code, review, debug trên các bài toán tiêu chuẩn LiveCodeBench