Kimi K2 là mô hình AI mới từ Moonshot AI (Trung Quốc), sử dụng kiến trúc sparse mixture-of-experts (MoE) với 1.000 tỷ tham số tổng thể, trong đó 32 tỷ tham số hoạt động cho mỗi truy vấn.
Chạy với tốc độ 185 tokens/giây trên GroqCloud và hỗ trợ cửa sổ ngữ cảnh lên tới 1.28.000 tokens – phù hợp với các tác vụ phức tạp, yêu cầu truy xuất dài hạn.
Kimi K2 hiện đứng thứ #14 trên OpenRouter, vượt qua cả GPT-4.1 và Grok 4.
Trên các benchmark:
SWE-bench Verified: 65,8% (cao hơn GPT-4.1 – 54,6%)
LiveCodeBench: 53,7% (cao hơn DeepSeek V3 – 46,9% và GPT-4.1 – 44,7%)
Math-500: 97,4% (GPT-4.1 đạt 92,4%)
Short-Story Creative Writing: 8,56 (vượt o3-pro – 8,44)
Kimi K2 có hai biến thể: Base (cho nghiên cứu và tinh chỉnh) và Instruct (dành cho chatbot và agent).
Sử dụng dữ liệu tổng hợp từ hệ thống ACEBench để huấn luyện khả năng sử dụng công cụ trong hàng trăm lĩnh vực.
Có thể tự động thực hiện chuỗi tác vụ như gọi API, viết code, debug, tạo đồ thị, xây web mà không cần hướng dẫn từng bước.
Giá API rẻ hơn Claude Sonnet 4 khoảng 80–90% dựa trên chi phí mỗi token.
Là mô hình không chuyên về lập luận, nhưng lại thể hiện khả năng sáng tạo vượt trội, gây chú ý trong cộng đồng AI.
Ethan Mollick cho biết Kimi K2 đôi khi tạo ra thông tin sai lệch đáng tin, chưa phù hợp với các tác vụ yêu cầu chính xác cao.
OpenAI được cho là đã trì hoãn phát hành mô hình nguồn mở của mình ngay sau khi Kimi K2 ra mắt, do bất ngờ trước sức mạnh của mô hình Trung Quốc này.
DeepSeek R2 – đối thủ tiềm năng tiếp theo – hiện chưa phát hành, bị chậm do các hạn chế xuất khẩu chip NVIDIA H20 từ Mỹ sang Trung Quốc.
📌 Kimi K2 là bước tiến vượt bậc của AI nguồn mở Trung Quốc, với 1.000 tỷ tham số và hiệu năng ấn tượng trên nhiều benchmark như SWE-bench (65,8%) và Math-500 (97,4%). Với giá rẻ hơn 90% so với Claude Sonnet và khả năng xử lý công cụ mạnh mẽ, Kimi K2 đang trở thành mối đe dọa thực sự cho các ông lớn AI toàn cầu.
https://analyticsindiamag.com/global-tech/chinas-kimi-k2-could-be-the-next-deepseek-moment/