Công ty Alibaba đã ra mắt "công cụ AI lập trình tiên tiến nhất" — mô hình AI mã nguồn mở Qwen3-Coder.
Qwen3-Coder đã có mặt! ✅
Chúng tôi đang phát hành Qwen3-Coder-480B-A35B-Instruct, mô hình mã mở có khả năng mạnh nhất của chúng tôi cho đến nay. Mô hình Mixture-of-Experts 480B tham số (35B active) hỗ trợ ngữ cảnh 256K và có thể mở rộng lên 1M ngữ cảnh với ngoại suy. Nó đạt được… pic.twitter.com/Z8HfyrVScE
— Qwen (@Alibaba_Qwen) 22 tháng 7, 2025
Mạng nơ-ron được thiết kế cho các nhiệm vụ liên quan đến lập trình. Nó có khả năng viết mã và quản lý các quy trình làm việc phức tạp, thể hiện sự tiến bộ trong các lĩnh vực khác:
theo dõi hướng dẫn;
tư duy logic;
hiểu văn bản;
toán học;
khoa học tự nhiên;
sử dụng công cụ.
Công ty định vị sản phẩm là "cực kỳ mạnh" trong các nhiệm vụ AI tác nhân - khi trí tuệ nhân tạo có khả năng tự làm việc mà không cần sự can thiệp của con người.
< pic.twitter.com/M8krjTM4tq
— Qwen (@Alibaba_Qwen) 22 tháng 7, 2025
Theo dữ liệu được cung cấp, Qwen3-Coder đã vượt qua các đối thủ Trung Quốc, bao gồm các mẫu từ DeepSeek và K2 của Moonshot AI, theo một số chỉ số. Cụ thể, trong cuộc thi Olympic Toán học Mỹ, nó đã đạt 70,3 điểm so với 46,6 của DeepSeek-V3-0324.
Trong bài kiểm tra lập trình MultiPL-E, mô hình ngôn ngữ đã đạt 87,9 điểm, chỉ số DeepSeek là 82,2.
Trong một số lĩnh vực, mạng nơ-ron có thể so sánh với các sản phẩm tương đương tiên tiến của Mỹ như Claude từ Anthropic và GPT-4 từ OpenAI.
Mạng nơ-ron Qwen3-235B-A22B-Instruct-2507-FP8 là bản cập nhật của phiên bản trước đó Qwen3-235B-A22B-FP8, nhưng hoạt động ở chế độ không lập luận - đưa ra kết quả mà không cần các suy luận logic từng bước. Nhờ đó, độ dài tối đa của nội dung được xử lý đã tăng gấp tám lần - lên tới 256 000 token, cho phép làm việc với các văn bản lớn hơn rất nhiều trong một cuộc đối thoại.
Nhắc lại, vào tháng 5, Alibaba đã công bố một đột phá trong việc giảm chi phí đào tạo các mô hình AI tập trung vào tìm kiếm.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Bộ mã hóa AI mới của Alibaba đã vượt qua DeepSeek
Bộ mã hóa AI mới của Alibaba đã vượt qua DeepSeek
Công ty Alibaba đã ra mắt "công cụ AI lập trình tiên tiến nhất" — mô hình AI mã nguồn mở Qwen3-Coder.
Mạng nơ-ron được thiết kế cho các nhiệm vụ liên quan đến lập trình. Nó có khả năng viết mã và quản lý các quy trình làm việc phức tạp, thể hiện sự tiến bộ trong các lĩnh vực khác:
Công ty định vị sản phẩm là "cực kỳ mạnh" trong các nhiệm vụ AI tác nhân - khi trí tuệ nhân tạo có khả năng tự làm việc mà không cần sự can thiệp của con người.
Theo dữ liệu được cung cấp, Qwen3-Coder đã vượt qua các đối thủ Trung Quốc, bao gồm các mẫu từ DeepSeek và K2 của Moonshot AI, theo một số chỉ số. Cụ thể, trong cuộc thi Olympic Toán học Mỹ, nó đã đạt 70,3 điểm so với 46,6 của DeepSeek-V3-0324.
Trong bài kiểm tra lập trình MultiPL-E, mô hình ngôn ngữ đã đạt 87,9 điểm, chỉ số DeepSeek là 82,2.
Trong một số lĩnh vực, mạng nơ-ron có thể so sánh với các sản phẩm tương đương tiên tiến của Mỹ như Claude từ Anthropic và GPT-4 từ OpenAI.
Mạng nơ-ron Qwen3-235B-A22B-Instruct-2507-FP8 là bản cập nhật của phiên bản trước đó Qwen3-235B-A22B-FP8, nhưng hoạt động ở chế độ không lập luận - đưa ra kết quả mà không cần các suy luận logic từng bước. Nhờ đó, độ dài tối đa của nội dung được xử lý đã tăng gấp tám lần - lên tới 256 000 token, cho phép làm việc với các văn bản lớn hơn rất nhiều trong một cuộc đối thoại.
Nhắc lại, vào tháng 5, Alibaba đã công bố một đột phá trong việc giảm chi phí đào tạo các mô hình AI tập trung vào tìm kiếm.