Mô hình AI mới của DeepSeek Trung Quốc đã ra mắt, DeepSeek-V3.2 và DeepSeek-V3.2-Speciale, cạnh tranh hoặc tương đương với hiệu suất của Google Gemini 3 Pro và GPT-5 của OpenAI trong nhiều bài kiểm tra. Những mô hình mới này từ công ty khởi nghiệp Trung Quốc được mã nguồn mở và đã tạo ra cuộc thảo luận đáng kể trong cộng đồng AI.
DeepSeek-V3.2-Speciale đã chứng minh khả năng suy luận tương đương với Google Gemini 3 Pro. Mô hình cơ sở, DeepSeek-V3.2, hoạt động tương đương với GPT-5 của OpenAI. Đặc biệt, DeepSeek-V3.2-Speciale đã đạt hiệu suất huy chương vàng trong bài kiểm tra Olympic Toán học Quốc tế, một thành tựu trước đây chỉ đạt được bởi các mô hình nội bộ, không công khai từ OpenAI và Google DeepMind.
Mặc dù có quyền truy cập hạn chế vào các chip bán dẫn tiên tiến, DeepSeek đã đạt được những tiến bộ này thông qua việc tập trung vào phát triển thông minh hơn thay vì chỉ dựa vào sức mạnh tính toán khổng lồ. DeepSeek sử dụng kiến trúc Mixture-of-Experts (MoE), cho phép nó kích hoạt chỉ những phần cần thiết của mô hình cho các nhiệm vụ cụ thể, giúp nó trở nên hiệu quả về mặt tính toán. Cách tiếp cận này cho phép DeepSeek đạt được khả năng AI tiên tiến với một phần nhỏ ngân sách tính toán so với một số đối thủ cạnh tranh của nó.
Susan Zhang, kỹ sư nghiên cứu chính tại Google DeepMind, đã công nhận công việc của DeepSeek, đặc biệt khen ngợi các báo cáo kỹ thuật chi tiết của họ và nỗ lực trong việc ổn định mô hình và nâng cao khả năng tác động. Trong khi các mô hình mới nhất của DeepSeek cho thấy hiệu suất ấn tượng, công ty thừa nhận rằng các mô hình độc quyền mã nguồn đóng đã phát triển nhanh hơn và họ vẫn phải đối mặt với những thách thức trong hiệu quả token và chiều rộng kiến thức thế giới so với các mô hình độc quyền hàng đầu.
#CryptoNewss #DeepSeek #Aİ #DeepMind #CryptoMarket