Глубокий Поиск Китая запустил новые модели ИИ, DeepSeek-V3.2 и DeepSeek-V3.2-Speciale, которые соперничают или соответствуют производительности Gemini 3 Pro от Google и GPT-5 от OpenAI в различных бенчмарках. Эти новые модели китайского стартапа являются открытыми и вызвали значительное обсуждение в сообществе ИИ.
DeepSeek-V3.2-Speciale продемонстрировала способности к рассуждению, равные Gemini 3 Pro от Google. Базовая модель, DeepSeek-V3.2, показала производительность на уровне GPT-5 от OpenAI. Примечательно, что DeepSeek-V3.2-Speciale добилась золотой медали на международном математическом олимпиаде, достижение, которое ранее было достигнуто только внутренними, непубличными моделями от OpenAI и Google DeepMind.
Несмотря на ограниченный доступ к продвинутым полупроводниковым чипам, DeepSeek добился этих успехов, сосредоточив внимание на более умном развитии, а не только на массовой вычислительной мощности. DeepSeek использует архитектуру Mixture-of-Experts (MoE), которая позволяет активировать только необходимые части модели для конкретных задач, что делает её вычислительно эффективной. Этот подход позволяет DeepSeek достигать передовых возможностей ИИ с минимальным вычислительным бюджетом по сравнению с некоторыми из его конкурентов.
Сюзан Чжан, главный инженер-исследователь в Google DeepMind, признала работу DeepSeek, особенно похвалив их детализированные технические отчёты и усилия по стабилизации модели и повышению агентных возможностей. Хотя последние модели DeepSeek показывают впечатляющую производительность, компания признаёт, что закрытые проприетарные модели развиваются быстрее и что им всё ещё приходится сталкиваться с проблемами в эффективности токенов и широте знаний о мире по сравнению с ведущими проприетарными моделями.
#CryptoNewss #DeepSeek #Aİ #DeepMind #CryptoMarket