DeepSeek V3 Выпуск: Эффективный алгоритм ведет новое направление в ИИ
На днях DeepSeek выпустил обновление версии V3, параметры модели достигли 685 миллиардов, что привело к значительному улучшению в кодировании, дизайне UI и способности вывода. Это обновление вызвало широкое обсуждение в отрасли о связи вычислительной мощности и Алгоритма.
На недавно завершившейся конференции 2025 GTC лидеры отрасли высоко оценили DeepSeek. Он отметил, что ранее рынок считал, что эффективная модель DeepSeek снизит потребность в чипах, что является ошибочным мнением; будущие вычислительные потребности только возрастут, а не уменьшатся.
DeepSeek как представитель прорывного алгоритма вызывает размышления о роли вычислительной мощности и алгоритма в развитии AI-индустрии в связи с отношениями между поставщиками оборудования.
Мутуалистская эволюция вычислительной мощности и алгоритма
В области ИИ увеличение вычислительной мощности создает основу для выполнения более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные паттерны; а оптимизация алгоритмов позволяет более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.
Симбиотические отношения между вычислительной мощностью и алгоритмами вновь формируют ландшафт индустрии ИИ:
Дифференциация технологических маршрутов: некоторые компании стремятся создать сверхбольшие вычислительные кластеры, в то время как такие компании, как DeepSeek, сосредотачиваются на оптимизации алгоритмической эффективности, формируя различные технические направления.
Реконструкция цепочки поставок: производители аппаратного обеспечения становятся лидерами в области ИИ Алгоритм через экосистему, а облачные сервисы снижают порог развертывания благодаря гибким вычислительным услугам.
Корректировка распределения ресурсов: предприятия ищут баланс между инвестициями в аппаратную инфраструктуру и разработкой эффективных Алгоритм.
Восход открытых сообществ: такие открытые модели, как DeepSeek, LLaMA, позволяют делиться достижениями в области алгоритмов и оптимизации вычислительной мощности, ускоряя техническую итерацию и распространение.
Технические инновации DeepSeek
Успех DeepSeek невозможен без его технических инноваций, ниже приведено краткое объяснение его основных инновационных аспектов:
Оптимизация архитектуры модели
DeepSeek использует комбинацию архитектуры Transformer+MOE (Смешанная группа экспертов) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура похожа на суперкоманду, где Transformer отвечает за выполнение обычных задач, а MOE выступает в роли группы экспертов, каждый из которых имеет свою специализацию. Когда возникает специфическая проблема, ее решает самый компетентный эксперт, что значительно повышает эффективность и точность модели. Механизм MLA позволяет модели более гибко фокусироваться на различных важных деталях при обработке информации, что дополнительно улучшает производительность модели.
Инновация методов обучения
DeepSeek представил фреймворк смешанной точности тренировки FP8. Этот фреймворк похож на умный распределитель ресурсов, который может динамически выбирать подходящую вычислительную точность в зависимости от требований на разных этапах тренировки. Он использует более высокую точность, когда требуется высокая точность вычислений, чтобы гарантировать точность модели; а когда можно принять более низкую точность, он снижает точность, чтобы сэкономить ресурсы вычислений, увеличить скорость тренировки и уменьшить использование памяти.
Повышение эффективности алгоритма
На этапе вывода DeepSeek внедрил технологию многотокенного предсказания (Multi-token Prediction, MTP). Традиционные методы вывода выполняются шаг за шагом, где на каждом шаге предсказывается только один токен. В то же время технология MTP позволяет предсказывать несколько токенов одновременно, что значительно ускоряет процесс вывода и снижает его стоимость.
Прорыв в алгоритме усиленного обучения
Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с вознаграждением и штрафом) оптимизирует процесс обучения модели. Укрепляющее обучение похоже на то, что модель получает тренера, который направляет ее на изучение лучших действий с помощью вознаграждений и штрафов. Новый алгоритм DeepSeek более эффективен, способен сократить ненужные вычисления, обеспечивая при этом повышение производительности модели, что позволяет достичь баланса между производительностью и затратами.
Эти инновации сформировали полную техническую систему, снижающую требования к вычислительной мощности на всем протяжении цепочки от обучения до вывода. Обычные потребительские видеокарты теперь могут запускать мощные AI модели, значительно снижая барьер для входа в AI приложения, позволяя большему количеству разработчиков и компаний участвовать в AI инновациях.
Влияние на производителей оборудования
DeepSeek напрямую оптимизирует алгоритм через уровень PTX (Параллельное Выполнение Потоков) от производителя оборудования. PTX является промежуточным языком представления, находящимся между высокоуровневым кодом и реальными инструкциями GPU, позволяя DeepSeek достигать более тонкой настройки производительности.
Влияние на производителей аппаратного обеспечения является двусторонним: с одной стороны, DeepSeek глубже связывается с аппаратным обеспечением и экосистемой, а снижение порога входа для AI-приложений может расширить общий размер рынка; с другой стороны, оптимизация алгоритма DeepSeek может изменить структуру спроса на высококачественные чипы, и некоторые AI-модели, которые ранее требовали высококачественные GPU для работы, теперь могут эффективно работать на среднеуровневых или даже потребительских видеокартах.
Значение для китайской AI индустрии
Оптимизация алгоритма DeepSeek предоставляет технологический прорыв для китайской AI-индустрии. В условиях ограничений на высококачественные чипы, подход "программное обеспечение вместо аппаратного обеспечения" снижает зависимость от импортных чипов высокого класса.
На upstream эффективный Алгоритм снизил давление на требования к вычислительной мощности, что позволяет провайдерам вычислительных услуг продлевать срок службы аппаратного обеспечения через программную оптимизацию и повышать возврат на инвестиции. На downstream оптимизированные открытые модели снизили порог разработки AI-приложений. Множество малых и средних предприятий могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не имея большого количества вычислительных ресурсов, что приведет к появлению большего числа AI-решений в вертикальных областях.
Глубокое влияние Web3+AI
Децентрализованная AI инфраструктура
Оптимизация алгоритма DeepSeek предоставляет новую动力 для инфраструктуры Web3 AI, инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают децентрализованное AI-вычисление возможным. Архитектура MOE идеально подходит для распределенного развертывания, разные узлы могут хранить разные экспертные сети, без необходимости единого узла для хранения полной модели, что значительно снижает требования к хранению и вычислениям для одного узла, тем самым повышая гибкость и эффективность модели.
FP8 тренировочная структура дополнительно снижает потребность в высокопроизводительных вычислительных ресурсах, что позволяет большему количеству вычислительных ресурсов присоединяться к сетевым узлам. Это не только снижает порог участия в децентрализованных AI вычислениях, но и повышает вычислительную мощность и эффективность всей сети.
Многоагентная система
Оптимизация интеллектуальных торговых стратегий: с помощью совместной работы агентов анализа данных о рынке в реальном времени, агентов прогнозирования краткосрочных ценовых колебаний, агентов выполнения сделок в блокчейне и агентов мониторинга результатов сделок, помогает пользователям получать более высокую прибыль.
Автоматическое выполнение смарт-контрактов: совместная работа агентов мониторинга смарт-контрактов, агентов выполнения смарт-контрактов, агентов контроля результатов выполнения и т.д. для реализации более сложной автоматизации бизнес-логики.
Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для стекинга или предоставления ликвидности в зависимости от их рискованной предрасположенности, инвестиционных целей и финансового положения.
DeepSeek именно в условиях ограничения вычислительных мощностей, благодаря инновациям в алгоритмах, находит прорывы, открывая различный путь развития для китайской AI-индустрии. Снижение порога применения, содействие интеграции Web3 и AI, уменьшение зависимости от высококачественных чипов, обеспечение финансовых инноваций — эти факторы уже меняют ландшафт цифровой экономики. Будущее развития AI больше не будет просто соревнованием вычислительных мощностей, а станет соревнованием по совместной оптимизации вычислительных мощностей и алгоритмов. На этой новой трассе инноваторы, такие как DeepSeek, переопределяют правила игры с помощью китайской мудрости.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
23 Лайков
Награда
23
7
Поделиться
комментарий
0/400
MetaverseVagabond
· 07-25 01:57
Снова блинчики, только начали, как уже падение.
Посмотреть ОригиналОтветить0
SmartContractWorker
· 07-23 22:18
Наконец-то не подтормаживает.
Посмотреть ОригиналОтветить0
GateUser-a180694b
· 07-22 19:04
Кто еще может с ним справиться?
Посмотреть ОригиналОтветить0
wrekt_but_learning
· 07-22 04:23
Ловите вычислительную мощность крупных инвесторов.
Посмотреть ОригиналОтветить0
ForkTongue
· 07-22 04:22
Что за дела, даже лучше покрутить Квазар.
Посмотреть ОригиналОтветить0
GasWaster
· 07-22 04:17
Еще один, кто кричит о снижении затрат, не может себе этого позволить.
Посмотреть ОригиналОтветить0
FUD_Whisperer
· 07-22 04:08
Вычислительная мощность реконструкция удивительный а
DeepSeek V3 революционный Алгоритм ИИ, ведущий в новую эпоху эффективных вычислений
DeepSeek V3 Выпуск: Эффективный алгоритм ведет новое направление в ИИ
На днях DeepSeek выпустил обновление версии V3, параметры модели достигли 685 миллиардов, что привело к значительному улучшению в кодировании, дизайне UI и способности вывода. Это обновление вызвало широкое обсуждение в отрасли о связи вычислительной мощности и Алгоритма.
На недавно завершившейся конференции 2025 GTC лидеры отрасли высоко оценили DeepSeek. Он отметил, что ранее рынок считал, что эффективная модель DeepSeek снизит потребность в чипах, что является ошибочным мнением; будущие вычислительные потребности только возрастут, а не уменьшатся.
DeepSeek как представитель прорывного алгоритма вызывает размышления о роли вычислительной мощности и алгоритма в развитии AI-индустрии в связи с отношениями между поставщиками оборудования.
Мутуалистская эволюция вычислительной мощности и алгоритма
В области ИИ увеличение вычислительной мощности создает основу для выполнения более сложных алгоритмов, позволяя моделям обрабатывать большие объемы данных и изучать более сложные паттерны; а оптимизация алгоритмов позволяет более эффективно использовать вычислительную мощность, повышая эффективность использования вычислительных ресурсов.
Симбиотические отношения между вычислительной мощностью и алгоритмами вновь формируют ландшафт индустрии ИИ:
Дифференциация технологических маршрутов: некоторые компании стремятся создать сверхбольшие вычислительные кластеры, в то время как такие компании, как DeepSeek, сосредотачиваются на оптимизации алгоритмической эффективности, формируя различные технические направления.
Реконструкция цепочки поставок: производители аппаратного обеспечения становятся лидерами в области ИИ Алгоритм через экосистему, а облачные сервисы снижают порог развертывания благодаря гибким вычислительным услугам.
Корректировка распределения ресурсов: предприятия ищут баланс между инвестициями в аппаратную инфраструктуру и разработкой эффективных Алгоритм.
Восход открытых сообществ: такие открытые модели, как DeepSeek, LLaMA, позволяют делиться достижениями в области алгоритмов и оптимизации вычислительной мощности, ускоряя техническую итерацию и распространение.
Технические инновации DeepSeek
Успех DeepSeek невозможен без его технических инноваций, ниже приведено краткое объяснение его основных инновационных аспектов:
Оптимизация архитектуры модели
DeepSeek использует комбинацию архитектуры Transformer+MOE (Смешанная группа экспертов) и вводит механизм многоголового латентного внимания (Multi-Head Latent Attention, MLA). Эта архитектура похожа на суперкоманду, где Transformer отвечает за выполнение обычных задач, а MOE выступает в роли группы экспертов, каждый из которых имеет свою специализацию. Когда возникает специфическая проблема, ее решает самый компетентный эксперт, что значительно повышает эффективность и точность модели. Механизм MLA позволяет модели более гибко фокусироваться на различных важных деталях при обработке информации, что дополнительно улучшает производительность модели.
Инновация методов обучения
DeepSeek представил фреймворк смешанной точности тренировки FP8. Этот фреймворк похож на умный распределитель ресурсов, который может динамически выбирать подходящую вычислительную точность в зависимости от требований на разных этапах тренировки. Он использует более высокую точность, когда требуется высокая точность вычислений, чтобы гарантировать точность модели; а когда можно принять более низкую точность, он снижает точность, чтобы сэкономить ресурсы вычислений, увеличить скорость тренировки и уменьшить использование памяти.
Повышение эффективности алгоритма
На этапе вывода DeepSeek внедрил технологию многотокенного предсказания (Multi-token Prediction, MTP). Традиционные методы вывода выполняются шаг за шагом, где на каждом шаге предсказывается только один токен. В то же время технология MTP позволяет предсказывать несколько токенов одновременно, что значительно ускоряет процесс вывода и снижает его стоимость.
Прорыв в алгоритме усиленного обучения
Новый алгоритм глубокого обучения DeepSeek GRPO (Обобщенная оптимизация с вознаграждением и штрафом) оптимизирует процесс обучения модели. Укрепляющее обучение похоже на то, что модель получает тренера, который направляет ее на изучение лучших действий с помощью вознаграждений и штрафов. Новый алгоритм DeepSeek более эффективен, способен сократить ненужные вычисления, обеспечивая при этом повышение производительности модели, что позволяет достичь баланса между производительностью и затратами.
Эти инновации сформировали полную техническую систему, снижающую требования к вычислительной мощности на всем протяжении цепочки от обучения до вывода. Обычные потребительские видеокарты теперь могут запускать мощные AI модели, значительно снижая барьер для входа в AI приложения, позволяя большему количеству разработчиков и компаний участвовать в AI инновациях.
Влияние на производителей оборудования
DeepSeek напрямую оптимизирует алгоритм через уровень PTX (Параллельное Выполнение Потоков) от производителя оборудования. PTX является промежуточным языком представления, находящимся между высокоуровневым кодом и реальными инструкциями GPU, позволяя DeepSeek достигать более тонкой настройки производительности.
Влияние на производителей аппаратного обеспечения является двусторонним: с одной стороны, DeepSeek глубже связывается с аппаратным обеспечением и экосистемой, а снижение порога входа для AI-приложений может расширить общий размер рынка; с другой стороны, оптимизация алгоритма DeepSeek может изменить структуру спроса на высококачественные чипы, и некоторые AI-модели, которые ранее требовали высококачественные GPU для работы, теперь могут эффективно работать на среднеуровневых или даже потребительских видеокартах.
Значение для китайской AI индустрии
Оптимизация алгоритма DeepSeek предоставляет технологический прорыв для китайской AI-индустрии. В условиях ограничений на высококачественные чипы, подход "программное обеспечение вместо аппаратного обеспечения" снижает зависимость от импортных чипов высокого класса.
На upstream эффективный Алгоритм снизил давление на требования к вычислительной мощности, что позволяет провайдерам вычислительных услуг продлевать срок службы аппаратного обеспечения через программную оптимизацию и повышать возврат на инвестиции. На downstream оптимизированные открытые модели снизили порог разработки AI-приложений. Множество малых и средних предприятий могут разрабатывать конкурентоспособные приложения на основе модели DeepSeek, не имея большого количества вычислительных ресурсов, что приведет к появлению большего числа AI-решений в вертикальных областях.
Глубокое влияние Web3+AI
Децентрализованная AI инфраструктура
Оптимизация алгоритма DeepSeek предоставляет новую动力 для инфраструктуры Web3 AI, инновационная архитектура, эффективные алгоритмы и низкие требования к вычислительной мощности делают децентрализованное AI-вычисление возможным. Архитектура MOE идеально подходит для распределенного развертывания, разные узлы могут хранить разные экспертные сети, без необходимости единого узла для хранения полной модели, что значительно снижает требования к хранению и вычислениям для одного узла, тем самым повышая гибкость и эффективность модели.
FP8 тренировочная структура дополнительно снижает потребность в высокопроизводительных вычислительных ресурсах, что позволяет большему количеству вычислительных ресурсов присоединяться к сетевым узлам. Это не только снижает порог участия в децентрализованных AI вычислениях, но и повышает вычислительную мощность и эффективность всей сети.
Многоагентная система
Оптимизация интеллектуальных торговых стратегий: с помощью совместной работы агентов анализа данных о рынке в реальном времени, агентов прогнозирования краткосрочных ценовых колебаний, агентов выполнения сделок в блокчейне и агентов мониторинга результатов сделок, помогает пользователям получать более высокую прибыль.
Автоматическое выполнение смарт-контрактов: совместная работа агентов мониторинга смарт-контрактов, агентов выполнения смарт-контрактов, агентов контроля результатов выполнения и т.д. для реализации более сложной автоматизации бизнес-логики.
Персонализированное управление инвестиционным портфелем: ИИ помогает пользователям в реальном времени находить лучшие возможности для стекинга или предоставления ликвидности в зависимости от их рискованной предрасположенности, инвестиционных целей и финансового положения.
DeepSeek именно в условиях ограничения вычислительных мощностей, благодаря инновациям в алгоритмах, находит прорывы, открывая различный путь развития для китайской AI-индустрии. Снижение порога применения, содействие интеграции Web3 и AI, уменьшение зависимости от высококачественных чипов, обеспечение финансовых инноваций — эти факторы уже меняют ландшафт цифровой экономики. Будущее развития AI больше не будет просто соревнованием вычислительных мощностей, а станет соревнованием по совместной оптимизации вычислительных мощностей и алгоритмов. На этой новой трассе инноваторы, такие как DeepSeek, переопределяют правила игры с помощью китайской мудрости.