В начале неделе Китай запустил новую нейросеть, работа которой основана на модели искусственного интеллекта. DeepSeek-R1 разработали в одноименной компании, основанной в 2023 году в китайском Ханчжоу. Нейросеть обрабатывает последовательности данных за счет машинного обучения, находит паттерны и работает с контентом.
В конце 2024 года разработчики представили DeepSeek-V3, а через месяц – более совершенную DeepSeek-R1. При этом нейросеть могут изучать программисты со всего мира, так как исходный код находится в свободном доступе. Многие называют созданную нейросеть «темной лошадкой» и считают ее секретным оружием Китая в технологической войне с США.
DeepSeek более экономична по сравнению с американскими аналогами. При этом, DeepSeek-R1 распространяется бесплатно, а за неограниченный доступ к американской OpenAI разработчики требуют 200 долларов США.
Успех и экономичность нейросети объяснил создатель Телеграма Павел Дуров. Это связано с подходом среднего образования в КНР.
– После успеха DeepSeek многие удивляются тому, как быстро Китай догнал США в области ИИ. Однако прогресс Китая в эффективности алгоритмов не возник из ничего. Китайское образование превосходит западное в части подготовке выдающихся математиков и ученых – КНР поощряет высокоэффективную модель жесткой конкуренции между учениками, заимствованную у СССР, – прокомментировал Павел Дуров.
Создатель Телеграма добавил, что в дальнейшем эталонов ИИ станет больше.
И как доказательство – Китай выпустил еще одну нейросеть, которая превосходит DeepSeek – Qwen 2.5-Max. Её разработчиком выступила компания Alibaba Cloud. Новая нейросеть умеет генерировать фотореалистичные изображения и видео высокого качества.
Лучше всех
Россияне уже по достоинству оценили DeepSeek. Красноярский журналист, исследователь ИИ Владислав Пирогов использует нейросети для написания текстов и освоения программирования.
– DeepSeek удивил с самых первых минут использования. Я не поверил, что это китайская модель. До этого тестировал другую нейросеть – Qwen, тоже китайскую, при написании текстов, и она совсем не понравилась. DeepSeek прекрасен, по моему мнению, несколькими вещами. И первая – это отсутствие ограничений. Не нужны сторонние сервисы для использования, ничего не нужно платить. При этом у DeepSeek не самая высокая скорость по сравнению с топ-моделями, но всё же она достойная, – признался Владислав.
Молодой человек отметил, что ему нравится программировать на DeepSeek. Он сравнил ее с западной – ChatGPT. Китайская нейросеть не издевается над кодом при переписывании, например, версии программы целиком, и редко «выдирает» из него фрагменты. У неё очень обширные знания, что позволяет делать интересные проекты.
– Я создаю на ней удобные программы для себя и, вероятно, для дальнейшего развития и продажи. Например, полностью сделал голосового ассистента с поддержкой ИИ, который управляет компьютером и даёт советы. Но вот качество написания текстов, хоть и неплохое, но уступает еще одной популярной американской нейросети – Claude. Что касается поиска в интернете и компьютерного зрения, то тут всё в порядке – в основном DeepSeek справляется, – пояснил журналист.
Еще одной сильной стороной он назвал умение вести длинные диалоги и режим DeepThink.
– Ты пишешь задачу, на терминологии промпт, включаешь этот режим и нейросеть как бы «бормочет про себя» что должна сделать. Это так и выглядит: «Так, пользователь сказал мне сделать то-то. Как я буду это делать...». Правда, пока я не увидел особого превосходства этого режима над стандартным, кроме потери времени на рассуждения, но, думаю, товарищи идут в правильном направлении, реализуя функцию из разрекламированных «нейронок» в открытой версии, – объяснил молодой человек.
Владислав рассказал, что атака на DeepSeek после ошеломительного успеха больно ударила. Он не нашёл достойной альтернативы в кодинге. Та же ChatGPT, на его взгляд, программирует ужасно. Он опасается, что китайские разработчики задумаются о правилах безопасности и ограничении доступа для всех, и благородный посыл – нести свет ИИ в темные массы – сменится коммерческими мотивами и стремлением обезопаситься от конкурентов, а равно закрыться.
Учится самостоятельно
Кстати, разработчики из США обвиняют команду DeepSeek в использовании обучающих моделей OpenAI и ChatGPT.
«Microsoft Corp. И OpenAI расследуют, были ли выходные данные из технологии OpenAI получены несанкционированным путем группой, связанной с китайским стартапом в области искусственного интеллекта DeepSeek», – сообщает агентство «Блумберг».
При этом, в компании «Яндекс» объяснили, что ИИ обучаются на данных, доступных в интернете. Обучение ИИ-моделей происходит не только в виде заучивания фактической информации, но и с пониманием стиля и контекста, где эта информация появляется. Кроме того, если DeepSeek генерирует ответ на русском языке, то повышается вероятность использования информации, связанной с «Яндексом», из-за популярности этих продуктов.
За считанные дни DeepSeek возглавил рейтинги приложений в AppStore Китая, США, Великобритании и других стран.