ТестGLM-5.2: Опережает Opus 4.7, в 3 раза дешевле!

Содержание

Кодирование подешевело втрое: китайская модель GLM-5.2 составила конкуренцию ведущим ИИ-разработчикам

Исследование, проведенное компанией Snowflake, выявило, что новая большая языковая модель GLM-5.2 от китайской компании Zhipu AI (Z.ai) демонстрирует результаты, сопоставимые с флагманской моделью Claude Opus 4.7 от Anthropic в задачах программирования. При этом стоимость использования GLM-5.2 оказывается значительно ниже, что может оказать существенное влияние на западный рынок искусственного интеллекта.

Тестирование моделей: близость результатов и нюансы производительности

В ходе бенчмарка Snowflake оценила производительность GLM-5.2 и Claude Opus 4.7 на 103 задачах, связанных с написанием кода. Целью было создание программ, корректно работающих как в среде DuckDB, так и в Snowflake. Каждая задача была выполнена моделями по три раза.

Результаты показали, что при трех попытках на каждую задачу обе модели продемонстрировали схожую эффективность: GLM-5.2 успешно справилась с 66% заданий, а Claude Opus 4.7 – с 67%. Незначительная разница наблюдалась в точности с первой попытки: Opus решил 53,7% задач сразу, в то время как GLM – 47,6%.

Анализ показал, что GLM-5.2 потребовалось больше итераций для решения задач – в среднем 99 против 80 у Opus. Также китайская модель потребила почти вдвое больше токенов – 860 миллионов против 439 миллионов. CEO Snowflake Шридхар Рамасвами отметил, что особенностью GLM является её способность точно проверять код сразу на двух платформах, DuckDB и Snowflake, что позволило ей решить ряд задач, недоступных другим моделям.

Тем не менее, GLM-5.2 проявила и слабые стороны. Иногда модель преждевременно завершала работу или чрезмерно фокусировалась на проверке второстепенных деталей. Так, в одном из случаев GLM выполнила 411 вызовов инструментов за 24 минуты, анализируя количество строк, распределения данных, null-значения и типы колонок, но так и не справилась с задачей за три попытки. Claude Opus, напротив, решил аналогичную задачу за 49 вызовов и 9 минут. Рамасвами также опроверг предположение о том, что GLM генерирует более чистый код, подчеркнув, что большее количество проверок не всегда означает лучшее качество. Несмотря на эти замечания, в Snowflake выразили удовлетворение работой GLM-5.2 и планируют сделать модель доступной для клиентов.

Ценовая политика: китайское предложение на рынке ИИ

Ключевым фактором, делающим GLM-5.2 привлекательной, является её цена. Согласно официальному прайс-листу Zhipu, стоимость использования GLM-5.2 составляет $1,40 за миллион входных токенов и $4,40 за миллион выходных. Некоторые сторонние поставщики предлагают еще более выгодные условия.

Для сравнения, Claude Opus 4.7 оценивается в $5 за входные и $25 за выходные токены. Модель GPT-5.5 от OpenAI стоит $5 за входные и $30 за выходные токены.

Модель	Вход	Кешированный вход	Выход
GLM-5.2	$1,40	$0,26	$4,40
Claude Opus 4.7	$5,00	$0,50 (Cache Hit)	$25,00
GPT-5.5	$5,00	$0,50	$30,00
GPT-5.4	$2,50	$0,25	$15,00

Несмотря на то, что более высокое потребление токенов GLM-5.2 несколько снижает её ценовое преимущество, общий эффект давления на Anthropic и OpenAI, особенно в области программирования, остается значительным. Программирование является одним из ключевых направлений монетизации для обеих западных компаний.

Если ценовое давление со стороны китайских разработчиков продолжит замедлять или сокращать рост доходов OpenAI и Anthropic, перегретый рынок ИИ может столкнуться с серьёзными испытаниями. Оценки этих компаний во многом базируются на прогнозах стремительного увеличения выручки, которые, в свою очередь, поддерживают масштабные инвестиции в инфраструктуру, включая дата-центры и закупку специализированных чипов.

Кодирование подешевело втрое: китайская модель GLM-5.2 составила конкуренцию ведущим ИИ-разработчикам

Тестирование моделей: близость результатов и нюансы производительности

Ценовая политика: китайское предложение на рынке ИИ

Похожие записи

Claude-хак: как простой промпт и ИИ взломали 14 компаний, написав код и найдя уязвимости

Как отличить ШИ-образы от реальных фото: мастер-класс для зоркого глаза.

Claude AI (Клауд AI): что это такое, как пользоваться, тарифы и чем отличается от ChatGPT