Содержание
Кодирование подешевело втрое: китайская модель GLM-5.2 составила конкуренцию ведущим ИИ-разработчикам
Исследование, проведенное компанией Snowflake, выявило, что новая большая языковая модель GLM-5.2 от китайской компании Zhipu AI (Z.ai) демонстрирует результаты, сопоставимые с флагманской моделью Claude Opus 4.7 от Anthropic в задачах программирования. При этом стоимость использования GLM-5.2 оказывается значительно ниже, что может оказать существенное влияние на западный рынок искусственного интеллекта.
Тестирование моделей: близость результатов и нюансы производительности
В ходе бенчмарка Snowflake оценила производительность GLM-5.2 и Claude Opus 4.7 на 103 задачах, связанных с написанием кода. Целью было создание программ, корректно работающих как в среде DuckDB, так и в Snowflake. Каждая задача была выполнена моделями по три раза.
Результаты показали, что при трех попытках на каждую задачу обе модели продемонстрировали схожую эффективность: GLM-5.2 успешно справилась с 66% заданий, а Claude Opus 4.7 – с 67%. Незначительная разница наблюдалась в точности с первой попытки: Opus решил 53,7% задач сразу, в то время как GLM – 47,6%.
Анализ показал, что GLM-5.2 потребовалось больше итераций для решения задач – в среднем 99 против 80 у Opus. Также китайская модель потребила почти вдвое больше токенов – 860 миллионов против 439 миллионов. CEO Snowflake Шридхар Рамасвами отметил, что особенностью GLM является её способность точно проверять код сразу на двух платформах, DuckDB и Snowflake, что позволило ей решить ряд задач, недоступных другим моделям.
Тем не менее, GLM-5.2 проявила и слабые стороны. Иногда модель преждевременно завершала работу или чрезмерно фокусировалась на проверке второстепенных деталей. Так, в одном из случаев GLM выполнила 411 вызовов инструментов за 24 минуты, анализируя количество строк, распределения данных, null-значения и типы колонок, но так и не справилась с задачей за три попытки. Claude Opus, напротив, решил аналогичную задачу за 49 вызовов и 9 минут. Рамасвами также опроверг предположение о том, что GLM генерирует более чистый код, подчеркнув, что большее количество проверок не всегда означает лучшее качество. Несмотря на эти замечания, в Snowflake выразили удовлетворение работой GLM-5.2 и планируют сделать модель доступной для клиентов.
Ценовая политика: китайское предложение на рынке ИИ
Ключевым фактором, делающим GLM-5.2 привлекательной, является её цена. Согласно официальному прайс-листу Zhipu, стоимость использования GLM-5.2 составляет $1,40 за миллион входных токенов и $4,40 за миллион выходных. Некоторые сторонние поставщики предлагают еще более выгодные условия.
Для сравнения, Claude Opus 4.7 оценивается в $5 за входные и $25 за выходные токены. Модель GPT-5.5 от OpenAI стоит $5 за входные и $30 за выходные токены.
| Модель | Вход | Кешированный вход | Выход |
|---|---|---|---|
| GLM-5.2 | $1,40 | $0,26 | $4,40 |
| Claude Opus 4.7 | $5,00 | $0,50 (Cache Hit) | $25,00 |
| GPT-5.5 | $5,00 | $0,50 | $30,00 |
| GPT-5.4 | $2,50 | $0,25 | $15,00 |
Несмотря на то, что более высокое потребление токенов GLM-5.2 несколько снижает её ценовое преимущество, общий эффект давления на Anthropic и OpenAI, особенно в области программирования, остается значительным. Программирование является одним из ключевых направлений монетизации для обеих западных компаний.
Если ценовое давление со стороны китайских разработчиков продолжит замедлять или сокращать рост доходов OpenAI и Anthropic, перегретый рынок ИИ может столкнуться с серьёзными испытаниями. Оценки этих компаний во многом базируются на прогнозах стремительного увеличения выручки, которые, в свою очередь, поддерживают масштабные инвестиции в инфраструктуру, включая дата-центры и закупку специализированных чипов.