12月31日,智谱发布本年度最后一个模型 GLM-Zero 的初代版本 GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强模型推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面表现大幅提升。其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI-o1-Preview 相当。(全天候科技)
12月31日,智谱发布本年度最后一个模型 GLM-Zero 的初代版本 GLM-Zero-Preview,这是智谱首个基于扩展强化学习技术训练的推理模型,专注于增强模型推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。
同基座模型相比,GLM-Zero-Preview 在不显著降低通用任务能力的情况下,在专家任务能力方面表现大幅提升。其在 AIME 2024、MATH500 和 LiveCodeBench 评测中,效果与 OpenAI-o1-Preview 相当。(全天候科技)