终端操作能力

GLM-5.1 – 智谱AI推出的Agent智能体与自动编程大语言模型

Agent强化学习:训练流程包括SFT、Reasoning RL与Agent RL阶段,使模型具备行动决策能力,例如通过多轮试错优化任务结果