Frontier LLM 升级 - Qt Creator 的 Qt AI Assistant 0.9.9 发布!

作者:Peter Schneider | Mar 24, 2026 6:43:36 AM

为了更便捷地获取最新的 AI 能力,我们已将预配置的 LLMs 更新至最新版本。

GPT 5.3-Codex

GPT 5.3-Codex 在无辅助 QML 编码方面实现了重大飞跃。这款最新的 OpenAI 软件工程 LLM 在 QML100 基准测试中取得了 75%的成功率,而 GPT 5.2-Codex 为 64%,GPT 5.1 为 58%。

OpenAI 在 QML 编码方面取得了重大进展。 最新的 LLM 版本使 GPT 重新成为 Qt 软件开发的优质选择,而 Gemini 3 模型仍保持领先地位。

GPT 5.3-Codex 及其前身在代码完成方面都很出色。这种功能充其量只能算是试验性的。

Claude Sonnet 4.6

Claude Sonnet 4.6 在 QML 性能表现上可谓喜忧参半。与 Sonnet 4.5 相比,它在 QML100 基准上的无辅助 QML 编码性能大幅下降至 64%。在没有额外技能或网络或线程访问的情况下,无论是自适应思考模式还是高专注度模式,都未能实质提升编码表现。

我们尚不清楚这一退步的原因,但我们确实注意到 Sonnet 4.6 经过训练后能提供更长、更全面的答案。在多轮测试中,它似乎也存在“过度思考”问题的情况。QML100 基准测试中,大多数失败都与 QML 对象由布局定位器管理时使用固定尺寸有关。这对 Sonnet(或 Opus)来说并不陌生,但现在发生的规模更大了。第二个最常见的故障与使用已为 QML 对象保留的自定义属性名称有关。这两个问题都很容易通过额外的技能或嵌入式线程来解决,但在没有辅助的情况下,该 LLM 的失败率高于其前代模型我们决定将 Claude Sonnet 4.6 作为预配置的 LLM 提供支持,以便为用户提供选择。

Gemini 3.1 Pro 预览版

最新的 Gemini 模型在 QML100 基准测试中取得了 88% 的高分,进一步巩固了 Google 在 QML 编程领域的领先地位。该模型以简洁高效的输出响应任务,为用户节省了时间和 token。与消耗更多输出 token 的 Anthropic 模型相比,最新的 Gemini 模型不仅是更好的 QML 专家,而且更具成本效益。

同时

  • 我们为 QML 和 Qt C++ 添加了第一版嵌入式编码技能。我们将逐步扩展这一功能。