即使是 Opus 4.6 或者 GPT 5.4 也依然会写出那种能用,但是带有低级错误的代码。但如果测试的人足够敏感,迭代的速度足够快……