WebDev Arena:
Gemini 2.5 Pro 0506 极有可能就是大家先前在WebDev Arena中猜测的Gemini 2.5 Coder
这才是最恐怖的,因为这么强的Web开发模型竟然不是一个专用模型而是一个通用模型,目前看来0506是所有任务的最佳模型
附一个藏师傅的测试:
https://x.com/op7418/status/1919786886253707402
这下Claude真的要急了,优势可以说是全无了,要知道Claude 3.7 Sonnet说的难听一点基本是专为编码设计的,现在被0506大幅超越了,已经濒临掉队了,而且更绝望的事情上面已经说过了,超越C3.7S的可不是一个专用编码模型,而是一个全方位提升过的顶级通用模型,这就意味着Anthropic不但在编码基本盘失去了优势,在其他方面更是差距进一步拉大了