分词器-星驰编程网

IT之家 9 月 27 日消息，苹果正在研发一款名为 Manzano 的新图像模型，旨在同时具备图像理解与图像生成两大能力。

不过目前 Manzano 尚未正式发布，也没有演示 Demo，只有一篇作者绝大多数都是华人的预印本论文（包括已经跳槽到 Meta 的庞若鸣），还展示了部分低分辨率图像样例，涵盖较复杂的提示场景。

苹果表示，这一双重功能长期以来是技术难点，使得大多数开源模型在综合表现上落后于 OpenAI 和 Google 等商业系统。

苹果将其与 DeepSeek Janus Pro 等 AI 模型进行了对比，结果显示 Manzano 不弱于 OpenAI GPT-4o 和谷歌的 Gemini 2.5 Flash Image Generation（IT之家注：原代号 Nano Banana）。

星驰编程网