苹果Apple推出MGIE:用语言描述即可编辑图像的人工智能AI工具

苹果Apple推出MGIE:用语言描述即可编辑图像的人工智能AI工具

人工智能AI的浪潮中,图像编辑技术正迎来一场革命。苹果Apple公司与加州大学圣巴巴拉分校合作开发的MGIE(MLLM引导图像编辑)模型,便是这场革命的最新成果。这款工具允许用户通过简单的语言描述来编辑照片,无需接触复杂的图像编辑软件。

MGIE模型的强大之处在于其多模态语言模型的应用。首先,它能够学习并理解用户的语言提示,然后“想象”出编辑后的效果。这意味着,用户只需告诉MGIE他们想要更改的内容,比如“让天空更蓝”或“添加更多对比度以模拟更多光线”,MGIE便能自动对照片进行相应的编辑。

这一过程的实现离不开苹果在机器学习领域的深厚积累。通过训练,MGIE模型已经能够准确地解释并执行各种编辑指令,无论是简单的裁剪、调整大小,还是更复杂的对象修改和滤镜添加。

为了展示MGIE的能力,研究人员在论文中使用了一些生动的示例。比如,当用户对一张意大利辣香肠披萨的照片输入提示“使其更健康”时,MGIE会自动在披萨上添加蔬菜配料。又如,一张原本昏暗的撒哈拉老虎照片,在输入“添加更多对比度以模拟更多光线”后,变得明亮而生动。

这些示例不仅展示了MGIE的实用性,也证明了其在保持高效的同时,能够显著提高图像编辑的性能。研究人员表示,MGIE不是简单地执行模糊的指导,而是能够准确理解用户的视觉感知意图,并产生合理的编辑效果。

值得一提的是,苹果并不是生成人工智能领域的传统强手。与微软、Meta或谷歌等巨头相比,苹果在AI领域的布局相对保守。然而,随着MGIE等创新工具的推出,以及苹果首席执行官蒂姆·库克对增加更多AI功能的承诺,我们可以看到苹果在人工智能领域的野心正在逐步显现。

去年12月,苹果发布了名为MLX的开源机器学习框架,旨在简化在Apple Silicon芯片上训练AI模型的过程。这一举措不仅降低了AI技术的门槛,也为开发者提供了更多创新的可能性。

当然,MGIE模型的推出并不意味着其他图像编辑工具将黯然失色。事实上,像Adobe这样的行业巨头也在积极探索AI技术在图像编辑领域的应用。其Firefly AI模型便是一个很好的例子,它支持生成填充功能,可以将生成的背景自然地添加到照片中。

总的来说,MGIE是苹果在人工智能领域的一次重要尝试,它不仅提升了图像编辑的便捷性和效率,也为我们展示了AI技术在创意表达方面的无限潜力。随着技术的不断进步和应用场景的不断拓展,我们有理由相信,未来的图像编辑将更加智能、直观和富有创意。

原创文章,作者:柠萌,如若转载,请注明出处:https://www.kejixun.com/article/629258.html

(0)
柠萌的头像柠萌管理团队

相关推荐

发表回复

登录后才能评论