美图吴欣鸿：AI视觉大模型本质是无穷的视觉创意库

admin 科技动态 2023-10-12

　　光明网讯 10月9日，美图公司在厦门举办15周年生日会并发布自研AI视觉大模型MiracleVision（奇想智能）3.0版本（以下简称“MiracleVision3.0”）。

　　活动现场，美图公司创始人、董事长兼首席执行官吴欣鸿宣布MiracleVision3.0将全面应用于美图旗下影像与设计产品，助力电商、广告、游戏、动漫、影视五大行业。

美图吴欣鸿：AI视觉大模型本质是无穷的视觉创意库

美图公司创始人、董事长兼首席执行官吴欣鸿

　　MiracleVision的“百日进化史”：奇思妙想与智能创作

　　据吴欣鸿介绍，三个月前MiracleVision1.0绘画水平还停留在初级阶段，如今3.0版本已经能描绘出真实细腻的画面细节。

　　在活动现场，吴欣鸿将自己15岁的绘画作品与面世100天的MiracleVision3.0生成作品进行对比。他认为，训练AI与人类学画有很多共通之处，通过充分学习不同的绘画风格和技巧，AI能创作出具有独特性的原创作品。

　　吴欣鸿介绍，MiracleVision3.0主打“奇思妙想”和“智能创作”，通过“提示词智能联想”“提示词精准控制”等功能，可以让用户的各种奇思妙想实现所想即所得。“这些功能使得AI更可控。”吴欣鸿说。

　　同时，吴欣鸿强调，短期内AI并不会替代人类的创造性工作，而是为创作者赋能，实现降本增效。

美图吴欣鸿：AI视觉大模型本质是无穷的视觉创意库

　　MiracleVision助力五大行业：电商、广告、游戏、动漫、影视

　　在吴欣鸿看来，AI视觉大模型带来的不仅仅是更好的视觉呈现，还有对工作流的效率提升。但目前，大模型与工作流的结合仍在探索阶段，抓住应用场景的核心需求更为重要。

　　吴欣鸿介绍，MiracleVision3.0将落地电商、广告、游戏、动漫、影视五大行业，希望能助力这五大行业工作流提效。

　　以电商行业为例，商家通过MiracleVision3.0，可以实现从涂鸦生成线稿、线稿上色、商品图、模特试穿图，再到电商物料输出的全过程，极大提高生产效率、降低成本。

　　吴欣鸿表示，MiracleVision3.0将充分发挥“奇思妙想、智能创作”的能力，持续助力更多的设计场景。

美图吴欣鸿：AI视觉大模型本质是无穷的视觉创意库

　　AI视觉大模型本质：无穷无尽的视觉创意库

　　活动现场，吴欣鸿还分享了对于AI视觉大模型的思考：“AI视觉大模型的本质，是无穷无尽的视觉创意库。应用层相当于内容提取器，根据用户的需求，从这个巨大的创意库中提取所需要的内容，让用户在特定场景中使用。”

　　目前，国内有很多团队在研发视觉大模型，但能将视觉大模型与生产环节结合的企业数量相对较少。吴欣鸿认为，大模型真正在生产端普及使用，亟待解决的三大问题分别是：垂直领域极致效果、工作流整合、变现能力。

　　吴欣鸿介绍，美图公司将视觉的大模型应用普及将分为三个阶段：探索期、高速发展期、成熟期。

美图吴欣鸿：AI视觉大模型本质是无穷的视觉创意库