美图吴欣鸿:AI视觉大模型本质是无穷的视觉创意库
光明网讯 10月9日,美图公司在厦门举办15周年生日会并发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本(以下简称“MiracleVision3.0”)。
活动现场,美图公司创始人、董事长兼首席执行官吴欣鸿宣布MiracleVision3.0将全面应用于美图旗下影像与设计产品,助力电商、广告、游戏、动漫、影视五大行业。
美图公司创始人、董事长兼首席执行官吴欣鸿
MiracleVision的“百日进化史”:奇思妙想与智能创作
据吴欣鸿介绍,三个月前MiracleVision1.0绘画水平还停留在初级阶段,如今3.0版本已经能描绘出真实细腻的画面细节。
在活动现场,吴欣鸿将自己15岁的绘画作品与面世100天的MiracleVision3.0生成作品进行对比。他认为,训练AI与人类学画有很多共通之处,通过充分学习不同的绘画风格和技巧,AI能创作出具有独特性的原创作品。
吴欣鸿介绍,MiracleVision3.0主打“奇思妙想”和“智能创作”,通过“提示词智能联想”“提示词精准控制”等功能,可以让用户的各种奇思妙想实现所想即所得。“这些功能使得AI更可控。”吴欣鸿说。
同时,吴欣鸿强调,短期内AI并不会替代人类的创造性工作,而是为创作者赋能,实现降本增效。
MiracleVision助力五大行业:电商、广告、游戏、动漫、影视
在吴欣鸿看来,AI视觉大模型带来的不仅仅是更好的视觉呈现,还有对工作流的效率提升。但目前,大模型与工作流的结合仍在探索阶段,抓住应用场景的核心需求更为重要。
吴欣鸿介绍,MiracleVision3.0将落地电商、广告、游戏、动漫、影视五大行业,希望能助力这五大行业工作流提效。
以电商行业为例,商家通过MiracleVision3.0,可以实现从涂鸦生成线稿、线稿上色、商品图、模特试穿图,再到电商物料输出的全过程,极大提高生产效率、降低成本。
吴欣鸿表示,MiracleVision3.0将充分发挥“奇思妙想、智能创作”的能力,持续助力更多的设计场景。
AI视觉大模型本质:无穷无尽的视觉创意库
活动现场,吴欣鸿还分享了对于AI视觉大模型的思考:“AI视觉大模型的本质,是无穷无尽的视觉创意库。应用层相当于内容提取器,根据用户的需求,从这个巨大的创意库中提取所需要的内容,让用户在特定场景中使用。”
目前,国内有很多团队在研发视觉大模型,但能将视觉大模型与生产环节结合的企业数量相对较少。吴欣鸿认为,大模型真正在生产端普及使用,亟待解决的三大问题分别是:垂直领域极致效果、工作流整合、变现能力。
吴欣鸿介绍,美图公司将视觉的大模型应用普及将分为三个阶段:探索期、高速发展期、成熟期。