魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话
此次上线的LivePortait工具由运动模块和生成模块组成,其采用阿里云自
(资料图片仅供参考)
魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话
阿里云在生成式AI领域又有新进展。8月16日消息,阿里云推出数字人视频生成工具Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。
自对话大模型和AI绘画模型相继火热后,业界对生成式AI的研究逐步朝更多模态的方向演进,AI视频生成便是热门技术之一。该技术可将文本或音频等信息转换为面部运动信息,进而驱动生成照片人物形象的动画,能有效降低视频拍摄和制作门槛。
此次上线的Live Portait工具由运动模块和生成模块组成,其采用阿里云自研的口型预测算法,生成的口型准确度相比传统方法大幅提高;在训练阶段,增加了姿态的显式控制,无需底板视频也可以生成任意动作的视频,大幅提升数字人说话的真实感;此外,通过眼神主动控制技术,Live Portait可以为眼球增加一些自然运动,使得生成结果在观感上更接近真人效果。据介绍,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录。
根据魔搭社区上的信息显示,在Live Portait上传照片后,用户可选择文本驱动和音频驱动两种方式,文本驱动模式下,该工具提供了普通话、英语、粤语、童声等28种声音。此外,Live Portait还提供了轻量模型选择,帮助用户更快速生成视频。
该工具算法负责人张邦表示:“ Live Portait集成了团队多项自研创新技术,例如仅需单张图片就能生成逼真的面部动画,突破了传统对抗生成网络的局限。随着技术的进一步迭代,图生视频有巨大的应用空间,有望成为企业降本增效的生产工具。”
据悉,该团队研究方向涵盖数字人、3D模型AI生成、高真实感渲染、自然人机交互等领域,目前已发表50多篇国际顶会论文。
关键词:
此次上线的LivePortait工具由运动模块和生成模块组成,其采用阿里云自
人物归作者,ooc归我时间线:闻时第三次过无相门老福特@时制(我本人头
云南网讯(记者赵岗通讯员杨智锋)为了解中国航天文化,激发青少年对航
美国斯坦福大学的科学家们近期取得了一项新的科研成果,他们研发出一种
“谁能告诉大家,黑色的防护服是什么时候穿的?橙色的救援服又是什么时
1、中国历史朝代顺序表顺口溜为:三皇五帝始,尧舜禹相传;夏商与西周
编者按:湘商,全国商界的一支劲旅,在全球经济版图中也占据一定位置。
原标题:缅甸北部玉石矿区坍塌事故已造成33人死亡内比都消息:当地时间
华西证券08月17日发布研报称,给予稳健医疗(,最新价:元)买入评级。
当了10年正厅的他,被判10年10个月!落马前3个月调职3次,落马,调职,办
开盘时间太忙,没时间多说。$北方长龙(sz301357)$又吃了大肉!打板$久
8月17日傍晚至18日,河南将有一次阵雨、雷阵雨天气过程,需防范可能引
今天国际(300532)08月15日在投资者关系平台上答复了投资者关心的问题。
中国日报网8月17日电据阿拉伯半岛电视台报道,7月21日,在美国犹他州举
一直以来,车辆如果既想拥有轿车的舒适性,又要兼顾越野车的通过性能,
8月13日晚,随着城南最后一个村召开村民代表大会,通过了土地征收等相
智通财经APP讯,新鸿基公司(00086)发布截至2023年6月30日止6个月中期业
中国经济网北京8月14日讯A股三大指数早间低开低走,跌幅均超1%。午后,
近日,龙湾区知识产权运用培训暨质押融资对接会在龙湾区空港新区微企红
据央视,最高检副检察长张雪樵在新闻发布会上介绍,检察机关加大对销售