今年二月,OpenAI推出了首个文本到视频的生成模型Sora,其创新的一镜到底技术和高度统一的人物场景处理震撼了业界,将视频生成推向了年度技术热点之一。紧随其后,国内AI视频领域也迎来了前所未有的发展浪潮。
在最近的世界人工智能大会上,AI视频生成成为了焦点议题。众多创作者纷纷利用这一技术进行创意实验,如让甄嬛在视频中做出荒诞不经的行为,或让刘华强与瓜贩戏剧性地和解,甚至重现网络梗图中的夸张情景,这一切都得益于各种AI视频生成模型。
六月份见证了快手的可灵、Luma AI及Runway的Gen-3 Alpha等多个AI视频生成模型的集中发布,尤其是快手的可灵,被誉为中国的Sora,其生成视频的时长达到了120秒,并开放了多项功能,如图生视频、视频续写等。该模型在内测中展现出了惊人的能力,如模拟物理动态,赢得了极高评价,被认为是人工智能领域的又一重要进展。
尽管如此,当前的视频生成技术仍面临挑战,如可控性不足,难以保证人物形象、场景风格的连贯一致,以及运动流畅性、光影、语音自然度等方面的待优化。上海交大教授倪冰冰指出,生成算法常遇到结构和细节问题,比如物体的不正常增减、视觉错误等。她认为,尽管AI视频技术提升了生产效率,但在成熟的影视制作面前仍有差距。
对于AI视频的未来,美图公司陈剑毅预测,该技术正处于初级阶段,类似于电影行业的起步期,但可能在未来三到五年内经历快速发展,尤其是在网络文学和教育内容领域。不过,井英科技CEO朱江提到,AI生成内容的新鲜感可能很快消退,内容创新才是持续吸引用户的王道。
各大互联网企业,包括字节跳动、快手、阿里、百度、腾讯等,纷纷加码视频生成领域,竞争日益激烈。然而,如何实现商业化仍是一大难题,除了技术瓶颈,高昂的成本也是必须跨越的障碍。倪冰冰教授强调,未来需要新的架构和技术来支持高效且可持续的媒体生成能力。
对于这一新生的AI生成时代,朱江比喻为寒武纪的生命大爆发,充满了未知与机遇。他坚信,保持技术领先和深入理解市场需求,是在这场变革中立足并抓住机会的关键。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rllx.cn/PENv/68963.gov.cn
如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈邮箱:809451989@qq.com,一经查实,立即删除!