视频版GPT 如何影响千行百业?

Sora将猛犸象迁徙视频改为硬纸板风格。

近期,全球科技圈迎来一项重磅事件。

当地时间12月9日,OpenAI旗下的视频生成模型Sora正式面向大众推出,距离Sora首次发布已过去约10个月。此次开放的版本Sora Turbo,较2月的“首发版”在生成速度上“升级”,它不仅能根据文本生成视频,还自带素材扩展、重新混合编辑等实用功能。

在OpenAI CEO奥特曼(Sam Altman)看来,Sora不仅是一项技术,更是赋能创意人士的工具、AI与人类共同创作的新模式,“大家可以将Sora看作视频版的GPT-1”。

那么,这款视频版GPT究竟有何过人之处?当下如雨后春笋般兴起的AI视频生成工具,又将给千行百业带来什么?

1

“升级版”Sora有何亮点?

此番亮相的Sora,可以生成最高1080p、最长20秒的视频,支持横屏(16:9)、竖屏(9:16)、方屏(1:1)等多种常见尺寸。它具备一系列编辑工具,提升AI生成内容的可控性。

比如重新编辑(Remix),能将“推开一扇门进入图书馆”的视频,替换为“进入宇宙飞船”,再将“宇宙飞船”爆改成“原始森林”。你甚至还能找到一帧最佳画面,将其扩展(Re-cut)成完整的视频,再创建独特风格(Style Presets),将“复古文艺范”变成“黑白画风”。

再如,融合功能(Blend),能将两个视频无缝衔接。你可以让飘雪视频和花瓣视频合二为一,营造“冬天来了,春天还会远吗”的艺术感,再通过循环(Loop)让它首尾衔接。如果你想让一段视频切换多个镜头,可以在时间轴上编辑故事板(Storyboard),为每个分镜头写“脚本”。

“相比第一个版本,Sora新版本显著提升了实用性与技术成熟度,具备更高的生成质量、多模态输入支持、模型架构优化等特点。与早期的学术雏形相比,已发展为一款高完成度的AI产品。”上海交通大学长聘教轨副教授谢伟迪在接受上观新闻采访时表示。

目前,Sora面向ChatGPT的付费用户开放。其中,价格为20美元/月的ChatGPT Plus会员,能生成最多50个视频(1000个积分),分辨率最高达720p,时长为5秒。

2

记者亲测:

人物逼真,创意“上分”

新版Sora的开放,并未像它“横空出世”时一样轰动。毕竟,在这10个月间,AI视频生成大模型层出不穷,如国内的可灵AI、即梦AI、智谱清影……人们对此类应用司空见惯,甚至已将其视为工作生活的“标配”。

作为文生视频“赛道”的开创者,Sora的实际表现,相较于国内同类产品有何特点?

在宁波晚报IT技术总监姜立波的帮助和支持下,记者感受了一把Sora创作——

首先,Sora呈现的人物更逼真、清晰度更高,且更符合生活常识。

记者将一段大意为“记者编辑在办公室讨论选题”的同款提示词,分别“投喂”给Sora和一款国内AI视频大模型,发现前者生成的人物面部栩栩如生,操作相机、提笔写字都非常“丝滑”;而后者尽管在构图和光影效果上表现不错,但人物面部细节有限,还出现相机“怼脸”等奇怪的操作。

另一大优点是,Sora能和用户一起完善提示词,甚至补全分镜,为创意工作“上大分”。

记者想生成一段城市夜晚的庆典画面,Sora就主动帮忙“思考”,将灯光扫射的“脚本”写在第二个镜头。如果对成品不满意,用户还能直接在旧版提示词基础上修改。

同时,Sora通过图像检测增加安全性。记者本想上传一张《宁波晚报》头版图让Sora“学习”,却因画面有真实人物而上传失败。这或许表明,Sora正有意避免侵犯肖像权等“技术滥用”,以确保合法合规。

不过,Sora也有一定的局限,比如对中文语义的理解。它无法生成“天空中飘来‘宁波晚报’这4个字”的视频。另有网友指出,Sora生成的视频同样存在“车辆穿模”“人物手部不自然”“士兵倒着骑马”等错误,对物理世界规律的掌握有待提升。

“当前,AIGC(人工智能生成内容)模型面临的主要挑战,是确保生成内容的一致性和可控性。例如,人物在转换场景时不会扭曲变形;物体运动符合‘水往低处流’等物理规律……得益于领先的算法和强大的算力,Sora的表现已取得良好成果,未来尚有进步空间。”宁波本土AIGC创业者、宁波钧奕智能科技有限公司创始人吴大钧分析道。

3

宁波企业如何拥抱AIGC?

OpenAI认为,Sora是一款“作为世界模拟器的视频生成模型”,将成为通往AGI(通用人工智能)路上的重要里程碑。在Sora开启的文生视频新纪元,宁波相关从业者已做好“上车”准备。

“AI来得好猛,学习它,应用它。”Sora面向大众推出的次日,宁波西舟数字科技有限公司创始人吴向进就在微信群里“广而告之”。他为广大外贸企业提供电商产品摄影、短视频制作、3D建模等视觉服务,深感“用好AIGC工具,时不我待”。

所谓AIGC(人工智能生成内容),是指利用人工智能技术自动生成各种内容,包括文本、图像、音频、视频等。

“Sora等AI生成视频大模型,能让我们快速制作视频片头,还会倒逼我们调整人员结构,任用熟练掌握AI创作技能的设计师。”吴向进告诉记者,他还在尝试一些“AI+外贸”应用,将中国模特“换脸”成“洋面孔”,再将中文字幕替换为小语种,帮助客户做本地化视频营销。

记者了解到,在新版Sora问世前,宁波已有多家企业拥抱AIGC的力量,辅助创意内容制作。在AI创业领域,宁波钧奕智能科技有限公司研发的AIGC创意云平台,能让外贸企业一键设计出“美国队长风格的电动工具”,还计划在医美等更多行业推出AI垂直大模型;在AI应用领域,宁波侵尘文化传媒有限公司为一家户外露营品牌制作短视频,结合AI技术营造雪夜星空的浪漫氛围,破解实景拍摄困难的痛点……而Sora的正式推出,有望加速AIGC在宁波更多场景的落地。

作为一名IT从业者,浙江智加信息科技有限公司总经理施寅杰注意到,Sora宛如一个“创意团队”,能降低视频内容创作者的入行门槛,吸引更多人跨界参与。它不仅能为影视制作、游戏制作等行业降本增效,还将赋能教育、医疗、机器人等千行百业。

“比如在智慧办公领域,白领们只需向Sora输入文字或图片,就能获得产品介绍视频和会议视频,进而解放生产力。”施寅杰表示,“不过,Sora的普及也会带来挑战,比如AI生成的同质化内容泛滥,造成‘信息污染’,甚至引发伦理问题和法律风险,需要平台和相关部门加强监管,方能营造以人为本、智能向善的未来。”

记者 严瑾

2024-12-12 2 2 宁波晚报 content_189274.html 1 3 视频版GPT 如何影响千行百业? /enpproperty-->