2月23日,由中央广播电视总台综合频道牵头策划的中国首部文生视频AI系列动画片《千秋诗颂》启播;2月16日,OpenAI发布首个文生视频模型Sora,英伟达推出本地AI聊天机器人ChatwithRTX;2月15日,谷歌则发布了人工智能中型多模态模型Gemini1.5Pro……传媒业对这波以Sora为代表的技术变革纷纷热议,这将会给传媒行业带来哪些机遇与挑战呢?
催化变革 拓展AI视频应用场景
“ChatGPT是AIGC发展中出现的一个具有革命性、颠覆性的产品,而Sora则更像是一个迭代中的创新点和一种新能力。”中国传媒大学新闻学院教授、媒体融合与传播国家重点实验室大数据中心首席科学家沈浩在接受《中国新闻出版广电报》记者采访时认为,Gemini1.5Pro、Runway等产品是基于大模型的迭代而形成的,无论是在算力还是多模态上,对视频的理解都不像Sora那样具有经验性的颠覆。
以Sora为代表的这波技术变革将会给传媒行业的视听应用带来颠覆性的影响。中央民族大学新闻与传播学院教授、互联网平台企业发展与治理研究中心主任郭全中认为,AI文生视频的优势在于质量高、速度快、成本低、量大,能够更好地理解物理规则,生产的视频与现实世界更为贴近。
2月26日开播的《千秋诗颂》是中国首部文生视频AI系列动画片,运用AI技术将国家统编语文教材中的诗词转化制作成唯美的国风动画。“文生视频模型大大降低了视频生成的门槛,AI生成视频应用场景将会快速普及。”大众报业集团融媒体中心副主任、大众日报融媒技术工作室主任汤代禄表示,“AI生成视频所具备的全新创意,会吸引越来越多的专业制作团队的借鉴使用,如爱奇艺、腾讯视频、芒果超媒等视频平台,大力探索AIGC应用,以提效、降本、创新,有的已小有突破。”
目前,Sora还处于内测阶段,并未公开发布,文生视频的时长限定在60秒内。“文生视频的时长是否可以不断延长,这涉及算力。”沈浩说,对短视频而言,算力足够的话将会相对容易实现,但之于长视频,让文生视频一键实现其具有一致性、连贯性特点的内容还相对较难。文生视频一键生成短视频不需要太多的专业性支撑,不少专业自媒体,特别是影视自媒体已开始尝试使用AI生成短视频内容。将来,科幻、教育、娱乐、文化类的内容制作或将不断引入这类制作方式。但就目前的技术而言,虽然无法让AI 一键生成一部电影,但可以将其生成短视频内容作为长视频生成素材的来源。
“从内容生产方式上看,以Sora为代表的新技术应用使内容生产更加智能化、自动化,提升了生产时效以及内容的丰富程度。”四川日报报业集团编委、封面新闻总编辑周琪表示,就目前技术发展水平来看,文生视频模型在制作创意视频、动画等方面有一定优势,有利于节约制作成本,提升制作效率、创意水平及画面质量,但是在短时间内仍依赖人类的创意提示以及后期的内容安全、版权安全控制,而新闻报道则对内容的真实性要求高,文生视频模型的应用有待进一步观察。
汤代禄则认为,以Sora为代表的AI生成视频能力正是媒体所需,从远景来看,将可极大缓解媒体的视频剪辑制作压力、拓宽视频创意能力,但若考虑训练视频数据模型、AI计算资源消耗等因素,则尚需时日。而在新闻视频生成方面,因目前AI生成视频还有较大的不确定性,是否能达到新闻视频的准确真实要求有待商榷,因此其对于提升新闻视频制作效率短期内还较有限。
“文生视频将首先在娱乐类视频、游戏、电影等对真实性要求不高的领域产生颠覆性影响,而对新闻视频的影响相对小一点。”郭全中分析道,未来,在新闻视频生产方面其将会成为新闻视频生产降本增效的利器,在新闻生产的各个环节发挥重要作用。
多模态应用 提升传播效率和质量
目前,大模型领域的竞争进一步白热化,多模态大模型将成为生成式AI的重点发展方向,而文生视频则将成为多模态大模型的下一步发展重点,向人工通用智能(AGI)目标再迈进一步。
“现今,大家都在拥抱AIGC、AGI,利用人工智能和超级人工智能解决问题。”沈浩说,GPT4、Gemini1.5Pro、文心一言、讯飞星火等模型都属于大语言模型,其在不断进化的过程中到了多模态的形式,但大部分模型还没有进化到Sora这样的视频制作阶段。Sora的诞生解决了视频的问题,未来随着监管和价值对齐,在算力的加持下,将会打造出一个令人十分惊艳的多模态数字世界。就目前而言,“Sora们”新技术应用对整个传媒产业的影响还没有那么直观,还是着重于短视频和影视领域的应用。
此次文生视频模型Sora的发布带来的新一轮技术变革,将给长短视频、游戏和广告等行业带来颠覆性创新。“Sora建立在ChatGPT的坚实基础上,可实现多模态生产。”郭全中认为,作为视频模拟器,Sora可以看成通往AGI时代的重要里程碑。未来,Sora类新技术应用,将会对各行各业带来革命性影响,尤其在6G时代下,将会衍生出各种各样的应用,在现有探索的基础上更为深化和丰富。
以Sora为代表的新技术应用目前是基于学习后的模仿,没有达到完全的逻辑理解、因果推理等很好层次的智能能力。周琪认为,在具体的应用层面,则需要考虑安全、可控、可解释、稳定等一系列因素,传媒行业是一个对内容的真实性、导向性、安全性等都要求较高的行业,目前的文生视频能力尚未达到要求,在某些创意内容产品上则可以进行探索尝试,但还无法进行大规模应用。
“以Sora为代表的文生视频技术是AI视频细分领域的里程碑式突破,但距离AGI还有不少距离。”汤代禄认为,AI视频生成技术,与现有的AI生成文本、图像、音乐、语音等组合后,会形成新质生产力。对媒体而言,或许会催生“传播+文化”“传播+教育”等新业态,通过生成式AI的创意优势推进传播与文化“两创”融合,促进文化传承,赋能文旅高质量发展;通过生成式AI推进传播与教育产业融合,生成教育资源,自动进行基础教育、科普教育等。
有序引导 推动行业高质量发展
AI大模型应用蕴含着无限潜能,未来Sora类应用将会颠覆各行各业。郭全中认为,之于传媒行业,其替代的将是技术含量低、高度重复性的日常工作,对创新性高的工作而言则会成为高效助手。
周琪也认为,Sora类产品不会取代专业人员,AI大模型仍然依赖人类的创意输入和输出结果的安全把控。未来一段时间也仍是人机协同方式,从业人员应该更多专注在创意等深度思考能力的锻炼和最新工具的高效应用。但这些技术的普及也会加速传媒行业的整合和洗牌,一些掌握先进技术的传媒企业将持续崛起,成为行业的探索者和领导者,而一些传统传媒企业则可能会面临被边缘化的风险。
郭全中建议,对传媒机构而言,一是在观念上积极拥抱,尽快探索相关应用;二是按照新技术的规律重构采编流程、运营模式和组织架构;三是对全员进行培训,快速提升应用新技术的能力,与Sora等新技术应用共生共成长。
“随着科技不断赋能传媒行业融合发展,新闻的传播形式、主体、内容和手段等都发生了巨大的变化。”沈浩介绍说,目前,各高校的新闻传播教育也在向着交叉学科文理融合方向发展,为各类媒体及社交平台输送具有优秀创意能力与技术的复合型人才,增强其AIGC应用场景能力或技能,提升其生产能力。
现阶段媒体应用生成式AI进行内容生产,暂无行业性规章,也无行业性标准。在汤代禄看来,Sora的出现是在视频生成领域又打开了一扇窗,在带来更多想象空间的同时,也带来了更多不确定性,推行科技向善、加强AI监管势在必行。生成式AI的监管,国家已同步展开,但主要是对国内AI技术平台供给方进行监管。他建议,对于媒体应用AI技术生成的内容,也应纳入媒体内容审核范畴,并按国家相关规定进行AI生成标注。还应由媒体行业主管部门牵头制定媒体应用生成式AI技术的制度,界定使用边界,明确版权关系;行业技术组织牵头制定相关标准,便于各媒体参照执行。
郭全中呼吁,应采取“协同共生式”治理思路跟踪、研判Sora类产品可能带来的风险,及时采取相应的措施进行治理;要采取“先发展,共生治理”的方式,处理好“发展与安全之间的平衡”;鼓励Sora类技术的发展和应用,处理好价值观对齐难题以解决价值观引导和伦理等问题。同时,要立足发展,对Sora等新技术应用对版权带来的影响进行理论上的研究,构建起有效的治理规则和实操案例。