Sora催化多股涨停
2月19日,春节假期结束,A股迎来龙年首个交易日,开盘Sora概念(文生视频)股走强,截至发稿涨9.59%,其他相关概念股如多模态模型概念、WEB3.0、CHATGPT、虚拟人、AIGC均有所上涨。
截至当天收盘,当虹科技、因赛集团、万兴科技、中文在线、易点天下涨停,丝路视觉涨19.99%。
Sora是Openai发布的一个视频生成模型,可基于文本输入生成视频。该概念主要包含AI大模型与文生视频应用领域的相关公司。
视频受认可
Sora 引发行业热议,部分归因于亮眼的视频效果。Mystery Novel视觉预演工作室创始人、导演牛萌琛对第一财经记者表示, Sora 视频中的画质,画面内容中的细节、光影、色彩都较精细,对导演来说,为其在拍摄前期做一个简单的镜头样板是够用的。
牛萌琛表示,对广告片拍摄来说,也可以用这种样板来与客户更好地进行概念上的沟通和确认。但如果涉及镜头运动角度,与更精细内容调控——如色彩、光影、道具、人物动作等,目前AI还不能达到令客户满意的程度。
一位纪录片从业者对记者表示,目前Sora还不能直接用于影视作品,因为精细度还不够。但已经足够震撼,完全可以用于前期开发,尤其是概念设计。一位宣传片从业者表示,工作室目前还没试过用AI生成来做素材, Sora只发布了部分作品,且未开放公测,能不能用来代替剪辑不确定。无论如何,这些工具最后都是为人服务的,人的个人感情复杂性的表达不可替代。
摄影专业人士孟凡对记者表示,Sora 视频帧率较高,说明计算能力比较强,且影片的宽容度更高,如调色、细节表现、高速镜头展现等。在直观感受上,Sora模型产出的视频运镜自然,物体运动符合规律,镜头间逻辑一致性好,但是Sora视频的逻辑性会差一点。
具体表现在Sora视频内容中,如一分钟的东京街头女郎漫步,女郎走路过程中存在腿部变形、腿部交叉换位时错乱、右腿连续两次在前方迈步等错误;一段提示词为“一个人跑步的场景”中,主角在跑步机上反向奔跑;提示词为“考古学家在沙漠发现塑料椅子”的视频中,椅子呈现悬浮状态。
针对目前Sora存在的不成熟之处,OpeNAI表示,Sora 可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系,可能混淆提示的空间细节,可能难以精确描述随着时间推移发生的事件,如遵循特定的相机轨迹等。
Pytorch 创始人 Soumith Chintala 从视频推测Sora是由游戏引擎驱动,并为游戏引擎生成组件和参数。与游戏引擎生成画面相似也意味着,Sora这类文生视频大模型很可能改变游戏制作过程。“至少在预生产阶段文生视频大模型能帮助快速生成游戏效果预览。”一名游戏制作人员告诉记者。2月19日早盘游戏板块多只个股飘红,其中,昆仑万维盘中上涨12.01%,电魂网络上涨10.03%,奥飞娱乐上涨6.7%,顺网科技上涨6.13%。
底层技术未见实质性突破
但在技术层面,Sora 模型采用了扩散模型+Transformer的架构,基础技术原理上较之前并未有实质性的突破。Stable Diffusion 与 Midjourney 等部分领先图像生成应用的底层模型均是基于扩散模型所构建。从2023年起,学术界已陆续有基于Transformer架构的扩散模型用于图像和视频生成的探索。
广发证券认为,在底层基础技术原理上, Sora并未有实质性的突破,或应更多理解为类似于CHATGPT,基于同样的技术原理,在暴力美学下的又一次重要“量变”。
中科深智创始人兼CEO成维忠对记者表示,Sora算法意义上突破不大。Sora一方面通过极致的暴力美学,用巨量算力解决帧与帧之间的时序一致性问题,即在Sora中,不但用扩散模型解决同一帧的生成,也用扩散模型解决帧之间的时序生成,这也决定了Sora的视频生成成本短时间内无法降低。在无法解决“幻觉”的情况下,要想生成真正可控可用的视频,短期内将成本高昂。
另一方面,成维忠表示,Sora 根植于Openai的科技树,在提示词方面用了其超强的文生文技术。这给企图通过单点突破取得生成技术整体成功的企业敲响了警钟。
在算法意义突破不大、底层架构并无根本性创新的情况下,算力在其中扮演了重要角色。尤其是相较于语言类大模型,视频类大模型的推理需要更大的算力支持。视频的组织方式是由一系列的数据帧组成,每一帧数据又是由成千上万的像素点组成。因此,生成包含
同样信息量的数据时,视频往往比文字的数据量更大。
在视频类大模型所需处理的数据量更大、算法更复杂的情况下,其应用和推理阶段对算力的消耗也更大。广发证券分析认为,随着视觉类大模型开发量和应用量的增加,AI芯片、加速卡和网络设备的需求有望快速增长。
Sora催化下A股谁在“狂飙”
在Sora的带动下,2月19日,AI芯片、文生视频、AI算力等AI相关概念股开盘飘红,主要包括AI芯片厂商、AI服务器厂商等算力提供商和AI大模型研发商,AI芯片厂商寒武纪盘中涨9.02%,澜起科技上涨4.01%,景嘉微上涨5.12%,海光信息上涨6.19%。
Openai首席执行官萨姆·奥尔特曼此前便表达了对AI芯片供需问题的关心,近日有消息称,奥尔特曼还在争取一项大规模投资计划,建立AI芯片企业。此外,Meta今年还有意投产AI推理芯片Artemis,微软也在发力定制芯片。国内AI芯片领域,布局AI芯片的GPGPU厂商还包括壁仞科技、沐曦科技等。
AI服务器厂商中,中科曙光上涨5.53%,
紫光股份上涨3.77%,浪潮信息上涨5.2%,神州数码上涨5.56%。算力租赁板块多只个股上涨超10%,东方国信盘中上涨11.85%,并行科技盘中上涨 22.99%,新元科技盘中上涨11.7%。大模型研发商科大讯飞则盘中上涨7.72%。
此外,AI大模型训练网络使用到光模块,光通信行业市场机构Lightcounting近日报告指出,人工智能竞赛对光器件需求产生影响。以英伟达为例,在部署的第一年,英伟达在内部制造大部分光器件,但之后将大部分需求分配给Coherent和旭创科技。A股通信板块也受到多模态大模型迭代的催化。光通信精密元器件解决方案提供商天孚通信盘中上涨14.88%,数据中心光模块供应商中际旭创、光收发器解决方案和服务提供商新易盛盘中上涨超10%。
山西证券近日研报认为,光模块处于高端算力供不应求状态,亚马逊、谷歌等自研AI芯片逐渐投入部署,拉动其他型号400G、800G光模块上量,2024年全球AI投资将从北美几个云巨头扩散到Tier2云以及大型企业、智算中心,有望拉动光模块供应商复苏。
除Sora和谷歌Gemini,国内多模态大模型商用近日也迎来新进展,虹软科技19日宣布旗下虹软Arcmuse升级,支持商拍的商业视频自动生成,形式为输入图像生成视频,面向电商内容展示和推广等。市场分析认为, Sora显现出的多模态大模型迭代能力,还将持续改变视频创意等行业。中信证券研报表示,从投资角度来看,Sora背后的涌现能力为自动驾驶、设计等需要现实世界建模的行业提供了明确方向,谷歌Gemini在短期内的部分商业场景表现则可能会更为出色,看好后续商业端成熟带来的AI推理侧算力机会。
至于此次Sora给行业带来的启示,广发证券表示,一方面,数据处理与存储方式是重要创新,不同处理方式可能带来AIGC效果的跃升,Sora创新性地采用了“视频压缩网络” “时空补丁”的方法,将不同分辨率、不同宽高比等所有类型的视频数据“标准化”处理,并且保留了原始数据的细节,这是Sora能支持多样化的视频格式,且实现视频效果明显跃升的基础。启示主要有二:一是高质量的训练数据仍是AIGC类大模型成功的关键;二是核心人才是AIGC推动的另一大关键,这两点最终或将使得头部厂商强者愈强。
另外,需注意的是,广发证券分析,对A股相关AIGC应用公司而言,短期内从投资维度看,Sora的主题意义更为显著。需要看到的是,Sora的商业化进程仍需观察。一方面,技术文档提到的当前局限性需逐步解决;另一方面,版权合规、内容伦理等课题仍是AIGC类应用需要克服的挑战,文生视频也不例外。
摄影专业人士孟凡对记者表示,Sora视频帧率较高,说明计算能力比较强,且影片的宽容度更高,如调色、细节表现、高速镜头展现等。在直观感受上,Sora模型产出的视频运镜自然,物体运动符合规律,镜头间逻辑一致性好,但是Sora视频的逻辑性会差一点。针对目前Sora存在的不成熟之处,Openai表示,Sora可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系。