是由七火山科技开发的一个平台,专注于提供先进的人工智能视频生成服务。这个平台的核心产品是Etna(埃特纳)模型,它是一个AIGC(AIGeneratedContent,人工智能生成内容)模型,能够根据用户提供的简短文本描述生成相应的视频内容。
Etna模型的技术架构基于Diffusion架构,并正在实验和适配一个与Sora相似的Diffusion+Transform架构,这使得它能够更好地处理视频数据,考虑图像序列中的时间连续性。它在语言模型和图像模型中插入了时空卷积和注意力层,从而拥有一定的时空理解能力,能够理解并生成具有时间维度的视频内容。
Etna模型的训练过程采用了先进的深度学习技术策略,包括大规模训练(LDS)、复杂的超参数优化(HPO)和微调(DPO),这些技术的应用确保了模型的强大性能和生成能力。
Wisecut是一款在线自动视频编辑软件,它使用人工智能和语音识别来快速轻松地编辑视频。它会自动将长视频剪辑成更短、更有影响力的内容,并配有音乐、字幕和面部识别功能。它还使用...