Stability AI发布Stable Video Diffusion模型把静态图片生成高质量的视频

AI • 2023年11月22日 19:39:00 • AI

初创公司Stability AI专注于开发人工智能（AI）产品，最近发布了一款令人期待的AI模型——Stable Video Diffusion。这款模型的独特之处在于，它能够通过现有的静态图片生成高质量的视频，是基于之前发布的Stable Diffusion文本转图片模型的延伸。目前市面上能够生成视频的AI模型相对较少，因此Stable Video Diffusion引起了广泛关注。

然而，需要注意的是，Stable Video Diffusion目前并不对所有人开放。它目前处于Stability AI所谓的“研究预览”阶段。想要使用这款模型的人必须同意一些使用条款，其中规定了Stable Video Diffusion的预期应用场景（例如“教育或创意工具”、“设计和其他艺术过程”等）以及非预期的场景（例如“对人或事件的事实或真实的表达”）。

Stable Video Diffusion实际上由两个模型组成：SVD和SVD-XT。SVD可以将静态图片转化为14帧的576×1024像素视频，而SVD-XT则使用相同的架构，但将帧数提高到24。两者都能以每秒3到30帧的速度生成视频。

根据Stability AI发布的白皮书，SVD和SVD-XT最初是在一个包含数百万视频的数据集上进行训练的，然后在一个规模较小的数据集上进行了“微调”，这个数据集只有几十万到一百万左右的视频片段。虽然这些视频的来源并不十分清楚，但白皮书暗示许多是来自公开的研究数据集，因此无法判断是否存在版权问题。

尽管Stable Video Diffusion还存在一些局限性，Stability AI对此也很坦诚。例如，这些模型不能生成没有运动或缓慢摄像机平移的视频，也不能通过文本进行控制，也不能渲染文字（至少不能清晰地渲染），也不能一致地“正确地”生成人脸和人物。

虽然目前还处于早期阶段，但Stability AI指出这些模型非常具有扩展性，可以适应诸如生成物体的360度视图等用例。最终，Stability AI的目标是将Stable Video Diffusion商业化，称其在“广告、教育、娱乐等领域”都有潜在的应用。这一新颖的AI模型无疑将为视频生成领域带来新的可能性。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.com/article/597666.html

AI Stability AI Stable Video Diffusion

AI认证作者

0 0

AI

Stability AI 资金告急，与知名投资集团洽谈融资

在人工智能领域，尤其是在文生图（文本生成图像）技术方面取得显著成就的英国初创公司Stability AI，目前正面临资金短缺的严峻挑战。据综合路透社和The Information…

AI
2024年5月19日
0
AI

谷歌CEO警告OpenAI：若依赖YouTube训练AI视频模型将采取法律行动

在近日的一次公开场合中，谷歌公司CEO桑达尔·皮查伊就人工智能（AI）领域的竞争态势发表了重要言论。他警告称，如果确定微软支持的OpenAI依赖YouTube内容来训练其能够生成视…

Google
2024年5月18日
0
AI

Gemini 1.5 Pro vs GPT-4：AI领域的双雄对决

在人工智能（AI）的战场上，谷歌和OpenAI两大巨头始终在竞争的前沿。近期，谷歌发布了其最新的大语言模型Gemini 1.5 Pro，而OpenAI的GPT-4也早已在市场上占据…

AI
2024年5月16日
0
AI

谷歌I/O大会揭幕新搜索功能：AI驱动，重塑搜索体验

谷歌正在引领一场搜索革命。在本周二的谷歌年度开发者大会I/O上，该公司宣布了其全球主流搜索引擎的重大新变化，这些变化由人工智能（AI）驱动，旨在将搜索体验提升到一个全新的水平。谷…

科技探索者
2024年5月15日
0
新闻

谷歌I/O大会一览：人工智能成核心，推出多项创新更新

在今日举行的谷歌年度开发者大会I/O上，人工智能（AI）成为贯穿始终的主题。谷歌首席执行官桑德尔·皮查伊在大会闭幕时透露，会议期间公司提及“人工智能”的次数高达121次，凸显了谷歌…

Google
2024年5月15日
0
AI

甲骨文推出Oracle Code Assist，AI编程助理助力高效Java开发

在人工智能（AI）技术迅猛发展的当下，编程领域也迎来了新的变革。继微软、OpenAI、谷歌等科技巨头之后，甲骨文公司近日正式推出了名为Oracle Code Assist的AI编程…

AI
2024年5月13日
0
AI

李彦宏肯定百度文心一言AI技术，无人化商业运营前景广阔

百度公司创始人、董事长兼首席执行官李彦宏在最近的一次内部颁奖活动中对自家文心一言模型及系列AI技术给予了高度肯定，并明确表示百度将沿着这条技术路径继续“勇闯无人区”。李彦宏指出，…

百度
2024年5月11日
0
手机

魅族MEIZU五款新手机曝光：主打AI功能，预计搭载骁龙8 Gen 2处理器

近日，科技媒体Android Headline通过深挖数据库，发现魅族MEIZU即将推出五款新手机，其中包括备受期待的魅族21 Note。这五款手机的型号分别为M411H、M411…

泡沫大盗
2024年5月8日
0
新闻

特斯拉Tesla计划今年投入近百亿美元用于AI训练和推理，马斯克：不跟上投入将难以竞争

近日，特斯拉首席执行官埃隆·马斯克通过社交媒体平台重申了公司今年的重要战略目标——计划投入约100亿美元（约合727亿元人民币）用于综合训练和推理AI技术，该技术将主要应用于汽车领…

Tesla
2024年4月30日
0
产品

苹果WWDC 2024临近，iOS 18预计带来重大AI升级

随着苹果全球开发者大会（WWDC）2024的临近，业界对新一代iOS 18操作系统的期待愈发高涨。据可靠消息，今年的WWDC将于美国太平洋时间6月10日至14日举行，届时iOS 1…

Apple
2024年4月27日
0
AI

创业公司Kimi大模型产品火爆出圈，能否持续引领AI新趋势？

近日，一家仅成立一年的创业公司凭借一款效果出众的大模型产品Kimi，在AI领域掀起了一股新的波澜。这款面向C端用户的智能助手以其独特的长文本处理能力和多场景应用功能，赢得了市场的广…

AI
2024年4月24日
1
AI

微软 AI 超级计算团队迎来 Meta 前高管 Jason Taylor

Taylor 的加入将为微软的 AI 超级计算团队带来更多经验和专业知识，有望推动该团队在人工智能领域的进一步发展和创新

苹果派
2024年4月23日
0
新闻

微软Clipchamp视频编辑工具推出AI新功能：快速清理无声部分内容

近日，微软公司旗下知名的视频编辑工具Clipchamp宣布上线了一项全新的AI功能——Silence Removal（无声部分移除）。这一创新功能通过人工智能技术，能够自动筛选出视…

好奇宝宝
2024年4月19日
0
新闻

OpenAI高管罕见合体访谈：未来AI发展将震惊世界

近日，人工智能领域的领军企业OpenAI的CEO Sam Altman和COO Brad Lightcap罕见合体，接受了投资人播客VC20的专访。在访谈中，两位高管共同回顾了Op…

百度
2024年4月18日
0
新闻

苹果iOS 18将推出全新AI功能，设备端运行引领行业创新

在人工智能领域持续创新的苹果公司，近日再次引发了业界的广泛关注。据彭博社知名记者马克·古尔曼透露，苹果正计划在其即将发布的iOS 18操作系统中首次推出全新的人工智能功能，而且这些…

Apple
2024年4月17日
0
AI

生成式AI投资激增，美国领跑全球，中国AI专利数领先

在全球AI领域私人投资连续两年下滑的背景下，生成式AI领域却异军突起，成为投资市场的新宠。据最新统计数据显示，去年生成式AI投资大幅增长，比2022年增长了近2倍，总额达到252亿…

AI
2024年4月17日
0
AI

Create2024百度AI开发者大会盛大开幕，科技巨头共襄盛会

深圳国际会展中心（宝安）今日迎来了科技圈的一大盛事——Create2024百度AI开发者大会。这场备受瞩目的科技盛宴吸引了全球近万名顶尖开发者和业界领袖，共同探讨人工智能的未来发展…

百度
2024年4月16日
0
商业

NEAR 联创 Illia：为何 AI 需要 Web3？

近日，NEAR联创Illia出席了“2024香港Web3嘉年华”活动，并发表AI和Web3相关话题的重要演讲。本文特对其演讲进行了整理，略有删减。大家好，我是NEAR的联合创始人…

cl15
2024年4月11日
0
AI

美得克萨斯州引领潮流，率先采用AI阅卷评分系统

美国得克萨斯州在创新教育的道路上又迈出了一大步。近日，该州宣布在学术准备评估（STAAR）考试中引入“自动评分引擎”，成为美国首个公开采用人工智能阅卷评分的州。此举不仅标志着教育考…

AI
2024年4月11日
0
AI

AI电商时代来临？eBay上线人工智能驱动的时尚穿搭购物

随着人工智能（AI）技术的飞速发展，电子商务（电商）领域正在经历一场前所未有的变革。AI电商不仅仅是一个概念，它已经成为推动在线购物体验进步的强大动力。从个性化推荐到智能客服，AI…

商业头条
2024年4月10日
0

发表回复

登录后才能评论

Stability AI发布Stable Video Diffusion模型把静态图片生成高质量的视频

相关推荐

发表回复