Sora引领影像创作革命的力量
;
副标题:无;
作者: Kevin Chen;
内容简介:
Sora提升影视制作的效率,引发各种形式的AI应用,具有庞大商业价值
多模态突破的Sora加速推动通用人工智慧的到来
♔ 从ChatGPT到Sora的AI技术革命
♔ Sora的诞生和爆发
♔ Sora多模态跨越式突破
♔ Sora技术报告全解读
♔ Sora迈向通用AI
♔ Sora成功背后的技术路线
♔ Sora带来的产业变革
【内容简介】
2022年ChatGPT横空问世,成为人工智慧的里程碑,而2024年一手打造ChatGPT的OpenAI又发布了文字生成影片大模型Sora,开创了视觉新纪元。只需要一行文字,Sora就能够生成长达60秒的高精细影片,画面不仅一镜到底、多机位切换、完成复杂运镜,还可呈现多变的人物及风景的动态,这意谓着使用者透过简单的文字叙述,就能让Sora创造出任何场景的影片,而打造出创新影片内容的无限可能性。
Sora是人工智慧领域的一次重大突破,更把多模态带往新的发展阶段。未来真正的通用人工智慧将会与人类相仿,可同时利用视觉、听觉、触觉等多种感知模态来理解世界,并对各种模态的资讯整合,而多模态突破的Sora加速推动了通用人工智慧的到来,拓展了人工智慧的应用领域。
Sora除了是一个文字生成影片大模型,还能理解使用者的需求在物理世界中的存在方式,其透过学习影片来理解真实世界的动态变化,并用电脑视觉技术模拟这些变化,从而创造出新的视觉内容。正如OpenAI在技术报告中所说的,Sora有望建构出能够模拟物理世界的通用模拟器,也就是真实世界建模。
Sora的出世,也对各个产业产生巨大的影响及挑战,像是在影音产业、广告行销、游戏、医疗等多个领域上皆有巨大的应用和价值。而本书正是立基于此,内容深入浅出、循序渐进,以Sora为主题,介绍了Sora的诞生和爆发,以及Sora成功背后的技术路线,也对Sora带来的产业变革进行细致和深入的分析,可帮助读者了解Sora,并在纷繁复杂的知识海洋中,梳理出认识人工智慧产业变革以及即将到来的通用人工智慧时代的线索。
目录预览:
Sora引领影像创作革命的力量
序言
Chapter 01_Sora的前世今生
1.1 横空降世的Sora
1.2 从ChatGPT到Sora
1.3 多模态的跨越式突破
Chapter 02_Sora是如何炼成的?
2.1 Sora技术报告全解读
2.2 用大模型的方法理解影片
2.3 Sora是世界模型吗?
2.4 Sora背后的重磅团队
Chapter 03_通用AI的里程碑
3.1 人类智慧vs人工智慧
3.2 从狭义AI到通用AI
3.3 Sora离通用AI还有多远
3.4 奇异点隐现,未来已来
Chapter 04_Sora爆发,颠覆了谁?
4.1 影视制作,一夜变天
4.2 Sora暴击短影音产业
4.3 Sora如何改变广告行销
4.4 游戏变革迎来Sora时刻
4.5 将视觉化带入医疗
4.6 重塑设计产业
4.7 当Sora对上新闻业
4.8 下一个科学大爆发的时代
4.9 教育界的大浪淘沙
4.10 未来属于拥抱技术的人
Chapter 05_Sora的运算能力突围
5.1 人类运算能力简史
5.2 运算能力高地争夺
5.3 Sora被困在运算能力里
5.4 如何