2024年AIGC趋势展望：视频生成的“百模大战”

互联网 2 年前 0 4

本文介绍: 可控视频生成的应用场景将远远多于可控图片生成，直观上感觉受到冲击最大的是短视频公司，比如最近爆火的生成小姐姐跳舞视频（通义千问-全民舞王），效果距离真人实拍差距已经不大了。2023年工业场景下落地最多应该是可控图像生成了，不少大厂专门成立了专门的智能创作部门，比较成功的有电商图创作、海报创作、家装图生成、用户发帖辅助创作、证件照生成、图片美化等，背后的技术大部分是lora/dreambooth/controlnet等，最核心护城河还是用于finetune的高质量数据。

2023年底发布的svd(stabilityai/stable-video-diffusion-img2vid · Hugging Face)、EMU(https://ai.meta.com/blog/emu-text-to-video-generation-image-editing-research/)、i2vgen-xl(GitHub – ali-vilab/i2vgen-xl: Official repo for VGen: a holistic video generation ecosystem for video generation building on diffusion models) 等模型相比

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

可控生成视频

相关文章

MCU+SFU视频会议一体化，视频监控，指挥调度（AR远程协助）媒体中心解决方案。

MCU+SFU视频会议一体化，视频监控，指挥调度（AR远程协助）媒体中心解决方案。

互联网 2 年前 6

视频上传-分片上传那点事

互联网 2 年前 6

ChatGPT高效提问—prompt基础

ChatGPT高效提问—prompt基础

chatgpt 2 年前 6

【AIGC核心技术剖析】DreamCraft3D一种层次化的3D内容生成方法

【AIGC核心技术剖析】DreamCraft3D一种层次化的3D内容生成方法

互联网 2 年前 6

WebRTC系列-H264视频帧组包(视频花屏问题)

WebRTC系列-H264视频帧组包(视频花屏问题)

互联网 2 年前 3

第8章 python深度学习——波斯美女

第8章 python深度学习——波斯美女

python 2 年前 5

JVM之GC垃圾回收

互联网 2 年前 7

行为型设计模式—中介者模式

互联网 2 年前 8

发表回复取消回复