Smart-Diffusion 文档¶
欢迎使用 Smart-Diffusion 文档!Smart-Diffusion 是一个高性能扩散模型推理框架,为 AI 生成内容(AIGC)工作负载提供极致性能和灵活调度。
什么是 Smart-Diffusion?¶
Smart-Diffusion 基于 Chitu 构建,Chitu 是一个高性能 LLM 推理框架。它扩展了 Chitu 的能力以支持快速增长的 Diffusion 生态系统,提供:
- 🚀 极致性能:先进的并行化策略和优化内核
- 🔧 灵活架构:多种注意力后端支持
- 💾 内存效率:具有智能模型卸载的低内存模式
- 📊 智能缓存:用于加速的特征重用算法
- 🎯 简洁 API:易于使用的接口,支持基于请求的配置
快速链接¶
主要特性¶
高性能推理¶
Smart-Diffusion 通过以下方式实现卓越性能:
- 并行化:上下文并行 (CP)、CFG 并行和数据并行
- 优化内核:FlashAttention、SageAttention、SpargeAttention
- 智能调度:高效的任务管理和资源利用
内存效率¶
在有限硬件上运行大型模型:
- 模型卸载:DiT 模型和编码器的 CPU 卸载
- VAE 分块:在解码期间减少内存使用
- 灵活配置:可调节的内存级别 (0-3)
特征重用¶
通过特征缓存复用加速生成:
- TeaCache (CVPR24)
- PAB (ICLR25)
支持的模型¶
当前支持:
- Wan-AI/Wan2.1-T2V-1.3B
- Wan-AI/Wan2.1-T2V-14B
- Wan-AI/Wan2.2-T2V-A14B
更多模型即将推出!
架构概览¶
graph TD
graph TD
A[UserRequest] --> B[TaskPool]
B --> C[Scheduler]
C --> |Task| G[Generator]
G --> VE[VAE Encoder]
G --> TE[TextEncoder]
TE -->|Latents| DiT[DiT Loop]
VE -->|Latents| DiT[DiT Loop]
DiT --> VD[VAE Decoder]
VD --> V[Output]
Smart-Diffusion 采用模块化架构:
- 任务管理:用户请求转换为任务并添加到任务池
- 调度:调度器选择待执行的任务
- 生成:生成器编排完整的生成流程:
- 文本编码 (T5)
- 迭代去噪 (DiT)
- VAE 解码
- 输出:生成的视频保存到磁盘
社区¶
加入我们的社区:
- GitHub:chen-yy20/SmartDiffusion
- 问题反馈:报告错误和功能请求
- 讨论:提问和分享想法
下一步¶
准备好开始了吗?
注意:Smart-Diffusion 正在积极开发中。我们欢迎贡献和反馈!