跳转至

更新日志

Smart-Diffusion 的所有重要更改都将记录在此文件中。

格式基于 Keep a Changelog, 此项目遵循 语义化版本

[0.1.2] - 2026-03-16

更改

  • 启动入口统一为仅使用 run.sh
  • 启动/系统参数统一由 system_config.yaml 管理
  • 用显式的 cfp -> infer.diffusion.cfg_size 替代旧的 CFG 并行开关
  • 文档启动示例统一为 bash run.sh system_config.yaml ...
  • 评测配置扩展为多选 eval.eval_type=[...]
  • 新增评测策略:fidfvdpsnrssimlpips(保留 vbench
  • 新增 eval.reference_path,参考型指标在路径缺失时按策略跳过并告警

[0.1.1] - 2026-02-16 除夕

新增

  • VBench 测评支持
  • 为核心模块添加了全面的英文文档字符串
  • 增强的 README.md,包括:
  • 改进的结构和格式
  • 全面的功能描述
  • 详细的安装说明,支持 uv
  • 使用示例和配置指南
  • 贡献指南和路线图
  • 使用 MkDocs Material 的完整文档网站
  • 安装指南
  • 快速入门教程
  • 架构概览
  • 常见问题部分
  • 配置指南
  • 用于自动文档部署的 GitHub Actions 工作流
  • 支持文档搜索和代码高亮
  • 中文文档和语言切换功能

更改

  • 重组文档结构,划分清晰的部分
  • 改进整个代码库的代码文档标准
  • 修复文档中的图标渲染问题
  • 将性能测试数据更新为"待测试"状态

[0.1.0] - 2026-01-27

新增

  • Smart-Diffusion 初始发布
  • 支持 Wan-T2V 系列模型(1.3B、14B、A14B)
  • 多种注意力后端支持:
  • FlashAttention(默认)
  • SageAttention(量化)
  • SpargeAttention(稀疏)
  • 内存优化功能:
  • 带模型卸载的低内存模式
  • VAE 分块支持
  • 多级内存管理(0-3)
  • 用于特征重用的 FlexCache 系统:
  • TeaCache 策略
  • 金字塔注意力广播(PAB)策略
  • 并行支持:
  • 上下文并行(CP)
  • 分类器自由引导(CFG)并行
  • 评估支持:
  • VBench 自定义模式评估
  • 配置系统:
  • 基于 Hydra 的配置
  • 三层参数系统(模型/用户/系统)
  • 任务管理:
  • 任务池和调度器
  • 用于分布式执行的请求序列化

已知问题

  • 数据并行尚未实现
  • 有限的模型支持(仅 Wan-T2V)
  • 某些领域的文档不完整

未来路线图

计划功能

  • [ ] Models
  • [ ] Flux-2
  • [ ] FireRed-Image-edit
  • [ ] Longcat
  • [ ] AutoVideoParallel
  • [ ] DiTango
  • [ ] 混合并行组合
  • [ ] FlexCache
  • [ ] 统一的缓存策略
  • [ ] 量化改进
  • [ ] 生产功能
  • [ ] HTTP API 服务器
  • [ ] 批处理和请求排队
  • [ ] 监控和指标
  • [ ] 更好的算子实现
  • [ ] 自定义 CUDA 内核
  • [ ] Triton 实现
  • [ ] 全面的基准测试
  • [ ] 性能比较
  • [ ] 质量指标

文档改进

  • [ ] 所有模块的完整 API 参考
  • [ ] 更多使用示例
  • [ ] 视频教程
  • [ ] 社区贡献指南

贡献

有关如何为 Smart-Diffusion 做出贡献,请参阅 贡献指南


有关详细的提交历史,请参阅 GitHub 提交