vLLM推理框架优化

寒武纪达成DeepSeek-V4全系列模型Day0适配并开源优化代码

寒武纪基于vLLM框架完成对DeepSeek-V4系列模型的“Day0”适配,涵盖285B参数Flash版及1.6T参数Pro版,确保模型发布即能在寒武纪硬件上稳定运行,代码已开源。针对DeepSeek-V4的稀疏注意力与压缩结构,寒武纪通过自研Torch-MLU-Ops库和BangC语言进行专项加速,优化核心模块,支持TP/PP/