混合推理路径 SigLIP-2 动态分辨率编码器计算机操作助手 CUA

15B参数轻量级模型,微软开源Phi-4推理视觉版,高性价比首选

微软开源多模态推理模型Phi-4-reasoning-vision-15B,参数规模15B,兼顾轻量与高性能,适合资源受限环境。模型使用200B多模态token训练,注重数据质量,通过清洗、合成及领域数据配比提升科学推理和屏幕定位能力。其创新混合推理路径结合SigLIP-2动态分辨率编码器,增强对高分辨率图像细节的感知力,适合开发计算机操作助手。模型