DeepSeek V4 Flash Pro版本

DeepSeek

DeepSeek(深度求索)作为中国AGI领域的先锋企业研发的全能型AI平台,以“技术赋能、全场景适配、中文优先、安全高效”为核心定位,依托混合专家(MoE)技术与超大规模中文语料训练,覆盖个人助手、

知犀AI

知犀AI作为一款全平台AI思维导图工具,核心定位为“零门槛高效思路梳理助手”,深度接入DeepSeek-R1满血版等AI大模型,整合AI脑图生成、多结构适配、全平台同步等核心功能,无需专业技能,一键即

国内AI模型Minimax 2.7版代码公开,静候DeepSeek V4登场

MiniMax发布AI音乐生成模型Music 2.6,升级底层引擎与创作工具,降低生成延迟,提升音乐连贯性与音质,新增“音乐续写”等功能,优化创作者体验。同时推出开源命令行工具MMX-CLI,专为AI Agent设计,简化多模态模型调用,解决接口适配问题,支持主流开发环境一键调用编程、视频生成等功能,实现全模态模型原生接入。

生成式AI在医疗推理中仍显不足,临床落地尚需辅助

麻省总医院MESH孵化器团队的研究显示,尽管生成式AI在医疗领域应用日益广泛,但在模拟真实诊疗的逻辑推理中存在显著短板。研究测试了21种大语言模型(如ChatGPT等)在29个临床病例中的表现,发现它们在完整信息下诊断准确率超90%,但在关键环节“鉴别诊断”中表现欠佳,多数模型无法进行系统性分析。研究引入PrIME-LLM综合评价指标,结果显示

DeepSeek于内蒙古乌兰察布建数据中心并启动高薪招聘

DeepSeek在内蒙古乌兰察布地区发布招聘信息,增设数据中心高级交付经理和高级运维工程师岗位,薪资15,000至30,000元。此举旨在推动乌兰察布云计算产业发展。该数据中心利用当地地理和气候优势,降低能耗,此前已有苹果、快手等企业入驻。招聘的两个岗位分别负责项目全流程管理和运维管理,确保资源有效利用和服务连续性。

国产AI新锐DeepSeek估值破百亿,启动首轮外部融资

DeepSeek,一家坚持“自给自足”的国内AI领军企业,正进行首次外部股权融资,计划募资至少3亿美元,投后估值预计突破100亿美元。这一转变标志着其投身全球大模型资本博弈。早期依靠母公司幻方量化支持,DeepSeek-R1等模型曾惊艳全球。但如今,下一代V4模型研发需巨大算力投入和人才,且核心研究员被挖角,公司面临压力。此次募资

大模型融资战火再升级:阿里腾讯力捧DeepSeek,新品发布前估值剑指200亿美金

腾讯与阿里竞相投资国产大模型新锐DeepSeek,推动其估值超200亿美元,反映市场对头部独立模型厂商的溢价预期。DeepSeek将发布多模态模型DeepSeek v4,拓宽应用边界。腾讯混元3.0模型预计本周发布,由姚顺雨主导,采用轻量化设计,平衡性能与部署成本。大模型市场呈现两极趋势,初创公司估值飙升,巨头追求轻量化与效能平衡。竞争

大麦娱乐牵手阿里通义,推出AI潮玩设计新作妙呀

福客AI获阿里战略投资,双方将聚焦电商数字生产力提升,通过AI Agent优化商家运营、客户接待及服务体验。此举将强化福客AI产品体系,覆盖电商关键环节,加速AI与商家需求结合。Anthropic负责人指出AI快速发展引发用户焦虑,呼吁用户轻松跟上AI发展。腾讯云TokenHub发布DeepSeek-V4预览版,支持百万级上下文长度,提升NLP能力,提供高性价比服务,覆盖全球

寒武纪达成DeepSeek-V4全系列模型Day0适配并开源优化代码

寒武纪基于vLLM框架完成对DeepSeek-V4系列模型的“Day0”适配,涵盖285B参数Flash版及1.6T参数Pro版,确保模型发布即能在寒武纪硬件上稳定运行,代码已开源。针对DeepSeek-V4的稀疏注意力与压缩结构,寒武纪通过自研Torch-MLU-Ops库和BangC语言进行专项加速,优化核心模块,支持TP/PP/

DeepSeek-V4与寒武纪完成对接,AI算力效率跃升

寒武纪成功完成对开源AI模型DeepSeek-V4的Day 0适配,实现模型发布即稳定运行。通过Torch-MLU-Ops库加速Compressor、mHC等模块,结合vLLM技术支持多种并行计算方式及通信、量化优化,显著提升推理效率。此外,寒武纪深入挖掘硬件特性,优化访存与排序,加速稀疏Attention和Indexer结构,降低通信占比,提高分布式推理利用率。