AI快讯

谷歌斥资千万美元,用AI助力美国四万蓝领技工

OpenAI面临Anthropic的激烈竞争,后者年收入猛增,引发投资者对其8520亿美元估值的质疑。AI眼镜市场进入爆发期,千问AI眼镜S1开售,市场增速达智能眼镜整体市场的8倍,Meta、阿里等已占据领先地位,华为、苹果或即将入局。Anthropic创始人向特朗普政府介绍新AI模型Mythos,虽起诉美国防部,但仍保持沟通。谷歌Gemini推出新功能,

AI广告引发恐怖谷效应,网易云音乐为脖子异常设计致歉

多名网友吐槽爱奇艺平台上的网易云音乐广告画面诡异,女性人物脖子以不自然角度旋转,引发AI绘画“翻车”的讨论。网易云音乐客服回应后,事件凸显AI在创意生成中的问题。尽管AI潜力巨大,但此次事件警示行业,AI生成内容仍需人工审核,避免因人体结构处理不当引发“恐怖谷效应”。AI效率提升不能牺牲品牌审美和用户体验,否则可能损害品牌形象。AI技术落地需严谨审核,方能

AI电影即将爆发:爱奇艺预测半年内可出商业巨制

爱奇艺CEO龚宇在《人民日报》发文,预测AI技术将重塑影视全链条,并称AI商业大片将在半年内问世。他指出,视频生成大模型推动AI影视制作跨越实验阶段,行业将遵循“一一二定律”实现增长,预计3-6个月即可产出符合商业标准的大体量作品。媒体平台将转型为非中心化的“公共服务提供者”,催生全新内容生态。爱奇艺正尝试将数字IP实体化,已在江苏

全球顶尖视频生成模型——火山引擎Seedance 2.0 API现已全面开放

火山引擎正式上线Seedance 2.0系列API服务,面向企业及个人开放。该视频生成模型支持多模态输入,性能大幅提升,满足高质量创作需求。平台建立肖像与版权安全标准,提供人脸验证与虚拟人像库,解决合规问题。Seedance 2.0的商业化标志着视频生成技术向生产力工具的跨越。

Skywork AI新版Matrix-Game 3.0:720p流畅生成动态世界

Skywork AI 发布 Matrix-Game3.0 系统,实现 720p 高清下每秒 40FPS 的实时视频生成,并解决 AI 视频生成中的“长效记忆”缺失问题。该系统通过引入相机感知的记忆检索机制和统一自注意力架构,精准检索历史画面并联合建模近期、远期记忆与当前预测帧,确保长序列交互中的时空一致性。此外,团队构建了包含海量 3A 游戏数据的“

谷歌Gemini新增动态图像生成:Nano Banana技术驱动实时视觉交互

谷歌AI助手Gemini推出革命性交互式图像生成功能,基于Nano Banana技术实现动态交互模拟。用户可通过“向我展示可视化图表”按钮生成可操作模拟程序,如调节月球绕地运行速度、拆解汽车引擎等,直观解构复杂逻辑。虽与Anthropic的Claude类似,但Gemini交互深度独特且不支持保存内容。该功能目前面向全球Gemini Pro用户推出,未来迭代尚不明确。

阿里巴巴首款具身机器人亮相,高德业务部将推四足机器人

阿里巴巴旗下高德具身业务部将发布首款四足机器人,标志着其在具身智能领域的加速布局。自1月成立以来,高德已发布具身导航与操作模型,并构建了业内规模最大的具身导航数据引擎,实现跨场景高级功能。此次硬件发布体现了阿里集团将“空间智能”转化为“具身应用”的战略,依托技术优势形成“导航+具身”差异化竞争力,将AI版图延伸至物理交互

特斯拉2026春款新招:语音唤醒Grok,FSD随心订

特斯拉发布2026年春季软件更新,功能密度高,推动车载AI与自动驾驶全面进化。核心亮点包括Grok助手升级,支持“嘿”语音唤醒和位置感知提醒;FSD订阅与数据透明化,实现车内一键订阅并查看实时使用数据。此外,更新优化了“狗狗模式”等细节,如支持猫咪、刺猬图标及命名,增强盲区警示联动等,提升用户体验。

生成式AI在医疗推理中仍显不足,临床落地尚需辅助

麻省总医院MESH孵化器团队的研究显示,尽管生成式AI在医疗领域应用日益广泛,但在模拟真实诊疗的逻辑推理中存在显著短板。研究测试了21种大语言模型(如ChatGPT等)在29个临床病例中的表现,发现它们在完整信息下诊断准确率超90%,但在关键环节“鉴别诊断”中表现欠佳,多数模型无法进行系统性分析。研究引入PrIME-LLM综合评价指标,结果显示

火山引擎Seedance 2.0视频生成API上线 企业可调用

火山引擎于2026年4月14日上线Seedance 2.0 API服务,面向企业和个人开放视频生成能力,支持文字、图片、音频、视频多模态输入及编辑、延长等功能。该模型在复杂场景中表现更优,物理准确度与可控性提升,更适配工业级内容生产。同时,火山引擎将其从“强模型”升级为“可集成的基础能力”,并引入肖像与版权安全机制,包括人脸