Gemini 图像识别辅助功能导出

Gemini重磅升级:直接生成Office文件,从此无需复制粘贴

Google 旗下 AI 助手 Gemini 实现重大升级,支持在聊天界面直接生成并导出多种格式文件,包括 Google Docs、Microsoft Word、PDF、Google Sheets、Excel、CSV、LaTeX 和 Markdown 等。此前用户需手动复制内容至其他编辑器,此次更新通过自然语言指令即可完成生成与导出,极大提升效率。该功能补齐了生产力工具链短板,使 Gemini 从对话工具向生产力中枢转变,优化了

Cursor五百亿美元融资被大厂投资者拒,OpenAI与Anthropic有何影响?

SpaceX计划以600亿美元收购AI编程平台Cursor,或支付100亿美元合作费,旨在强化AI能力并准备IPO。谷歌成立Gemini精英团队,由布林亲自参与,以提升AI工程实战能力,追赶Claude模型。Cursor正在进行新一轮融资,估值达500亿美元。国内AI企业DeepSeek也开启首轮外部融资,投后估值预计超100亿美元。AI编程赛道竞争激烈,各方积极布局。

谷歌办公套件新增智能助理,让工作更高效

谷歌云峰会宣布 Workspace 套件重大更新,引入全新 AI 系统 Workspace Intelligence,旨在自动化工作流程,减轻办公负担。该系统利用用户数据提供协助,但用户可管理访问权限。新功能涵盖电子邮件撰写、Google Sheets 等领域,通过 Gemini 自动化表格构建与填写,提升效率。

惊喜大放送:AI Studio全功能免费,高阶会员零门槛畅享Gemini Pro等尖端AI

谷歌AI Studio向持有Google AI Pro或Ultra会员的用户免费开放多款前沿大模型使用权限,无需API Key或付费绑定,取消信用卡绑定等配置步骤,大幅降低使用门槛。此举旨在提升会员性价比和创作体验,巩固谷歌在AI生态中的“亲民”形象,助力快速原型开发、内容生成等任务。

Jeecg团队亲测Gemini CLI:AI险些让项目全军覆没

近期,JeecgBoot低代码团队因Claude Code频繁的认证和封号问题,转而测试Google的Gemini CLI。测试发现,Gemini CLI在执行自定义技能(Skills)方面表现出色,能无缝对接Claude Code的Markdown指令,支持报表生成、表单配置、数据大屏搭建等复杂任务,逻辑推导能力优于部分国产大模型。但在命令执行方面,Gemini CLI的基础功能扎实,生态建设尚需完善

谷歌推出顶尖语音合成AI,覆盖约70种语言

谷歌推出Gemini-TTS,定位为最富表现力的文本转语音解决方案。核心突破在于赋予开发者对语音情感、节奏和风格的精确控制权,通过提示词实现细腻自然的语音生成。支持约70种语言,自动识别语种,满足全球用户需求。与同系列音频模型协同,适用于实时对话、语音翻译等多场景。

谷歌推出全新Windows桌面AI应用,搜索仅需轻松两键

谷歌推出全新AI搜索应用“Google app for desktop”,面向Windows用户,无需浏览器即可进行信息搜索。应用内置Gemini AI技术,通过“Alt+Space”快捷键快速启动搜索,支持网页、本地文件、应用和Google Drive的检索。此外,集成Google Lens实现屏幕内容搜索,以及屏幕共享功能,提升操作便捷性。目前支持Windows 10及以上系统,提供英文界面,尚未推出中文版本。

Chrome新增Gemini快捷指令库,提示词可一键调用免重复

Google 今日更新桌面版 Chrome 浏览器,引入全新“技能库”功能,允许用户将复杂 AI 提示词固化为“技能”,实现跨网页一键复用。此功能改变了以往重复输入背景信息的交互逻辑,通过健康管理、智能购物、效率办公等场景,提升实用性。为保障安全,保留了必要确认机制。此举强化 Chrome 在 AI 时代的入口地位,使其从单纯浏览器向操作系统化演进。

谷歌Gemini新增动态图像生成:Nano Banana技术驱动实时视觉交互

谷歌AI助手Gemini推出革命性交互式图像生成功能,基于Nano Banana技术实现动态交互模拟。用户可通过“向我展示可视化图表”按钮生成可操作模拟程序,如调节月球绕地运行速度、拆解汽车引擎等,直观解构复杂逻辑。虽与Anthropic的Claude类似,但Gemini交互深度独特且不支持保存内容。该功能目前面向全球Gemini Pro用户推出,未来迭代尚不明确。

生成式AI在医疗推理中仍显不足,临床落地尚需辅助

麻省总医院MESH孵化器团队的研究显示,尽管生成式AI在医疗领域应用日益广泛,但在模拟真实诊疗的逻辑推理中存在显著短板。研究测试了21种大语言模型(如ChatGPT等)在29个临床病例中的表现,发现它们在完整信息下诊断准确率超90%,但在关键环节“鉴别诊断”中表现欠佳,多数模型无法进行系统性分析。研究引入PrIME-LLM综合评价指标,结果显示