每日更新 · 全球AI情报台

AI热点新闻

聚焦人工智能行业的最新突破、产品发布与政策风向,帮助团队捕捉下一波AI增长机会。每条新闻均配备独立静态页面,方便日后回查。

最近更新:2025年02月15日 · 北京时间 10:20
涵盖 OpenAI、Anthropic、Meta、Microsoft、Google 等头部企业的官方动态与融资政策
🗣️ 实时语音

OpenAI Realtime Voice API 全面开放,推出多角色即时对话

OpenAI 宣布 Realtime Voice API 进入全面可用阶段,并上线「角色预设」与「对话状态」接口,开发者可以在数十毫秒内完成语音理解、情感合成与多轮交互。官方同时发布桌面演示与浏览器 SDK,方便客服、教育和物联网场景快速接入。

  • · 新增 Voice Presets,支持客服、助理、主持人等多种情绪与语速方案,便于快速匹配品牌调性。
  • · 对话状态接口允许在多设备间同步上下文,语音与文本可以无缝切换。
  • · 与 Assistants API 深度整合,可结合文件检索与函数调用,实现带引用的实时回复。
发布日期:2025-02-18 阅读全文 →
🎙️ 语音升级

Google 发布 Gemini Live,提供毫秒级语音对话体验

Gemini Live 将 Gemini 模型与 WebRTC 打通,支持超低延迟的语音交互与屏幕共享,可直接在网页与移动端完成实时翻译、问答和演示讲解。

  • · 支持 1 分钟上下文记忆与多轮连续语音提问
  • · 可读取屏幕内容,结合网页元素生成讲解与摘要
  • · 开放 Live API,方便企业将实时语音接入现有产品
发布日期:2024-09-05 阅读全文 →
🇨🇳 国产模型

百度发布文心5.0,多模态与 RAG 原生升级

百度在北京发布文心5.0,将多模态理解、检索增强与企业级安全作为默认配置。新版模型默认支持图片、表格与 PDF 输入,并提供知识引擎方案,帮助团队在搜索、客服和文档场景里附带引用回答。

  • · RAG 管线内置向量化、召回与重排,可连接百度搜索和企业私有知识库。
  • · 长上下文与流式思考链,可在分析时持续引用外部资料,减少幻觉。
  • · 千帆平台提供安全审计、水印检测与私有化部署,满足金融、教育合规要求。
发布日期:2025-02-15 阅读全文 →
🦙 开源模型

Meta 发布 Llama 3.3 Omni 70B,强化智能体与搜索体验

Meta 宣布 Llama 3.3 Omni 70B 正式开放下载及 API 访问,新增 256K 上下文、多模态输入与实时检索能力。官方同时推出 Llama Guard 3 与 Workflow Preset,帮助企业在客服、搜索与内容创作场景搭建更安全的智能体。

  • · Omni 推理引擎支持文本、语音、图像与视频输入,比 Llama 3.2 在多模态基准上提升 17%。
  • · Retrieval Boost 可直接挂接 Meta 搜索索引或自建向量库,回答中自动附带引用链路。
  • · Llama Guard 3 提供细粒度策略标签,便于金融、教育等垂直行业审计提示词与输出。
发布日期:2025-02-10 阅读全文 →
🧠 推理模型

OpenAI 发布 o3-mini,面向开发者的低延迟推理模型全面开放

OpenAI 宣布 o3-mini 正式上线 API 与 ChatGPT,主打更快的链式推理与复合任务执行。该模型继承 o1 系列的思考深度,同时将响应延迟压缩至秒级,适合嵌入代码解释、业务分析与自动化代理场景。OpenAI 还同步推出 reasoning API 计费模式,允许团队根据推理步数付费。

  • · o3-mini 默认开启逐步思考,可通过 `reasoning tokens` 限制推理成本,并在复杂问题时自动扩展。
  • · 新增 Structured Output 模式,允许开发者定义 JSON Schema,保证模型返回结构化结果。
  • · 与 Assistants API 集成后,可调用 Code Interpreter 与文件检索,实现更稳健的企业知识问答。
发布日期:2025-02-05 阅读全文 →
🚀 模型升级

Google 发布 Gemini 2.1 Flash,强化实时推理与多模态自动化

Google 在 Cloud AI 大会上宣布 Gemini 2.1 Flash 正式面向企业客戶开放。新版模型将思考链条延伸至 128K tokens,并新增可组合的视觉与语音输入,方便团队在客服、质量巡检与运营监控场景中部署 AI 自动化。Google 同时发布 Live API,让 Flash 能够通过持续监听事件与外部数据流触发动作。

  • · Workflow Orchestrator 支持基于 Vertex AI 的多模型调度,允许 Flash、Gemini Pro 与企业自建模型协同工作。
  • · Live API 可订阅 Pub/Sub、BigQuery 或第三方 Webhook,触发即时推理与自动回复流程。
  • · 安全中心新增「Prompt Shield」与数据脱敏模板,帮助企业满足金融与医疗合规要求。
发布日期:2025-01-28 阅读全文 →
🤖 大模型进展

Anthropic 推出 Claude 3.5 Haiku,加速企业级知识问答与自动化

Anthropic 发布 Claude 3.5 Haiku,延续 Claude 3.5 系列在推理与工具调用上的升级,同时大幅降低响应延迟。Haiku 版本面向企业知识库、客服与多语种场景,支持 200K 上下文窗口,并与 Workflows 平台深度集成,可在一分钟内搭建自定义 Agent 工作流。

  • · Workflows 新增可视化编排器,支持条件分支、并行调用与外部 API 集成。
  • · 新增 Retrieval Connectors,可原生接入 Confluence、SharePoint 与 Google Drive 文档。
  • · Anthropic Control 台提供安全审计与提示词日志导出,方便企业合规留档。
发布日期:2025-01-22 阅读全文 →
🔍 搜索体验

OpenAI 发布 SearchGPT Beta,实时搜索与生成结果全面融合

OpenAI 宣布 SearchGPT Beta 正式开放候补邀请,用户可以在一个界面中同时获得实时网络搜索结果与模型生成的答案摘要。平台突出「引用溯源」与「多模态汇整」两大能力,可在回答中显示具体来源链接、图片与表格,帮助团队快速验证信息并整理报告。

  • · 支持自定义垂直领域,例如学术、开发文档或本地新闻,提供精准来源筛选。
  • · 引入「快照对比」功能,可对不同时间点的网页内容进行差异对照与总结。
  • · 企业方案允许接入自有知识库,并通过访问控制限制敏感数据范围。
发布日期:2025-01-15 阅读全文 →
🧑‍💻 开发者工具

Google 推出 Gemini Code Assist 企业版,统一 IDE 与云端 AI 开发体验

Google 宣布 Gemini Code Assist Enterprise 正式上线,将 Gemini 2.0 模型引入 VS Code、JetBrains 与 Cloud Workstations。企业可通过统一的策略中心设定代码审计、依赖安全与提示词管理,开发者则能在熟悉的 IDE 中获得实时补全、重构建议与交互式调试面板。

  • · 支持与 Cloud Build、Artifact Registry 打通,实现从提示词到部署流水线的无缝衔接。
  • · 提供企业私有语料库微调选项,并可通过 Vertex AI Guardrails 控制输出合规性。
  • · 新增代码审查摘要与单测建议,让团队在 PR 审核阶段快速聚焦潜在风险。
发布日期:2025-01-18 阅读全文 →
🍎 生态升级

Apple Intelligence 全球版上线,深入整合 iPhone 与 Mac 工作流

Apple 宣布 Apple Intelligence 正式拓展至更多国家和地区,为 iOS 18.3、iPadOS 18.3 与 macOS Sequoia 带来全局写作工具、图像生成功能与升级后的 Siri 智能。全新的 Private Cloud Compute 架构提供端云协同的安全保障,企业可通过 Apple Business Manager 配置启用策略,并与 Microsoft 365、Slack 等主流应用协同。

  • · Writing Tools 支持跨应用重写、润色与总结,自动保持品牌语气。
  • · Image Playground 新增商用授权模板,可在 iMessage、Keynote 与 Freeform 中一键生成视觉素材。
  • · Siri 获得上下文记忆与捷径编排能力,可跨 App 自动完成邮件、日程与任务。
发布日期:2025-01-08 阅读全文 →
💼 企业助手

Amazon 推出 Q Business,整合企业知识库与自动化

Amazon 在 re:Invent 大会上发布 Q Business,会话式助手可与企业内部的 文档、知识库与项目管理系统连接,提供问答检索、自动总结与任务指派能力,并支持基于 Guardrails 的访问控制。

  • · 支持连接 SharePoint、Jira、Salesforce 等常见 SaaS,几分钟内完成数据同步。
  • · 新增生成式 BI 仪表盘,可根据自然语言生成多维图表与指标解释。
  • · 通过 IAM 与细粒度权限控制,确保敏感知识只对授权团队成员开放。
发布日期:2024-12-20 阅读全文 →
🧠 推理模型

DeepSeek 发布 R1 推理模型与 Agent 平台

DeepSeek 宣布开源 R1 推理模型,主打链式思考与自我校准能力,并配套发布 DeepSeek Agent 平台,提供一站式任务编排、知识库与工具调用接口。R1 在数学推理、复杂代码生成与多步骤问答上的表现明显提升,吸引大量社区开发者测试。

  • · R1 模型开放 7B 与 32B 权重,兼容 vLLM、TensorRT-LLM 等主流推理框架。
  • · DeepSeek Agent 内置工作流画布,可组合搜索、函数调用与多模态理解。
  • · 官方评测显示在 GSM8K、HumanEval 等基准上较上一代模型平均提升 18%。
发布日期:2024-12-12 阅读全文 →
⚡ 算力发布

NVIDIA 发布 Blackwell B200 GPU 与 GB200 NVL72 平台

NVIDIA 在 2024 年秋季 GTC 大会上公布 Blackwell 架构,推出 B200 GPU 与 GB200 NVL72 超级计算平台。新平台将 Grace CPU 与 72 张 B200 组合成统一内存池,可在 5 倍能效下完成超大模型的训练与推理。

  • · 单卡提供 192GB HBM3e 与 8 TB/s 带宽,推理性能较 Hopper 提升 5 倍。
  • · 第六代 NVLink 支持 130 TB/s 集群互联,自动完成跨卡内存编址。
  • · 搭载 NIM 微服务,可一键部署向量检索、模型托管与安全审计。
发布日期:2024-12-05 阅读全文 →
🛠️ 企业套件

OpenAI 发布 GPT-4o Enterprise 套件与集中式 Agent 控制台

OpenAI 面向大型团队推出 GPT-4o Enterprise,整合可扩展的调用额度、数据分区加密以及 Agent 控制台。企业可以批量部署自定义 Agent、监控调用安全策略,并通过企业 API 网关统一管理多区域的数据驻留。

  • · Agent 控制台支持可视化流程编排、A/B 测试与版本回滚。
  • · 引入企业级守护进程,提供提示审计、数据水印与实时风险告警。
  • · 提供 99.9% SLA 与多云直连选项,满足金融、医疗等合规行业部署需求。
发布日期:2024-10-08 阅读全文 →
🚀 今日头条

OpenAI 发布 GPT-4o mini 与全新 Realtime API

OpenAI 推出低成本的 GPT-4o mini 模型,并将实时语音能力升级为独立 API,让开发者能够在网页和移动端实现毫秒级语音对话。

  • · GPT-4o mini 输入/输出费用分别为 0.15 / 0.60 美元(每百万 tokens)
  • · Realtime API 支持语音流式传输与多轮上下文保持
  • · ChatGPT 桌面应用同步支持实时语音与屏幕共享
发布日期:2024-07-18 阅读全文 →
📈 能力升级

Anthropic 推出 Claude 3.5 Sonnet,推出 Projects 协作空间

Claude 3.5 Sonnet 提升了推理与代码能力,并新增 Artifacts 与 Projects 功能,帮助团队在同一工作区内管理资料、指令与生成内容。

  • · 200K tokens 长上下文,图文多模态一次完成
  • · Projects 支持团队成员共享文件、提示词与版本记录
  • · Artifacts 面板可直接导出网页、脚本与设计稿
发布日期:2024-06-20 阅读全文 →
🌐 开源生态

Meta 发布 Llama 3.1 全家族,开放 405B 参数巨型模型

Meta 更新 Llama 3.1 系列,覆盖 8B、70B 与 405B 三种参数规模,并强调在多语言、代码与工具调用上的性能提升。

  • · 405B 支持多机分布式推理,提供企业级推理参考架构
  • · 官方推理在 AWS、Azure、GCP 以及 Hugging Face 同步上线
  • · 新增 Tools API 参考实现,简化函数调用与检索增强
发布日期:2024-07-23 阅读全文 →
🤖 模型发布

Microsoft 发布 Phi-3 系列,轻量模型覆盖端侧与云端

微软推出 Phi-3-mini、Phi-3-small 与 Phi-3-medium 三个尺寸,主打低成本与端侧部署能力,适合移动端与嵌入式设备使用。

  • · Phi-3-mini 4K 支持移动端部署,体积 3.8B 参数
  • · Azure AI Foundry、Hugging Face 及 NVIDIA NIM 同步上架
  • · 微软提供整合 Copilot Studio 的企业接入模板
发布日期:2024-04-23 阅读全文 →
🛰️ 行业动态

NVIDIA 推出 RTX AI Workbench 套件,强化本地生成式体验

NVIDIA 发布 RTX AI Workbench 与全新驱动更新,帮助开发者在搭载 RTX GPU 的 PC 上快速部署和微调生成式 AI 模型,并与云端工作流无缝衔接。

  • · Workbench 支持一键下载、配置并在本地微调热门开源模型
  • · 与 NVIDIA NIM、Omniverse Cloud 协同,实现云端到本地的项目同步
  • · 最新 RTX 驱动优化 Stable Diffusion、LLaVA 等工作负载性能
发布日期:2024-08-12 阅读全文 →
🧭 企业策略

Google 宣布 Gemini 1.5 Pro 面向全球开发者全面开放

在 Google Cloud Next 上,Gemini 1.5 Pro 提供 100 万 tokens 长上下文与音视频理解能力,并登陆 Vertex AI 与 AI Studio。

  • · 支持视频帧理解、代码审查与多语言翻译
  • · 企业账户可在 Vertex AI 中创建私有连接器
  • · 发布新的安全合规工具集成 Data Loss Prevention
发布日期:2024-04-09 阅读全文 →

AI 投资与政策速览

微软向阿联酋 G42 投资 15 亿美元,强化中东 AI 基建

微软宣布对阿联酋 AI 企业 G42 投资 15 亿美元,并提供 Azure 支持,帮助当地政府与企业建设合规、安全的云端 AI 服务。

2024-04-16 · Microsoft

欧盟正式通过《AI 法案》,高风险系统迎来合规倒计时

欧洲理事会完成 AI Act 最终立法程序,要求基础模型披露训练数据摘要,并设立监管沙盒帮助中小企业测试 AI 产品。

2024-05-21 · European Council

人形机器人创业公司 Figure AI 完成 6.75 亿美元融资

Figure AI 获得微软、OpenAI、亚马逊等联合投资,资金将用于加速通用人形机器人研发,并在制造业与物流场景中试点。

2024-03-28 · Figure AI