人工智能

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

两个月前,我们发布了实验性的 DeepSeek-V3.2-Exp,并收到了众多热心用户反馈的对比测试结果。目前未发现 V3.2-Exp 在任何特定场景中显著差于 V3.1-Terminus,这验证了 DSA 稀疏注意力机制的有效性。也感谢广大用户一直以来的积极反馈与支持,为我们的持续创新注入了更多信心与动力。今天,我们同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.

DeepSeek-V3.1 正式发布

今天,我们正式发布 DeepSeek-V3.1。本次升级包含以下主要变化:混合推理架构:一个模型同时支持思考模式与非思考模式;更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。官方 App 与网页端模型已同步升级为

挑战ChatGPT!马斯克即将发布AI 「Grok」

由埃隆·马斯克创立的xAI公司,计划于本周推出其首款产品“Grok”。这位以创建特斯拉、SpaceX和Neuralink等公司而著名的亿万富翁宣布,这款AI聊天机器人将作为早期体验项目的一部分,被集成到X平台(原Twitter)。公司目前已开放注册这一项目,但只对X社交平台高级会员开放,免费用户暂时还无法获得访问权限。这款名为Grok的AI模型被设计为能够机智地回答问题,带有些许叛逆的特质。xAI

DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。模型能力提升一览推理任务表现提高新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,

苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRa、Stable Diffusion 和 Whisper)。2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能

DeepSeek-R1 更新,思考更深,推理更强

DeepSeek R1 模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。