人工智能

DeepSeek-R1 更新,思考更深,推理更强

DeepSeek R1 模型已完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、APP 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。

DeepSeek-V3 模型更新,各项能力全面进阶

DeepSeek V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。模型能力提升一览推理任务表现提高新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,

挑战ChatGPT!马斯克即将发布AI 「Grok」

由埃隆·马斯克创立的xAI公司,计划于本周推出其首款产品“Grok”。这位以创建特斯拉、SpaceX和Neuralink等公司而著名的亿万富翁宣布,这款AI聊天机器人将作为早期体验项目的一部分,被集成到X平台(原Twitter)。公司目前已开放注册这一项目,但只对X社交平台高级会员开放,免费用户暂时还无法获得访问权限。这款名为Grok的AI模型被设计为能够机智地回答问题,带有些许叛逆的特质。xAI

苹果为自家芯片打造开源框架MLX,实现Llama 7B并在M2 Ultra上运行

苹果的这个新框架 MLX 不仅拥有 PyTorch 风格的 API,还为开发者提供了很多经典示例(比如 Llama、LoRa、Stable Diffusion 和 Whisper)。2020 年 11 月,苹果推出 M1 芯片,其速度之快、功能之强大一时令人惊艳。2022 年苹果又推出了 M2,今年 10 月,M3 芯片正式登场。苹果在发布芯片的同时,也非常注重在其芯片上训练和部署 AI 模型的能

谷歌发布能力最强AI模型Gemini:性能碾压GPT4 语言理解超人类

12月7日消息,北京时间7日凌晨,Google公司突然放出了自己“迄今为止最强大、最通用的模型”Gemini。Gemini是一款多模态模型,可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。第一个版本 Gemini 1.0 推出3款不同尺寸模型:Ultra、Pro 和 Nano。Gemini能理解“文本、代码、音频、图像和视频”五种信息其中,Gemini Ultr

2023年,AI行业新晋10家独角兽

今年的 AIGC 持续热了一年,从王慧文等大佬的入局,到百度发布「文心一言」,各大巨头纷纷发布大模型产品,切实地给中国人工智能赛道的融资添了一把浓烈的火。