#ee [35]

DeepSeek出圈背后的逻辑 开源与高效性的胜利
AI若要真正赋能全人类,让每个人都能用得上、用得起大模型和通用人工智能,高效性是关键。智能革命需要像信息革命一样,不断提高能力密度,降低计算成本,使大模型更加普惠。 清华大学长聘副... ...
AI界拼多多DeepSeek实力如何?几轮实测后我有了答案
AI界拼多多DeepSeek实力如何?几轮实测后我有了答案 训练一个AI大模型需要多少钱? OpenAI CEO山姆·奥特曼曾表示,GPT-4的训练成本大约1亿美元(约合人民币7.3亿元),未来训练大模型的成本... ...
爆火的DeepSeek-V3强在哪?
但是,这样还不够,DeepSeek-V3还得确保每个专家都能得到合理的工作量,并且训练模型去预测接下来的几个步骤,不只是下一步;这就是无辅助损失的负载平衡策略和多令牌预测训练目标的用处。 ... ...
DeepSeek被当成“老中医”?紧急提醒……
DeepSeek化身“老中医”开药方 还有人说 “AI要替代医生 砸医生的饭碗了” 据封面新闻报道,记者在DeepSeek上进行了问诊,提出“鼻塞、不通气,但不咳嗽、不流鼻涕”的症状,要求开具中医处... ...
DeepSeek“低调”参与2025全球开发者先锋大会
作为面向全球开发者的“社区的社区”,2025 全球开发者先锋大会是科研及产业领域开发者无法抗拒的盛会。据主办方确认,火遍地球的 DeepSeek 此次也以“闭门会议”方式低调参会。 工业和信息化部总工程师谢少锋表示,目前,我国已经成为全球开源参与者数量排名第二,增长速... ...
财经读图|2025资本圈被DeepSeek彻底点燃
财经读图|2025资本圈被DeepSeek彻底点燃 ...
刷屏!“AI界拼多多”再出手,Deepseek发布新模型,训练成本降低10倍
近日,一家来自中国杭州的公司Deepseek在全球AI界刷屏! 12月26日,Deepseek发布了全新系列模型DeepSeek-v3,一夜之间霸榜开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及 Claude-3.5-Sonnet不分伯仲。 更让海外AI界震惊的是,该模型的训练成本仅600万美元,成本降低10... ...
揭秘DeepSeek:一个更极致的中国技术理想主义故事
弥漫的硝烟其实掩盖了一个事实:与很多大厂烧钱补贴不同,DeepSeek是有利润的。 这背后,是DeepSeek对模型架构进行了全方位创新。它提出的一种崭新的MLA(一种新的多头潜在注意力机制)架构,把显存占用降到了过去最常用的MHA架构的5%-13%,同时,它独创的DeepSeekMoESparse结... ...
DeepSeek,突发!
据媒体报道,DeepSeek在推特上称,接下来一周,会陆续开源5个代码库,每日都有新内容解锁,进一步分享新的进展。DeepSeek介绍,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。... ...