黑龙江泡沫板专用胶厂家 DeepSeek 要用蜜雪冰城的法,做版 Claude Code

DeepSeek 之于大模型黑龙江泡沫板专用胶厂家,就像之于奶茶。你不纠结价比,因为它的本事你挑不出毛病,你的钱包它也从不为难。
近,DeepSeek 官宣布,DeepSeek-V4-Pro 模型 API 将降价。同时,DeepSeek 表示,API 已完成输出提速与服务扩容,速度快,服务稳定,默认支持 500 并发,企业用户可以在线申请并发。
发布模型,再给出折扣,接着降低缓存命中价格,后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写,而低价模型背后的下站,很可能是 Agent。
DeepSeek 降价,梁文锋把 Token 价格骨折了
让我们先来简单梳理下 DeepSeek 的降价时间线:
奥力斯 pvc管道管件胶批发 联系人:王经理 手机:15226765735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
4 月 24 日,DeepSeek V4 预览版正式发布。
4 月 25 日,DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。
4 月 26 日,DeepSeek 宣布缓存命中价格调整为发价的十分之。
4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。
5 月 22 日,DeepSeek 宣布 V4-Pro 降价为原价的四分之。
时间线的关键之处,在于临时折扣变成了降价。调整之后,DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元;
输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后,官 API 对开发者和企业的吸引力进步提。
https://api-docs.deepseek.com/zh-cn/quick\\_start/pricing
而价格下调直接的影响,是把任务成本到开发者决策的前端。
在代码场景里,次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。
长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些消耗场景,开始接近个人开发者和小团队的预范围。
过去,开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定、生态和使用习惯。DeepSeek 骨折的降价,也意味着在对的价比面前,开发者使用习惯也是可以轻易改变的。
顺着这条线,DeepSeek 贯的市场角也清楚了:用低价、开源和强理能力,持续建立大模型市场的价格优势。对国内模型厂商来说,V4-Pro 降价相当于重新划了条 API 定价线。
智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型,压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型,由于市场、客户结构和生态位置不同,短期冲击则相对有限。
但如果 DeepSeek 后续出类似 Claude Code 的编码工具黑龙江泡沫板专用胶厂家,再用低 token 成本支撑频调用,价格敏感的开发者群体会容易被吸引过来。
梁文锋此前对 DeepSeek 定价哲学的解释,也能放到今天理解。
早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价部分来自下代模型结构探索带来的成本下降,另部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。
比起把 API 当成毛利收费入口,DeepSeek 则像是在用过硬的 Infra 实力压低理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。
X 平台博主 @bookwormengr 近在篇题为《DeepSeek's 10 trillion USD grand strategy(DeepSeek 的十万亿美元棋局)》的长文中,给出了个激进的解释。
他认为,DeepSeek 的真正目标未是和智谱、月之暗面、MiniMax 竞争,也不是急着补齐多模态、语音、这些产品线,而是通过持续降低训练和理的资源需求,动套便宜、分散的 AI 硬件生态成形。
在他看来,DeepSeek 的长期价值不只在模型本身,而在于让多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与理体系。
这个判断未能兑现,但它解释了 DeepSeek 系列选择背后的向:
MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang,表面上看是模型架构和理工程优化,往处看,都是在降低对端 HBM、顶 GPU 和 CUDA 生态的依赖。
系列降价公告里,值得关注的不只是输出价格下降,还有缓存命中价格下降。
在大模型理过程中,KV Cache 是个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。
普通聊天里,缓存压力不定明显,但在进入代码、长文档和 Agent 任务后,保温护角专用胶成本结构会迅速变化。@bookwormengr 在长文里门了笔 KV Cache 账。
他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提,估 DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。
长上下文和 Agent 任务真正贵的地,不只是模型生成本身,还有缓存、显存、带宽和重复上下文搬运。
个 Code Agent 处理项目时,可能要反复读取同个代码库结构、同批文件、同段任务历史、同套系统提示词和同批测试日志。若每轮都按完整上下文重新计费,长任务很快会变贵。缓存命中价格下降后,重复上下文的成本会明显变低。
DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和理率上持续投入的表现有目共睹。降价是技术迭代后的然结果,也将搅动 AI 编程市场格局。
为什么须做版「Claude Code」?
先被牵动的,是 AI 编程工具的订阅模式。
市面主流 AI 编程工具均出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代,单次调用消耗低。
但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。
当底层 API 又同时大幅降价,Coding Plan 也须找到新的支撑点。这个支撑点,可能落在工程能力上——比如能不能好地读懂项目结构,能不能选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD,能不能在企业环境里管理权限和审计记录?
同样要重新定位的,还有 API 中转站。对个人开发者来说,便宜和好用仍然重要。但对企业来说,稳定、可审计、可控、可迁移重要。
沿着这个逻辑继续看,Coding Plan 和中转站的改变只是表层。低价之后值得追问的,是开发者入口究竟掌握在谁手里。
Google CEO Sundar Pichai 近接受了《Hard Fork》采访,他次公开承认,Google 在文本、多模态、语音、理和整体智能上都很有竞争力,但在 agentic coding 这类能力上,尤其是工具调用、指令跟随和长周期任务,目前还有差距。
他还提到,关键的是把模型放到真实世界里使用,让数据回流,继续迭代。Pichai 特别说到,coding 是个需要接触 data flows(数据流)的域。
终端工具能看到开发者如何提出任务,如何追问,什么时候接受建议,什么时候放弃,什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变和 Git 提交,判断次 Agent 执行是否完成任务。这类数据,对 coding model 和 Agent 产品都非常有价值。
从公开招聘动作看,DeepSeek 近期围绕 Agent 的动作也变得密集。
我们也可以看到岗位里出现了 Agent 度学习法研究员、Agent 数据策略工程师、产品经理、研发工程师等角。关键的是,DeepSeek 资研究员陈德里直接发出招聘信息,提到要从开始构建 Code Harness。
如其所说,Model + Harness = Agent,在 Agent 产品中,模型负责理解和生成,Harness 负责把模型能力带入真实工程环境,相当于模型外面那套「执行系统」。
DeepSeek 版 Claude Code 不能只给开发者个对话框,而要给开发者个能持续执行任务的工程系统。
崔添翼加入 DeepSeek 后受到关注,也和 Code Agent 的工程属有关。
公开信息显示,崔添翼本科毕业于浙江大学计机系,曾因信息学竞赛保送浙大,6 次获得 ACM 亚洲区域赛金,之后在 Jane Street 工作 9 年,并联创立 TSY Capital。
Code Agent 的难点不只是生成代码,还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定、自动化执行和风险控制,这些经验放到 Agent Harness 上,至少在工程范式上是相通的。
而 Agent 工具的产品能力,不只包括写代码,也包括权限、审计、数据隔离和安全策略。
这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业权限控制结起来,它在政企、金融、制造、能源等对数据敏感的行业里,会有强的替代价值。
DeepSeek 做版 Claude Code 的逻辑也正在于此:低价 tokens 把多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。
就像滚下坡的雪球,越滚越大,滚得越快。降价只是下山的把力,往后它会自己越滚越沉,谁也拦不住。
我们正在招募伙伴
简历投递邮箱hr@ifanr.com
✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)
相关词条:离心玻璃棉 塑料挤出机 钢绞线厂家 铝皮保温 pvc管道管件胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。