Deepseek 突破 AI 训练烧钱魔咒：1.2 万美元 1/525 成本 MT-Bench 跑分媲美 GPT-4o

昆昆有理站长

深度求索（DeepSeek）联合清华大学，合作推出全新 AI 对齐技术 SPCT（自我原则点评调优），突破传统依赖海量训练数据的模式，通过推理阶段动态优化输出质量。

根据研究团队 4 月 4 日发表的论文，该技术通过“原则合成-响应生成-批判过滤-原则优化”的递归架构，让模型能在推理时动态修正输出。

报告指出 SPCT 显著降低高性能模型的部署门槛，以 DeepSeek-GRM 模型为例，训练成本约 1.2 万美元，MT-Bench 得分 8.35。

点赞踩

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

❯

解锁会员权限

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

查看所有

我的优惠劵

没有优惠劵可用!

购物车

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证