刘涛 ai换脸 量化巨头放大招!大模子性价比之王来了
发布日期:2024-12-28 09:04 点击次数:70
12月26日晚刘涛 ai换脸,杭州深度求索东说念主工智能基础技艺商讨有限公司(简称“深度求索”)晓谕,全新系列模子 DeepSeek-V3 首个版块上线并同步开源,API工作已同步更新,接口确立无需窜改。
公开信息浮现,深度求索建立于2023年7月17日,由著明量化资管巨头幻方量化创立,幻方量化首创东说念主梁文峰在量化投资和高性能谋划界限具有深厚的配景和丰富的造就。
深度求索默示,DeepSeek-V3在常识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平比拟前代 DeepSeek-V2.5显赫擢升,接近面前进展最佳的模子Anthropic公司于10月发布的Claude-3.5-Sonnet-1022。
在好意思国数学竞赛(AIME 2024, MATH)和世界高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅超过了其他悉数开源闭源模子。另外,在生成速率上,DeepSeek-V3的生成吐字速率从20TPS(Transactions Per Second每秒完成的事务数目)大幅提高至60TPS,比拟V2.5模子已毕了3倍的擢升,大致带来愈加运动的使用体验。
△ DeepSeek-V3和其他模子的比较。图片开头:Deep Seek微信公众号
据倾盆新闻报说念刘涛 ai换脸,Meta AI商讨科学家田渊栋对DeepSeek-V3各个方进取的进展都默示歌咏,称“这是一项了不得的责任”。
成人动漫 据官方技艺论文败露,DeepSeek-V3模子的总考研本钱为557.6万好意思元,而GPT-4o等模子的考研本钱约为1亿好意思元。深度求索默示,“这是一个全新的初始。”
据财联社报说念,OpenAI的聚会首创东说念主之一Andrej Karpathy也发文赞扬说念:行为参考,要达到这种级别的身手,频繁需要约1.6万个GPU的谋划集群。不仅如斯,面前业界正在部署的集群限制以至也曾达到了10万个GPU。比如,Llama 3 405B铺张了3080万GPU小时,而看起来更浩大的DeepSeek-V3却只用了280万GPU小时。
性能更强、速率更快的DeepSeek-V3上线,幻方量化给出的订价是若干呢?
深度求索默示,“咱们的模子 API 工作订价也将疏通为每百万输入 tokens 0.5 元(缓存射中)/ 2 元(缓存未射中),每百万输出 tokens 8 元。”据财联社报说念,加总本钱是10元东说念主民币。
上一代模子Deepseek-V2.5的价钱是,输入:0.14好意思元/百万Token,输出为:0.28好意思元/百万Token,加总本钱是0.14+0.28=0.42好意思元,大致3元东说念主民币。
这里的Token是大模子在解决数据时的最小单位,一般而言,100万Token终点于70万-100万英文单词,或接近100万汉文汉字。列夫·托尔斯泰的名著《干戈与和平》的英文版大致是大致有1200-1500页、58万英文单词,把它翻译为汉文,大致有100-130万字,让DeepSeek-V3读都备文只需要2元傍边。
尽管提价,但与同类型模子比拟,DeepSeek-V3依旧极具性价比。比如OpenAI的GPT 4o订价终点高,输入:5好意思元/百万Token,输出:15好意思元/百万Token,加总本钱是20好意思元,约合东说念主民币140元。
本文概述DeepSeek微信公众号、倾盆新闻、财联社
(声明:著述本体仅供参考,不组成投资提倡。投资者据此操作刘涛 ai换脸,风险自担。)