DeepSeek V4 Lite悄悄更新,2000亿小参数机能迫近美国顶流
时间:2026-03-03 12:59:51
小编:china
阅读:
3月3日消息,虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。
DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大模型差很多。
然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区大佬HCPTangHY测试之后也大为震惊,称其有点神,在他的测试中已经是国模SOTA(注:SOTA简单认为是第一就行)。
不仅如此,如果继续训练下去,还有可能开源撬动闭源。

从他的测试来看,DeepSeek V4 Lite的0302升级之后分数比之前的0227版更高一层楼,已经逼近目前最顶流的大模型Sonnet 4.6了。
帖子中还有其他的游戏及前端测试,包括业内很有名的天气卡测试,DeepSeek V4 Lite 0302版不论审美还是功能都是在线的。
回顾这一年来的AI大模型来看,国产大模型在对话聊天方面已经跟闭源模型差别不大,但在多模态、编程、数学及智能体等方面是被甩开的,最近发布的GLM5、MiniMax 2.5、Qwen 3.5系列有所提升,但Anthropic、OpenAI及谷歌也发布了最新的模型,差距又拉开了。
在追赶顶流闭源模型上,国内的公司面临着多方面的不利因素,投入没有美国公司的多,而且算力不够,数据资料方面也不如谷歌、OpenAI,毕竟他们要么有此前多年的积累,要么有大量用户。
而且Anthrpoic之前为了搜集数据,竟然从盗版网站上下载了大量书籍,还被判赔偿15亿美元,由此可见他们在这方面的投入之大,不要脸程度之深。
作为全村的希望,DeepSeek在技术探索上已经树立了标杆,如果2000亿小参数的DeepSeek V4 Lite就有如此表现,那完整版的DeepSeek V4确实非常值得期待,发布之后免不了又要对美国AI造成巨大冲击了。
-
DeepSeek V4 Lite悄悄更新,2000亿小参数机能迫近美国顶流3月3日消息,虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较时间:2026-03-03 - 雨刮器刮不清洁?用铅笔就能搞定,但不是全能的不少司机都遇到过这样的烦心事:雨刮器用久了,刮玻璃时不是刮不干净,就是弹跳个不停,开车时视线受阻,特别闹心。这时候,很多人第一反应时间:2026-03-03
-
2026年GEO优化效劳商及工具选型指南:谁才是AI时期的引流之王?随着 AI 搜索(如 DeepSeek、Perplexity、豆包、通义千问)逐渐取代传统搜索引擎,GEO(Generative Engine Optimization,生成式引擎时间:2026-03-03 - 广东一企业开工放鞭炮 突现超近间隔龙吸水 外地气候局回应,系尘卷风3月3日消息,近日,多名网友发视频称在广东佛山顺德拍到了龙吸水”奇观。据其中一名视频拍摄者表示,事发当天公司第一天开工,放鞭炮结束后时间:2026-03-03
- 男人帮同伙抓羊时猝死 家眷索赔62万,法院如许判上海嘉定区最近发生了一起让人唏嘘的意外事件。一名男子唐某在帮朋友抓羊时,突然晕倒不治身亡,随后其家属向朋友葛某提出了高达62万余元的时间:2026-03-03
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:44
-
999元起,联想moto g100s开售,LCD护眼屏、支撑微信/抖音6开
阅读:29
-
从理光到大疆,年青人在追逐什么样的新相机
阅读:25
-
王自若称买超薄手机苹果必然是选,安卓都是缝合怪 不如苹果
阅读:25
-
电力除冰“小黄人”爆火 刷屏海内外社交平台
阅读:23








