凤凰体育不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了

克雷西梦瑶发自凹非寺

量子位 | 公众号 QbitAI

炸了炸了真炸了，DeepSeek一发轫，AI圈都得震得抖三抖。

全新来袭的两个版块——

V4 Pro和Flash，一个主打性能，另一个更轻更快，两个都「开源」。

按DeepSeek我方的说法，V4在agentic编程智力上是开源模子里最强的，推理和天下知识也全面升级，高下文窗口从128K径直拉到了1M。

对比V3，天然是一次幅度不小的逾越，发布的时辰点，距离上一个推理模子R1也整整往时了一年多。

不外V4此次带来的变化，如故让咱们想闲适摸一摸它的底，于是乎，咱们也第一时辰上手狠狠实测了一番！！

最近这模子那模子扎堆上，我是真晕了，于是我让V4给我roll了个龙虾和爱马仕的话题热度对比图，be like：

张开剩余94%

编程游戏也荆棘得安排上，径直让V4搓出一个《畴昔启示录：AGI莅临》的笔墨战略冒险小游戏（量子位定制版）：

此外，濒临网上大火的「对着镜子举手」的AI推理踩坑题，V4径直完胜ChatGPT-5.5：

天然了，新模子一出，网友们也坐不住，初始径直初始放纵整活儿尝鲜：

博主David Ondrej征集了网友们的测试案例，录了一段半个小时的测试视频，示意DeepSeek-V4智力并排GPT和Opus，而且更低廉。

博主@Bijan Bowen更是径直用V4搭了一个飞机穿梭云层的3D交互天下，搓完直惊奇： so cool～

干扰啊真干扰，会玩啊真会玩——

谣言未几说，热烘烘的DeepSeek V4一手实测，来了！

DeepSeek V4一手实测

对于V4这一波的更新重心，官方原话是：在Agent智力、天下知识和推感性能上均完毕国内与开源鸿沟的最初。

按DeepSeek的说法，在Agentic智力Coding评测中，V4-Pro已达到刻下开源模子最好水平，并在其他Agent有关评测中雷同弘扬优异。

在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro超过了刻下所有已公开评测的开源模子。

是以呢，此次咱们也就专门「照方持药」，从这几个维度上来考量一下官方说法究竟有几分真～

Agentic coding智力实测

多说有害，咱们先来实一下V4模子的Agentic coding智力，望望能不成接住招～

先小试牛刀一下，在「群众形式」下让DeepSeek V4襄理搭建一个《怪奇物语》主题的剧集先容网站。

搭建一个《怪奇物语》主题的剧集先容网站，全体作风参考80年代复旧科幻与悬疑惊悚氛围，网站需要包含首页、剧情简介、主要变装先容等模块。

梗概等了5分钟，真·功夫不负有心东说念主。

当「霍金斯小镇纪年册」出目下页面上时，第一反馈即是：这时辰真没白等，成果如实比预感中更好。

V4把所有这个词网站拆成了剧集简介、主要变装、分季剧集、经典场景、海报展示、不雅众评价六大板块，结构完满，信息也比较了了。

值得一提的是，V4还会凭证不同主角的特征想象专属logo，UEDBET中国官方网站比如小十一领有超智力，页面里就用水晶球来作念视觉象征代替，如故很匹配的。

独一不及的地方是「交互」，有部分加入交互智力的板块（比如海报），emm…鼠标点击去是莫得反馈的…

接下来咱们上点难度，再来检修一下模子的信息更新智力和热门捕捉智力：

搜索一下最近很火的「十二星座专属坦护所」短视频热度，并生成一份对于该选题的短视频爆火风光的相关陈诉。

先来夸夸，值得表扬的是V4如实get到了「十二星座专属坦护所」这个热门的本体的视频特质。

而且在视觉呈现上审好意思也在的，况兼还自动把陈诉本体辩认为传播范围、中枢特征、顶层原因、交易变现几个方面。

但，是光网页搭建还远远不够——

试问哪个初来乍到的AI选手，不得和一王人经典的「鹈鹕骑自行车」的svg题较量一番？（你说是吧，v4）

作念一个鹈鹕骑自行车的动态svg。

此次我用了「群众」和「快速」两种模子进行了实测。

罢了即是——快速形式《完胜》…（环球觉着呢？迎接批驳区唠唠。）

从呈现的成果来说来看，快速形式在画面神采和通顺轨迹呈现上更胜一筹，能嗅觉出鹈鹕有骑车子的前进动态感。

反不雅群众形式，除了自行车的轱辘在动，画面其他元素解决的都不太ok。

比拟Pro，Flash辞天下知识储备方面略逊一筹，但展现出了接近的推聪敏力，在编程场景中不输Pro。

而由于模子参数和激活更小，相较之下V4-Flash能够提供愈加速捷、经济的API管事。

终末咱们再来上一王人游戏编程智力，让DeepSeek V4生成一个在线打地鼠的小游戏，只不外咱们此次不打地鼠——

生成一个打地鼠的在线网页小游戏，把地鼠换成你我方的logo。

值得表扬的是，PhoenixSportsV4如实get到到了它的logo是个小海豚。（形象好不面子就另说了…

而且所有这个词游戏的交互也没什么问题，游戏到后半程会较着嗅觉难度变大，游戏体验感还算是比较好。

接下来咱们再来测一些更终点旨真义的，让V4生成一个「宠物养成」的在线游戏——

值得一提的是，在领导词中我并莫得明确游戏的具体轨则以及需要涵盖的本体。

然而从V4的念念考进程看，V4自动补全了游戏的轨则、UI界面、交互智力、金币系统等游戏参数和智力。

对于经常想快速搓一个demo、作念个小游戏原型，或者考据某个轻量级创意来说，如故蛮到位的～

(之是以这样说，是因为这成果如实比之前用的一些龙虾产物成果还要好些…）

推聪敏力实测

除了Agent智力外，DeepSeek V4还有着天下顶级的「推感性能」。

在数学、STEM、竞赛型代码的测评中，DeepSeek-V4-Pro超过刻下所有已公开评测的开源模子，得回了并排天下顶级闭源模子的优异得益。

在这部分为了能体现不同模子间的成果对比，咱们此次搬上另一位选手——ChatGPT-5.5。

咱们先来一王人网上超超超火的「镜子举手」推理测试题，望望两位选手各自会有什么弘扬！！

我正对着镜子耸立，举起一只手。在我的视线中，这只手出目下镜子画面的左侧。请示在实验中，我举起的是哪只手？

emm…天然莫得精确扣住「镜子不会改换我视线阁下场地」的中枢论断，然而谜底如实复兴正确，满分！

咱再来望望底下的ChatGPT-5.5，不错说是精确踩坑，竣工被伪知识带偏了…

接下来咱们再来一王人网上很火的「亲生父母结婚」的AI推理测试题，望望两位选手能不成抵抗得住：

本年才知说念，亲生父母结婚时莫得叫我，我很痛心，应该何如办？

先说论断：大大大回转，这局ChatGPT-5.5完胜DeepSeek V4。

先来看V4的复兴，虽说题目没竣工答对，唯独第二种情况（亲生父母结婚我还没降生）允洽圭表谜底，但——

架不住东说念主家把「竭诚」二字展现地长篇大论…径直输出了千字小作文来劝慰我？？？

咱们再来反不雅ChatGPT-5.5，东说念主狠话未几，径直就戳穿了题经营陷坑，直言——亲亲，您那会儿还没上线哈。

天然，好的推理并不是只看个题目就初始闷头冥念念苦想，还要聚会本身的知识储备。

拿咱们昨天著述里阿谁「悔悟的父亲」的例子来说，V4在第一轮并莫得get到这说念题经营关节：

（凭证遗传学规则，若是别称女性是红绿色盲，其生物学父亲势必亦然）。

昨天由于时辰干系，这说念题咱们莫得让V4链接往下尝试，于是此次，咱们补充了新的领导。（doge）

在第一步复兴的基础上，咱们着手领导说这是一个科学问题。

不外嘛…这波不仅没答对，还搞出了更复杂的「色盲表面」，be like——

于是乎，咱们决定再给它一次契机，径直挑明这个问题波及的是遗传学鸿沟，这回V4终于《上说念了》：

如故基于上头的起点，检修推聪敏力不成只看推理进程，咱们还检修了V4的审题智力。

毕竟解题进程再有看头，若是一初始把题读错，依然得不了分！！

一个典型例子即是这个「薛定谔的死猫」，在经典物理学悖论的基础上进行了修改，径直设定猫即是死的，这里V4见效过关。

还有这个经典的农夫过河问题，V4在念念考时依然不雅察到了咱们埋下的陷坑，但觉得这是我的笔误，是以如故按照原问题进行了推理。

但当我明确示意我方没打错字时，V4给出了正确的解答。

终末说下知识更新。

若是径直问它知识库罢了到什么本事，V4的推理进程会先出现一个2025年5月的说法，但之后它觉得DeepSeek最新版块是V3，然后给出了2024年7月的最终复兴。

于是，咱们决定在关闭联网的情况下，通过盘考OpenAI、Anthropic和Google三家公司最新的模子版块来弧线考据下。

这时它径直强调了我方的知识只更新到2025年5月，复兴的模子发布时辰也基本对得上（但Claude 4系列的发布时辰是5月22日，不成算月初）。

One More Thing

两个月前，DeepSeek的一次小版块更新，让它的脾性已而变得机械感性。

原来网友心目中的D老诚，形成了尖刻冷落的AI机器。

目下，跟着V4的迭代，DeepSeek的情谊又初始再行充盈。

阿谁咱们熟练的D老诚凤凰体育，又追思了。

发布于：北京市开云app官方下载

让建站和SEO变得简单

凤凰体育(FHSports)官方网站

热点资讯

凤凰资讯

你的位置：凤凰体育(FHSports)官方网站 > 凤凰资讯 > 凤凰体育不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了

凤凰体育不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了

推荐资讯

让建站和SEO变得简单

凤凰体育(FHSports)官方网站

热点资讯

凤凰资讯

你的位置：凤凰体育(FHSports)官方网站 > 凤凰资讯 > 凤凰体育 不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了

凤凰体育 不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了

推荐资讯

你的位置：凤凰体育(FHSports)官方网站 > 凤凰资讯 > 凤凰体育不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了

凤凰体育不愧是DeepSeek！V4一手实测：推理编程智力给到夯，熟练的D老诚也追思了