
总结一旦更新了DeepSeek,外国网民会批评Openai。几天前,没有热身或新闻发布会,DeepSeek以低调的方式上传了DeepSeek R1(0528)的更新。最关注的海外是,DeepSeek更新将幻觉率降低了几乎45%-50%,并将R1的性能推向了OpenAI O3和Google Gemini 2.5 Pro的水平。同时,一些海外开发人员和人工智能研究人员已经开始运行基准,并热情地讨论了其在社交媒体平台上的新功能,尤其是与Giant Tech的旗舰模型的差距。从最近几天的海外用户的反应来看,即使DeepSeek的更新并没有与今年年初发布时相同的感觉,但它仍然使许多MGA外国网民表示“ Goen Mei ying”,而且它也使更多的人开始问:不仅可以迅速提出成本,而是,从Open AI资源中,AI最强大的模型都可以超越世界上最强大的模型。多种功能? 01-Deepeek再次在所有类型的AI社区中“铅”,Reddit平台具有许多与AI/LLM相关的子社区。其中,在R/Localllama和R/Sillytavernai等社区中,有许多热门帖子可以更新DeepSeek。 “新的 - 熟练的DeepSeek R1的播放几乎与O3 OpenAI模型相当于Livecodebench!在Open Resource中取得了巨大的成功!”用户帖子的标题要求它。 Reddit社区有关DeepSeek更新的帖子|图像来源:Reddit一些开发人员测试了最新的R1功能。首先,他们不要在数学和编程问题上赞美R1表现,尤其是在处理复杂的积分或递归功能时。与以前的版本不同,R1-0528具有“更长期的思维能力”,一些测试人员被教导说它“表达主动性”和“不要迅速放弃”。 “只是尝试了...我有一个高度复杂的代码1200行并添加了新功能……看来代码质量在O3级别...我可以只是S“哇”。这被称为Reddit社区R/Localllama中的常驻用户。Reddit社区对DeepSeek更新的反应|图像来源:根据官方的DeepSeek陈述:“更新的R1模型在许多基准评估中都在所有基准评估中获得了所有国内模型的最高成果,例如数学,编程和一般logic和一般型号,例如Interlector 5 -pro。 "In terms of capabilities, the new version significantly improves the depth of model thinking and the ability of reasoning, supports tool calls, that" illusion "problem, and also -optimize in terms of creative writing. Complete structure and content, as it is closer to human preferences. DeepSeek Deepseek that DeepSeek-R1-0528 capabilities in Hara Code generationP, playing role and other fields has been updated and improved. One of the main advantages of R1是AI游戏的长期记忆和耐用性社区(通常在AI模型测试的边缘,但与对话有关)坚持认为,职责记住过去的细微细节,并对自主行为做出了反应。一位用户告诉r/sillytavernai:“当一个角色与我争论我的观点时,他实际上提到了三个细节。” “我还没看过。”用户还指出:“ AI通常不主动;我训练了一些AI来主导对话,但这是我第一次看到AI从游戏场景中出来。” Reddit社区中的另一个用户已经发布了更新的DeepSeek R1 0528在他的所有试验中都获得了全部分数。他说:“过去的几周令人眼花and乱 - OpenAI 4.1,Gemini 2.5,Claude 4-它们都表现良好,但他们都没有在每个审判中获得完整的痕迹。DeepSeek R1 05 28是第一个这样做的模型。” Reddit社区帖子有关DeepSeek更新|图像来源:reddit“这些测试是这不是许多人在YouTube上进行的不现实试验。 For example, the number of RSs in strawberries, or writing a snake game, etc. The user said." I feel like Anton in the movie "Rat King" (if you've seen this movie). I admired (pun here), but I was a bit numb and it was hard to find the right word to describe it. Incredible that a free open resource model from a lab that didn't know last year really made more mabetter than cutting the business model. "X is as alive as the Reddit community.除了通过基准图表外,有些人还参与了AI的内容。 DeepSeek的程序员已重新输入。 Masyadong Malakas”,“ Ang Pagpapabuti nito ay ay napaka Makabuluhan kumpara sa nakaraang bersyon”,“功夫iTo ay r1 ... deepseek r2 ay magiging napaka magiging napaka magiging napaka magiging napaka magiging napaka magiging napaka mabaliw。 Mga Tinig ng Gumagamit在开发人员,Matapos Mailabas ng DeepSeek ang Pag -update,Artipisyal na Pagsusuri,isang artipIsyal na ahensya ng pagtatasa ng ng ng katalinuhan,sinabi na an an an an an an an an an an an ang r1 ng deepseek“超过了“独立的“智能指数”中的xai,meta和onthopic。图像来源:根据特定模型的人工审查,该机构在一份报告中指出:“ DeepSeek R1比Xai的Grok 3 Mini(High)更聪明,NVIDIA的Llama Nemotron Ultra,Meta的Llama 4 Maverick,Alibaba的Qwen 3 253,可以与Google 2.5 Pro进行比较。” Deepseek's largest intellectual development appeared in Aime 2024 (Mathematics Contest, +21 points), LiveCodebench (Code Generation, +15 points), GPQA Diamond (scientific reasoning, +10 points) and the humanity s final test (Inference and Knowledge, +6 points) The "R1 is comparable to the Gemini 2.5 Pro in manual analysis of index, caught behind the O4-mini (high) and O3“。主要制造商人工智能模型的智能指数的变化|图像来源:与Openai的比较该机构说:“ DeepSeek仅证明他们可以保持扩大OpenAI RL计算能力的速度。”当然,不可能赞美一切。就编程功能而言,还有X用户很挑剔:“如果您实际编写代码和Claude 4,您会知道基准描述是不准确的。X中有关更新DeepSeek的帖子有关更新DeepSeek |图像来源:X中的另一个用户在X上说:“ Deviceek说”,“ Deviceek May May May我也有Gegini 2.5 Pro,因为它具有很大的背景。 “对于这个问题,DeepSeek在其官方文章中提到,如果用户需要更长的上下文长度,他们可以将带有Hadoes的R1-0528模型的开放资源版本通过其他第三方平台为128K的环境,但是,有些海外用户认为,如果在所有测试中赢得了所有测试,那么R1是否会赢得相同的成本,而将相同的效果均与强大的绩效相同,并且''''''''''''''''The DeepSeek于今年早些时候发布,这引起了美国股票市场的海啸,Reddit用户开玩笑说:“请首先出售我的AMD和NVIDIA股票。请提前3天告诉我,谢谢您。”一些网民开始赞扬“低调” Deptseek在另一种方式中的姿势。一个红色的网民发表了一长串的评论,上面写着:“在0528中,他自己的话:低调的depsek效率包含了一首诗。感觉很好-Beenfit;希望您喜欢它。”“对竞争对手的安静打击是最新的。根据国外的互联网反应来判断,在DeepSeek的许多好处中,最有趣的测试的重要来源和许多开发人员的感受是“开放资源”,或者更确切地说是“开放权重”。 AI圈的视图是,不发布培训代码和培训数据的模型肯定应该“打开权重”,但是有些人通常会选择称其为“开放资源”。另外,没有AI公司可以发布培训数据,因为它们不想受到治疗。对于DeepSeek更新,由Y Combinator建立的在线技术社区Hacker News出现了帖子,主要分享基准结果,共享经验以及验证R1性能改进,尤其是在编码和数学方面,是正确的。但是与此同时,上面还有很多讨论仍然围绕着人工智能中的“开放资源”展开。许多人赞扬Deptseek在公共公共模式的重量中,但他们也继续指出由于没有释放培训数据等,因此没有Sinumoutside能够预防或完全验证R1。此外,尽管它是开放资源并且免费的,但具有6710亿参数的R1本质上是一个巨大的模型,对于普通用户而言,它太大了。即便如此,今天,R1和Chatgpt之间的比较已成为标准。 OpenAI可防止对普通用户的顶级型号的完全访问,或者某些定价感觉有用的用户,而Deviceek提供了更便宜并提供下载模型权重。 “ DeepSeek是真正的开放AI”在国外用户帖子的标题说。 DeepSeek更新的Reddit社区帖子|图像来源:Reddit当然,并非所有Reddit用户都完全接受。一篇题为“ DeepSeek有多糟糕?”的帖子。已经引起了有关DeepSeek内容内置审查的讨论,并且该模型对“避免”某些问题不满意。这种类型的论点已成为常见的“备忘录”,一些用户会否认该模型是重型的,如果开发人员NK是偏见,他们可以自己修复。此外,目前,世界上所有主要模型都具有内容过滤机制,但是特定选择是不同的,西方政治准确性也是如此。在reddit中,还有一个热门帖子,标题为“开源人工智能得到!”,对海报说:“ DeepSeek似乎是唯一在模型切割领域真正竞争的公司。其他公司总是有一个保留的保留,因为Qwen不愿意开放他们最大的模型(QWEN-MAX)(Qwen-Max)(Qwen-Max)。我不怪他们,我不知道,这是不知道的。他们可能是对的,可能是对的。 Ang Post Ng Reddit社区Tungkol SA MGA PAG-启动NG DeepSeek | Pinagmulan ng iMahe:reddit sa seksyon ng komento sa ibaba ng na Ito,mayroong isang matalim na tugon na na na na nagsasabing,“ ginagawa nila nila nila ito sapagkat ang sapagkat ang ag abot -kayang -kayang -kayangKatalinuhan Ay Magmaneho ng Isang Rebolusyon,位于Ang Deepseek Ay Maaalala ng Publiko Bilang ang ang tunay na payunir na na payunir ng Artipisyal na katalinuhan,sa halip na halip na google,封闭或不正确的人类人的人性化安全性。 “ Reddit社区对DeepSeek更新的反应|图像来源:DeepSeek更新的Reddit,一个永久的R/Localllama社区提到,“这使我想起了Onlotai的承诺发布“ O3-Mini级别模型”,但未能实现它。现在,新的R1超过了许多o3(高)的O3米尼(高)。 “安全”只是一个道德原因。ely, netizens who expressed calm in the DeepSeek update also said: "Even though it doesn't surprise me. Whenever I haveTest. But no matter what, DeepSeek still has the advantage of open weight, which is undoubtedly an advantage. "The Reddit community post about the DeepSeek's update | Image Source: Reddit in recent months, compared to DeepSeek, the pressure on previous AI Giants to maintain their technological and reputation and reputation.开始记住他们的命运,例如“ DeepSeek将继续迫使AI公司竞争降价”。通过发布免费模型,您可以避免竞争对手在市场上占主导地位。 “ Reddit社区帖子有关DeepSeek更新|图像来源:Reddit最喜欢的响应已被选为PassionateAll模型制造商。分享相同观点的用户说,无论它是否是利他主义,我都很高兴从他们的短期技术中受益。EN观看AI全球竞争,该竞争面对模型的重复建模。 Reddit社区有关DeepSeek更新的帖子|图像来源:Reddit此外,值得注意的是,该行业仍在发布DeepSeek R2。在DeepSeek更新中,许多网民询问R2开发是否被推迟,甚至怀疑“ DeepSeek-R1-0528”实际上是“ R2”,但以R1系列命名。 “我们想要R2。”在DeepSeek更新的官方X帖子中,Gaoxiong回答。