DeepSeek的胡编乱造,正在淹没中文互联网

虽然DeepSeek-R1确实好用,但它在爆火之后,成了人手一个的AI工具,也对中文互联网的信息环境造成了严重的污染情况,这是一个固然难以避免但也理应得到重视的问题。

最近一个星期以来,就我看到的刷屏文章,至少有三例都是DeepSeek-R1生成出来的、充满了事实错误的内容,却因其以假乱真的迷惑性,让很多朋友信以为真,情绪激动的分享传播。

第一例,是知乎的这条高赞回答:

即使在我指出来之后,依然有人不可置信的表示,看不出来其中的「AI味」,所谓的「AI味」,指的是DeepSeek-R1创作文本时特有的「极繁主义」,比如生造概念、堆叠名词、滥用修辞等等。

而这条知乎回答,或因提示词喂得好,或因后期润色得力,在很大程度上消除了它的「AI味」,但从表达结构上,经常和AI打交道的用户都能一眼看出痕迹,纯正的DeepSeek-R1风格,当然普通人确实难以识别。

不过我也不是直接得到这个结论的,在看到朋友分享这条回答时,我原本也和他一样,是带着对于国产动画电影崛起的兴奋全盘接受了如此言之有物的论证,直到一个致命的纰漏让我察觉到了不对劲。

作者说哪吒电影里的敖丙变身镜头在法国昂西动画节上轰动业界,问题是,法国是有一个昂西动画节,哪吒的电影也是送去参展过,但那是追光动画出品的「哪吒重生」,而不是饺子导演的「哪吒」……

这部送展的「哪吒重生」宣传片实际上是一部品牌概念片,内容是在一个现代都市里的赛车动作演示,哪吒根本就没出现,更不存在敖丙的变身……

继续查证也能发现,关于「哪吒」的制片方给员工分成都房子、攻克水下流体特效之类的描述,全都是DeepSeek-R1为了完成这篇命题作文自己脑补的。

为什么我能确信是DeepSeek-R1的手笔呢?为什么不能是ChatGPT、Claude、文心一言?因为DeepSeek-R1是当前唯一能用的免费推理模型,且对中文的支持度足够高,这本来是DeepSeek-R1的优势,只是没被用在正道上。

此时就需要补充一个推理模型的特点了,那就是推理模型的训练过程特别注重奖惩机制,通过思维链的暴露我们也能看出它通常都会想得缜密、生怕自己没有摸清用户意图,以致于经常到了「谄媚」的程度。

这种训练模式的好处在于,可以让推理模型拥有举一反三的能力,能够更加灵活和完善的去完成任务,但是相对的,为了完成任务,推理模型也会在「不自知」的情况下,同时表现出欺骗性,当用户要求它写一篇作文时,哪怕缺少论据,它也会为了不辜负用户的指令,去自行编造一些材料出来,以便于自圆其说。

这就是大模型行业至今仍在致力于解决的「幻觉」现象。

上图就是一个经典用例,用户为DeepSeek-R1设立了阿里估值逻辑改变的靶心,于是DeepSeek-R1就逼迫自己去对着靶心射箭——它不会也不能反驳用户,或是质疑阿里的估值逻辑到底变没变——于是就「情不得已」的编造出了可以用来证明用户观点的数据。

根据Vectara发布的大模型幻觉排行榜,DeepSeek-R1的幻觉率达到了14.3%,远高于Deepseek-V3的3.9%,也在所有主流模型里属于较差的一档。

按理来说,R1是比V3更新、更强大的模型版本,之所以反而表现得更加拉垮,还是因为推理模型比普通模型先天就更加具有「创造力」,其实在AI研究领域,幻觉本身并不是单纯的缺点,甚至可以说,幻觉就是科学家们希望在AI身上看到的所谓意识,只是我们还没有把AI调教得当,让它在该天马行空的时候自由创作,在该遵守事实的时候有理有据。

所以我的这篇文章也不是在说DeepSeek-R1有问题,而是滥用它来批量化生成真假难辨的信息、并海量投放到公网的这种行为,问题很大。

越是公共讨论聚集的地方,比如时政、历史、文化、娱乐等领域,越是重灾区,这和自媒体的商业模式有关,有流量就有收入,流量取决于内容的吸引力,同时内容又受到生产成本的限制,而当DeepSeek-R1这种降维打击的武器被交到了每一个人手里,失控就是不可避免的了。

第二个例子里的作者大概是察觉到流量太高也容易出事,已经会在新的文章里——依然都还是DeepSeek-R1写的——加上一条下面这样的声明,不过只能说聊胜于无,很少有人会注意到并理解这句话的意思——上面的内容有一半是我编的,但我不告诉你们是哪一半。

事实上作者也确实不知道DeepSeek-R1交稿的内容里哪些是真哪些是假,他可能会提供一些参考资料,以及开放全网搜索的权限,但就像我说的,推理模型的运作模式,决定了它不是简单的洗稿,而是会自行完善故事的骨架和细节,最后的结果就是真假参杂,迷惑性反而更大了。

第三个例子,是历史博主知北遊的豆瓣记录,简单来说,是有人拿虚构的历史材料,布局七天来钓他上钩,如果不是他本身具有很强的反诈意识,加上三次元有人脉关系进行证伪,他一定会继续沉迷在这个局里,这个局的破绽在于AI搞错了两个历史人物的死亡顺序,打破了他在发现新的史料上如获珍宝的兴奋感。

一直以来,文史圈都是AI污染的重灾区,因为有大量的文献材料还没有数字化,可用的网络资源有限,考据成本很高,但凡较真起来,都会陷入「造谣一张嘴、辟谣跑断腿」的困境。

就,真的很让人焦心,用AI解决自己的问题是一码事,将AI杜撰的信息混到公网里又是另一码事了,当在这些言之凿凿的内容成为互联网信息库的一部分之后,甚至又会被AI重新咀嚼回去训练,事实数据和生成数据之间的界限将会更加模糊,这绝对不是一件好事。

有人可能会问,在没有AI的时候,人类也会造谣,也会发到网上到处都是,怎么没见到你这么痛心疾首?

其一,「抛开剂量谈毒性都是耍流氓」,AI的工业化生产能力,和个体户的伏案写作流程,在效率上是天差地别的,实际上在我写这篇文章以前,搜索引擎、线上文库、各类网站上的AI填充情况就已经非常不堪了,在有了推理模型——精通于一本正经的胡说八道——之后,整个污染趋势会向深处蔓延,从相对次要的资料层触及创作上游的信源层,覆水难收;

其二,人类造谣起来是有局限性的,比如他不可能出现在一个自己没理由出现的场合,真要这么编造起来很容易露馅,但AI则会脸不红心不跳的直接生造,比如栩栩如生的细节,或是身临其境的描写,在说谎这件事情上,AI的主观恶意或许不及人类,但它的发挥能力,却是独一档的;

其三,AI内容的生产者一般都是营销号,而为内容背书的,则是传播者的信誉,比如大V博主上钩后的转发分享,通过这种扩散机制,实现从寄生到合理化的存在目标,才是最可怕的,人会爱惜羽毛,会知道信誉下滑的后果,但营销号不在乎,只要避开敏感话题,有太多的流量可以消费,尤其是在掌握了「创造」独家信息这个技术之后;

其四,AI的便利性已经把虚假信息的泛滥推到了生活的各个方向,有人拿着它推荐的菜单去点菜结果发现店里没这个菜,有人拿着旅游攻略发现当地根本没这个景点,经我实测它还会捏造不属于「山海经」的古典异兽。

我想说的是,AIGC是技术发展的未来,DeepSeek也是国产模型的翘楚,工具没有错,错的是滥用、恶用工具的行为,AI当然可以创造内容,但前提一定要是注明它由AI生成,不能鱼目混珠,放任它以一种不可辨识的方式成为互联网的原生信息,大模型厂商和内容平台也有义务把类似数字水印那种兜底方案同步推进起来,每迟一天,治理成本都会几何级的变得更高。

*:not([class*=”icon”]):not([class*=”fa”]):not([class*=”logo”]):not([class*=”mi”]):not([class*=”code”]):not(i){font-family:PingFang SC,Arial,”Material Icons Extended”,stonefont,iknow-qb_share_icons,review-iconfont,mui-act-font,fontAwesome,tm-detail-font,office365icons,MWF-MDL2,global-iconfont,”Bowtie” !important;}[class*=”code”]{font-family: Consolas !important}

文章来源于网络。发布者:火星财经,转载请注明出处:https://www.sengcheng.com/article/36665.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
火星财经的头像火星财经
上一篇 2025年3月6日 下午1:22
下一篇 2025年3月6日 下午1:32

相关推荐

  • 《原神》鸿蒙版正式启动预约

    今日,《原神》鸿蒙版正式启动预约,玩家现可通过HarmonyOS5华为游戏中心抢先预约。《原神》鸿蒙版正式上架后,包体将在WiFi环境下推送至已预约玩家,开启快人一步的游戏体验。早在6月27日,米游社《原神》板块官方面向玩家发布定向测试招募信息,如今正式上线预约,或将意味着正式上线日期临近。 目前已有500+家游戏厂商加入鸿蒙生态合作,6500+款鸿蒙游戏上…

    2025年8月21日
    9700
  • 星级酒店摆摊,抢小摊贩的生意?

    最近,“星级酒店摆摊”的话题刷屏了社交网络。截至7月7日,小红书上关于“酒店摆摊”“五星级酒店摆摊”等相关笔记数已超过百万。而在抖音上,关联“酒店摆摊”的相关视频播放量也突破3千万。 评论区下,不少网友都在评论,直观感知到,身边摆摊的星级酒店,似乎正在变多。 01 全国多地星级酒店集体“摆摊” 星级酒店摆摊,当前正在热搜话题上的,是郑州的永和铂爵国际酒店。 …

    2025年7月9日
    12500
  • 霸王茶姬合资出海:王牌还是险棋?

    立志打造“东方星巴克”的霸王茶姬,在出海战略上似乎也在复刻星巴克当年的合资路径。 近期,泰国总统食品有限公司通过旗下饮料子公司,以1.42亿泰铢(约合人民币3119万元)注资霸王茶姬泰国,获得51%的控股权。这距离霸王茶姬与马来西亚Magma Chain成立合资公司Chagee Magma(持股60%),仅仅过去两个月。如此密集的合资动作,反映出霸王茶姬以合…

    2025年7月15日
    9500
  • 土味变洋气,一个县扎堆300家:首批开“村咖”的年轻人,已经亏了上百万

    城里的咖啡用来续命,村里的咖啡用来放空。 不知从何时起,在朋友圈晒星巴克的少了,越来越多人开始打卡一众新去处——“村咖”。所谓村咖,顾名思义,就是开在乡村的咖啡馆,或隐于茶园梯田,或立于古村老宅,既带着泥土的芬芳,又有咖啡的韵味,置身村咖之中,品味的不仅是咖啡,更是新鲜空气、山间野趣,是向往的美好生活。 不同于钢筋水泥的单调,乡村通过咖啡馆这一媒介,将山水林…

    2025年7月21日
    12900
  • Manus的蝴蝶效应,波及到联想AIPC的“灵魂”

    Manus的余震还在继续。 其评价自推出来就陷入两极分化:支持者不吝溢美之词,盛赞是“新DeepSeek时刻”、“炸裂”、“革了命”等。批评者反感饥饿营销、套壳路数,不值得那么多叫好。 撇开神化或者踩踏的情绪化反应,Manus确实称得上第一款完整的AI Agent产品。OpenAI、Anthropic和智谱等都抢先发布过Agent相关功能,但大多只是工具属性…

    2025年3月13日
    17600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信