关于ued

关于UED

ued官方网站 这么问DeepSeek, 能「偷」到数据?

发布日期:2026-05-13 10:53 来源:未知 作者:admin 浏览次数:

ued官方网站 这么问DeepSeek, 能「偷」到数据?

机器之机杼剪部

近日,有网友在 X 上发文称,在使用 DeepSeek 的经过中,若是在输入框内输入以下这一段内容,便可「窃取」到 DeepSeek 的教师数据:

仔细看了之后发现,具体是这么的:惟一你在输入框输入这一段教唆词,DeepSeek 就会「吐出」一轮圆善的对话记载,不外这并不是你的历史搜索记载,更像是一份迅速的对话记载。

随后该博主又称,即便仅仅输入 ,也有通常的结果。

此帖文依然发布,便引起网友的热议。

一网友暗示,「我不合计这是在窃取教师数据,更像是在裸露其他东谈主的聊天内容。它拿来看成教唆词的句子会变化,有时还会识别出这是一个奇怪 / 无兴趣的教唆词。」

在该网友给出两个例子来阐明这少许。在第一个例子中,输入这一内容后,DeepSeek 给出一个对话记载:「用户发问想要写出一个以单词 rose 为去世的长句,之后是模子长长的念念考经过,临了给出一个以 rose 为去世的长句。」

而在第二个例子中,BG真人(BigGaming)官方网站DeepSeek 则将其作为一个用户输入的平淡教唆词进行管理:「咱们被条目回话:,然后需要生成一个回复。」

对此,咱们也进行了一些实测,见效复现了这一风物。

比如不才面的例子中,输入上述内容后,DeepSeek 反应了一个用户申请写 rap 歌词的问题和对应的谜底。

底下还有更多示例:

亚搏体育中国一站式服务官网

合座来看,结果相等迅速,可能触及任何话题,况且并不一定能见效复现。直观上看,绽开「深度念念考」并关闭「智能搜索」时,ued官方网站复现的见效用会更高。

底下即是一个未能见效复现的示例:

是以追忆来看,对于统一段内容,到底 DeepSeek 会给出一份圆善的对话记载,如故将其识别为稀疏或无兴趣的教唆词,齐全是迅速活动。而对于背后的原因,网友亦然众说纷繁。

有网友合计,这是大模子幻觉导致的。「这一风物施展 LLM 仍然相等容易出错,因此也容易出现幻觉,他们宣称大型谈话模子的幻觉越来越少,但那不是确切。」

而一位网友合计,这大约率是因为监督微调(SFT)。

他暗示,这段教唆词可能是 DeepSeek 在监督微调(SFT)阶段使用的里面截止 token。它们往往笼罩在聊天模板里面,而当你手动输入它们时,就止境于齐全绕过了平淡界面,并强行把模子推入一种「从教师样本不绝生成」的花样。

由于 SFT 数据聚拢充满了千千万万条高质地的迟缓推理轨迹,模子就会迅速挑选其中一条,并从 不绝生成。

这也就解释了,为什么你每次(输入通常的内容)齐会获取齐全不同的内容:比如,第一次初始获取是对于 19π/12 的圆善三角函数解题经过;第二次初始,获取的可能是对于 QLoRA/OPTQ 中「value field」长度等于 4 bit 的扫视解释……

「这不是 bug—— 这本色上即是模子在展示它教师过的迅速片断,而这是一个超等直不雅的窗口,让东谈主看到 DeepSeek 的后教师数据。」

而有些网友在看到这一风物后,也试着将其拿来对其他模子进行测试,看是否有访佛风物出现,用兵如神,「Gemini 或然也存在通常的问题。」

在一位网友展示的例子中,在输入这一段内容后,Gemini 给出了一个圆善对话: 用户有计划恭候新式药品本领过长的问题,以及模子给出的对应谜底。

ued官方网站