艰深地解释一下，甚么是DeepSeek开源以及有甚么用

啊你啊赛哟

DeepSeek号称跟其余大模型最不同就是”开源“。
然而得多同窗有曲解，认为拿到了开源代码，本人也能做出大模型了。

我大抵看了一下它的开源代码，简略地说，其实你能做的，就是对DeepSeek大模型做各种微调，定制，蒸馏等等，然而你无奈按照这些开源，来做出一个DeepSeek相似的大模型。

艰深解释就是，DeepSeek比如一个百科全书，外面甚么都有，然而你用DeepSeek开源代码，只能做一些精髓提炼，小百科，某些方面的常识，好比专一于法律，修建，医疗等等的DeepSeek”精髓版“。要知道DeepSeek最大的版本也有300GB,这样大的数据，运转也需求64G显存的显卡，不太可能在便携式装备上快捷使用，所谓蒸馏，就是把百科全书变为某方面小专家，你能够在机器人上运转。

”微调“，就是经过你输出一些新的训练资料，调剂不同的权重，让DeepSeek在某些方面更聪明，生成一个在某些方面比原版DeepSeek更聪明的小DeepSeek。一个比方就是如果天龙八部这本书是DeepSeek，得多导演就开始微调，换换情节，加加人物，弄出一个新电影，实质上仍是天龙八部，然而在某些方面有翻新有看头，然而你让这些导演本人写本天龙八部，那是不成能的。

这里的开源代码，没有提供训练资料和办法，所以你无奈真实的从头开始训练一个大模型，由于这是顶级商业秘密，假如有人拿到了这类代码，能够本人训练一个”邪恶的“大模型，就会危害社会了。并且从头训练大模型，需求的资源，不是普通人能担负的，需求显卡，少量的人员来标注训练数据，以包管AI不走正路，这不是简略的一个代码能形容的了。选择训练数据的源，都是一个商业秘密，听说DeepSeek使用少量中文训练，由于中文更简炼，各种词的组合很便利，所以DeepSeek具有更高的智力和更少的训练时间。所以个别来讲，你想要训练一个大模型，你要解决这两方面问题：人力和算力。

所谓训练其实也不繁杂，就是练习填空，好比天空是___色的，你让AI填空，一开始它会胡说，白色，红色，绿色，你每次都给它低分，当它回答蓝色的时分，你给高分，它就记住了，原来讲蓝色，会得高分，那它当前就永久回答蓝色了。所以训练者的反馈很首要，这就是supervised training, 假如让AI本人自问自答，就是unsupervised training。

固然，即使你训练出邪恶的AI,也会被互联网封杀，你自己也会锒铛入狱，得多国度曾经立法阻止训练邪恶AI，请不要以身试法，好比有人已经训练出分解毒品的AI,被瞬间下架。

最初，使用DeepSeek守业的标的目的，我以为仍在便携装备和智能体上最无意义，你钻研出一些家用机器人，配置DeepSeek，能够具有更高的智力，不止于跟你聊天，根本上能够当人使唤了。

随风12 · 发表于 2025-2-22 08:19:08

当前siri，小爱同窗啥的都会变聪明太多了吧

wkr0115 · 发表于 2025-2-22 08:22:57

楼主还能看得懂开源代码，我不行

Gwwww · 发表于 2025-2-22 08:28:35

我要停办一人公司了，作为老板这些都应该懂

永恒幸福 · 发表于 2025-2-22 08:40:33

靠谱

雨夜浪漫 · 发表于 2025-2-22 08:46:59

Leo哥说的靠谱，

得多人认为“开源”了就万事大吉了，我早就说过啦：他人只开源了模型参数。

这个是真实的反编译，看DS实际跑起来、训练起来是否像其论文上说的那末“省”，这一点看很首要，不然中小公司仍然要投少量的资金。

https://github.com/huggingface/open-r1

期待楼主的参加！：）

j6pna5篆 · 发表于 2025-2-22 08:51:29

这个颇有意思，然而我疑心他们能出来的货色有无真实的竞争性

反向推导数据

不如本人从头训练

华人澳洲中文论坛

热图推荐

艰深地解释一下，甚么是DeepSeek开源以及有甚么用

全部回复6

随风12 沙发

wkr0115 板凳

Gwwww 地板

永恒幸福 5^#

雨夜浪漫 6^#

j6pna5篆 7^#

发表回复

浏览过的版块

啊你啊赛哟
关注TA

图文推荐

华人澳洲中文论坛

热图推荐

艰深地解释一下，甚么是DeepSeek开源以及有甚么用

全部回复6

随风12 沙发

wkr0115 板凳

Gwwww 地板

永恒幸福 5#

雨夜浪漫 6#

j6pna5篆 7#

发表回复

浏览过的版块

啊你啊赛哟 关注TA

图文推荐

永恒幸福 5^#

雨夜浪漫 6^#

j6pna5篆 7^#

啊你啊赛哟
关注TA