|
DeepSeek号称跟其余大模型最不同就是”开源“。
然而得多同窗有曲解,认为拿到了开源代码,本人也能做出大模型了。
我大抵看了一下它的开源代码,简略地说,其实你能做的,就是对DeepSeek大模型做各种微调,定制,蒸馏等等,然而你无奈按照这些开源,来做出一个DeepSeek相似的大模型。
艰深解释就是,DeepSeek比如一个百科全书,外面甚么都有,然而你用DeepSeek开源代码,只能做一些精髓提炼,小百科,某些方面的常识,好比专一于法律,修建,医疗等等的DeepSeek”精髓版“。要知道DeepSeek最大的版本也有300GB,这样大的数据,运转也需求64G显存的显卡,不太可能在便携式装备上快捷使用,所谓蒸馏,就是把百科全书变为某方面小专家,你能够在机器人上运转。
”微调“,就是经过你输出一些新的训练资料,调剂不同的权重,让DeepSeek在某些方面更聪明,生成一个在某些方面比原版DeepSeek更聪明的小DeepSeek。 一个比方就是如果天龙八部这本书是DeepSeek,得多导演就开始微调,换换情节,加加人物,弄出一个新电影,实质上仍是天龙八部,然而在某些方面有翻新有看头,然而你让这些导演本人写本天龙八部,那是不成能的。
这里的开源代码,没有提供训练资料和办法,所以你无奈真实的从头开始训练一个大模型,由于这是顶级商业秘密,假如有人拿到了这类代码,能够本人训练一个”邪恶的“大模型,就会危害社会了。并且从头训练大模型,需求的资源,不是普通人能担负的,需求显卡,少量的人员来标注训练数据,以包管AI不走正路,这不是简略的一个代码能形容的了。选择训练数据的源,都是一个商业秘密,听说DeepSeek使用少量中文训练,由于中文更简炼,各种词的组合很便利,所以DeepSeek具有更高的智力和更少的训练时间。所以个别来讲,你想要训练一个大模型,你要解决这两方面问题:人力和算力。
所谓训练其实也不繁杂,就是练习填空,好比 天空是___色的,你让AI填空,一开始它会胡说,白色,红色,绿色,你每次都给它低分,当它回答蓝色的时分,你给高分,它就记住了,原来讲蓝色,会得高分,那它当前就永久回答蓝色了。所以训练者的反馈很首要,这就是supervised training, 假如让AI本人自问自答,就是unsupervised training。
固然,即使你训练出邪恶的AI,也会被互联网封杀,你自己也会锒铛入狱,得多国度曾经立法阻止训练邪恶AI,请不要以身试法,好比有人已经训练出分解毒品的AI,被瞬间下架。
最初,使用DeepSeek守业的标的目的,我以为仍在便携装备和智能体上最无意义,你钻研出一些家用机器人,配置DeepSeek,能够具有更高的智力,不止于跟你聊天,根本上能够当人使唤了。
|
|