华人澳洲中文论坛

热图推荐

    艰深地解释一下,甚么是DeepSeek开源以及有甚么用

    [复制链接]

    2025-2-22 08:51:29 1236 6

    DeepSeek号称跟其余大模型最不同就是”开源“。
    然而得多同窗有曲解,认为拿到了开源代码,本人也能做出大模型了。

    我大抵看了一下它的开源代码,简略地说,其实你能做的,就是对DeepSeek大模型做各种微调,定制,蒸馏等等,然而你无奈按照这些开源,来做出一个DeepSeek相似的大模型。

    艰深解释就是,DeepSeek比如一个百科全书,外面甚么都有,然而你用DeepSeek开源代码,只能做一些精髓提炼,小百科,某些方面的常识,好比专一于法律,修建,医疗等等的DeepSeek”精髓版“。要知道DeepSeek最大的版本也有300GB,这样大的数据,运转也需求64G显存的显卡,不太可能在便携式装备上快捷使用,所谓蒸馏,就是把百科全书变为某方面小专家,你能够在机器人上运转。

    ”微调“,就是经过你输出一些新的训练资料,调剂不同的权重,让DeepSeek在某些方面更聪明,生成一个在某些方面比原版DeepSeek更聪明的小DeepSeek。 一个比方就是如果天龙八部这本书是DeepSeek,得多导演就开始微调,换换情节,加加人物,弄出一个新电影,实质上仍是天龙八部,然而在某些方面有翻新有看头,然而你让这些导演本人写本天龙八部,那是不成能的。

    这里的开源代码,没有提供训练资料和办法,所以你无奈真实的从头开始训练一个大模型,由于这是顶级商业秘密,假如有人拿到了这类代码,能够本人训练一个”邪恶的“大模型,就会危害社会了。并且从头训练大模型,需求的资源,不是普通人能担负的,需求显卡,少量的人员来标注训练数据,以包管AI不走正路,这不是简略的一个代码能形容的了。选择训练数据的源,都是一个商业秘密,听说DeepSeek使用少量中文训练,由于中文更简炼,各种词的组合很便利,所以DeepSeek具有更高的智力和更少的训练时间。所以个别来讲,你想要训练一个大模型,你要解决这两方面问题:人力和算力。

    所谓训练其实也不繁杂,就是练习填空,好比 天空是___色的,你让AI填空,一开始它会胡说,白色,红色,绿色,你每次都给它低分,当它回答蓝色的时分,你给高分,它就记住了,原来讲蓝色,会得高分,那它当前就永久回答蓝色了。所以训练者的反馈很首要,这就是supervised training, 假如让AI本人自问自答,就是unsupervised training。  

    固然,即使你训练出邪恶的AI,也会被互联网封杀,你自己也会锒铛入狱,得多国度曾经立法阻止训练邪恶AI,请不要以身试法,好比有人已经训练出分解毒品的AI,被瞬间下架。

    最初,使用DeepSeek守业的标的目的,我以为仍在便携装备和智能体上最无意义,你钻研出一些家用机器人,配置DeepSeek,能够具有更高的智力,不止于跟你聊天,根本上能够当人使唤了。

    全部回复6

    随风12 发表于 2025-2-22 08:19:08

    随风12 沙发

    2025-2-22 08:19:08

    当前siri,小爱同窗啥的都会变聪明太多了吧
    wkr0115 发表于 2025-2-22 08:22:57

    wkr0115 板凳

    2025-2-22 08:22:57

    楼主还能看得懂开源代码,我不行
    Gwwww 发表于 2025-2-22 08:28:35

    Gwwww 地板

    2025-2-22 08:28:35


    我要停办一人公司了,作为老板这些都应该懂
    永恒幸福 发表于 2025-2-22 08:40:33

    永恒幸福 5#

    2025-2-22 08:40:33

    靠谱
    雨夜浪漫 发表于 2025-2-22 08:46:59

    雨夜浪漫 6#

    2025-2-22 08:46:59

    Leo哥说的靠谱,


    得多人认为“开源”了就万事大吉了,我早就说过啦:他人只开源了模型参数。


    这个是真实的反编译,看DS实际跑起来、训练起来是否像其论文上说的那末“省”,这一点看很首要,不然中小公司仍然要投少量的资金。

    https://github.com/huggingface/open-r1


    期待楼主的参加!:)

    j6pna5篆 发表于 2025-2-22 08:51:29

    j6pna5篆 7#

    2025-2-22 08:51:29


    这个颇有意思,然而我疑心他们能出来的货色有无真实的竞争性

    反向推导数据

    不如本人从头训练

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题34

    帖子42

    积分187

    图文推荐