华人澳洲中文论坛

热图推荐

    老罗落泪!北京大学团队搞出ChatExcel,说人话自动处置表格,收费且不限次使用

    [复制链接]

    2023-3-6 06:55:56 21 0

    原标题:老罗落泪!北京大学团队搞出ChatExcel,说人话自动处置表格,收费且不限次使用  
    明敏 Pine 发自 凹非寺   
    量子位 | 大众号 QbitAI   
    做Excel表,真就动动嘴就够了!  


    看,输出想要干的事:给先生成就排个名吧。  
    简略敲个回车,表格唰一下就列好了!  
    反省一遍也没错。  


    还能跨表格处置。  
    好比标志出两张不同表格中排名都在前十的学校。  


         哦豁,还有点超出ChatGPT?  
    毕竟给ChatGPT提出相似的要求,它只能帮我写出对应的代码,操作还得本人手动来。  


    这就是比来在知乎上惹起关注的AI工具 ChatExcel,一公布就登上了热榜。   
    它主打 用对话的方式完成Excel繁杂操作(Chat-to-Excel),辞别搞记函数、手动设置公式。   
    做好的成品,反对一键导出成规范Excel表格,连复制粘贴这道工序都省了。  
    并且 不必注册网页上就可以用不限使用次数,至关利好懒人和Excel小白。   
    乃至懂Excel技巧的人都感叹,本人会的这些是否要没用了。  
    这就是由北大深圳钻研生院/信息工程学院 3位硕博生,独立开发的名目。   
    目前已凋谢Demo供大家试玩。  
    看到这可能得多人都认为,“这又是一个遭到ChatGPT影响开发的名目嘛”。  
    还真不是。   
    GitHub名目上的第一个co妹妹it是在22年3月就提交了。  
    而面前真实的契机——  
    实际上是团队中一名小哥,想用技术帮女票解决点任务中的小懊恼啦。  


    这究竟咋回事?量子位分割了主创团队,来一一给大家揭秘~  
    ChatExcel表示如何?   
    咳咳,他人女票的事稍后再谈,我们先来看看ChatExcel的表示究竟咋样。  
    整体来讲,它想做的事就是跳过学习Excel、跳过写函数公式,间接把头脑里的需要变为表格里的内容。  
    团队在知乎首发产品时,用了一张图做解释:   


    老规矩,咱们来上手体验下。  
    进入主页面后,网站默许展现demo,点击UPLOAD就可以上传本人的表格。格局需求是规范Excel文件。  


    咱们找隔壁ChatGPT生成为了一份先生成就单,让ChatExcel进行计算操作。  
    次要测试了需求 拔出曾经函数的Excel操作。好比:   
    给总分在255以上的人标志为A,总分在240-255的人标志为A-,总分在210-240的人标志为B。
        给总分在255以上的人标志为A,总分在240-255的人标志为A-,总分在210-240的人标志为B。  
    打完内容,敲一下回车,它就开始处置了。  


    如果教师想知道谁是单科第一呢?输出:  
    找到表格中数学成就最高分的人。
        找到表格中数学成就最高分的人。  
    而后,它就生成为了一个新的界面,外面只要最高分童鞋。  


    假如还想对表格进行其余操作,点一下页面中的“UNDO”,它就可以前往到操作前的表格了。  


    咱们还让它对表格中的先生进行成就排名、并列知名次,ChatExcel都没有犯错。  


    除此以外,它还能 延续实现工作。   
    好比想在表格里减少一栏均匀分,能够先要求它减少一列:  


    再进一步输出需要,让它把计算好的后果填进去:  


    最初失掉的表格,点击“DOWNLOAD”,便可导出为普通的Excel表格。  


    体验上去,觉得ChatExcel次要有两大特征:  
    联贯性  精确性    好比以前也有帮人生成Excel公式的工具,excelformulabot能完成这一功用,但它是独立在表分外的,需求本人把单元格带入到给出的公式了。  
    假如是详细一些的形容,还会泛起给不出公式的状况。  


    而比较ChatGPT来讲,ChatExcel计算的 精确性更凸起。   
    好比计算同一个表格的均匀数,ChatGPT不是弄错究竟有多少集体,就是计算的时分带错数字,重复纠正都救不回来……  


    所以,ChatExcel是怎么做到的?面前原理究竟如何?  
    把“乙方思想”贯彻究竟   
    ChatExcel的原理一言以蔽之,就是间接把“大文言指令”转换成相似于VBA这样的顺序言语,而后再履行顺序。  
    底层基于Transformer架构,根本技术线路就是无监视训练+详细场景微调。  
    但NLP模型搞数学,始终都很容易犯错,弱小如ChatGPT都很难防止。  
    为此,团队在训练模型的过程当中,将重点放在了 符号逻辑上,期间还无意引入了一些逻辑符号的新常识。   
    由此咱们也看到,它在计算上犯错的几率其实不高。  


    除了 数学才能出众以外,ChatExcel最大的一个特征就是 继续交互。   
    这是由于ChatExcel每次的生成后果,都是基于用户提出的新需要+上一轮生成的表格。对模型的了解力及运算其实提出了更高的要求。  
    为何要完成这一功用?  
    团队引见说,如Dall·E、ChatBCG等AI工具,实现工作的形式都是单次不继续的。但在人们的实际使用过程当中,设法是一步步推动的。  
    举例来讲,用户和ChatExcel之间的瓜葛就比如甲乙单方,ChatExcel是乙方,用它处置表格的咱们就至关于甲方:  
    要求尽管提,改到满意为止。 (Doge)
        要求尽管提,改到满意为止。 (Doge)  


    一样,这个乙方思惟也体当初开发团队本人身上。  
    Demo公布后,得多人跑来围观、试用和提倡议。最常泛起的反馈是,ChatExcel有点了解不了提出的要求,需求从新措辞调剂。  


    关于这些状况,团队先说明态度: 倡议咱们全盘接纳。   
    同时也进一步解释了缘故,目前凋谢的demo还不是很完美。  
    这一方面是为了看看大家的反馈做进一步优化;另外一方面,也是但愿采集更多的语料,让模型之后能更聪明一些。  
    好比,有人就提出:  
    既然都曾经有“undo” (撤销)操作,何时能够把它处置表格的进程显示出来。
        既然都曾经有“undo” (撤销)操作,何时能够把它处置表格的进程显示出来。   
    还有人附议,表格数据太多就很难反省它 是不是处置正确:   
    进步ChatExcel履行工作的通明度,便利反省过错。
        进步ChatExcel履行工作的通明度,便利反省过错。  
    关于这些倡议,团队和咱们说,他们曾经在开始着手调剂了。  
    除此以外,还有这些功用也在开发的路上了:  
    表格上传格局更为兼容  展现ChatExcel处置表格的详细进程,更为通明化 ……    以及ChatExcel更为详细的原理引见,之后也会在官网以博客的方式公布。  
    乃至包罗代码,也会进行 开源。   
    遭到女票启示,把业余名目做成正式课题   
    说来ChatExcel的降生,也是至关因吹斯听了。  
    它受启示于团队成员的女票、导师立刻拍板认可、把业余名目做成正式课题……  
    这还要从 KidCY拉起小团队说起。   
    他们都来自北大深圳钻研生院信息工程学院 袁粒教师的课题组,曾经是准博了,还有一名成员正在读硕士。   
    作为机器学习的 根底实践钻研者,他们日常和论文打交道更多。   
    为啥忽然从实践钻研转向运用?  
    这还得从 Kid的女票说起。   


    他说本人的女敌人是一名中学信息教师,日常任务中常常需求帮年岁大的教师处置Excel表格问题。  
    为了帮女敌人多分担一点任务(bushi),固然也看到的确有得多人深受Excel繁杂操作困扰,Kid就萌发了试试看的设法。   
    我感觉Excel公式的使用,多少仍是需求编程思惟的,这关于得多人、尤为是不长于电脑操作的人来讲,很不敌对。而拿着工具书从头啃,也的确对比费事。
        我感觉Excel公式的使用,多少仍是需求编程思惟的,这关于得多人、尤为是不长于电脑操作的人来讲,很不敌对。而拿着工具书从头啃,也的确对比费事。  


    过后正值OpenAI的Copilot大火,看到AI在晋升出产力上大有可为,他就拉着CY一同,打算子细钻研钻研这事儿。  
    但事件后期,并无想象中顺利。  
    一方面,它刚开始只是个业余名目,大家都是抽空来做。  
    另外一方面,团队在技术线路上也做太重大调剂。  
    最后,他们感觉ChatExcel应该是往 判断式模型那块儿走的,因而就顺着这一思绪推动,但没想到:   
    后期处置任务量太大,需求引入十分十分多的 符号逻辑,数据要求很高。
        后期处置任务量太大,需求引入十分十分多的 符号逻辑,数据要求很高。   
    这关于小团队来讲根本上是致命的,由于数据量象征着人力物力时间本钱都会飙高。  
    没有方法,Kid和CY就座上去从新复盘这件事:  
    咱们想到李沐教师发过一个视频,讲“BERT和GPT之争”,咱们最后都感觉BERT各种目标表示更好。GPT呢,有点摸不清它想干啥。
      但子细一想,从工作自身的需要来看,生成式才是咱们真正想要的货色。
        咱们想到李沐教师发过一个视频,讲“BERT和GPT之争”,咱们最后都感觉BERT各种目标表示更好。GPT呢,有点摸不清它想干啥。  
    但子细一想,从工作自身的需要来看,生成式才是咱们真正想要的货色。  
    加上去年OpenAI一系列生成式任务开始大火(如Copilot、Dall·E),两集体最初抉择, 颠覆原有思绪,从新从生成式模型做起。   
    明白了技术线路,后续推动也就更顺了。   
    加之这项任务还失掉了导师袁粒的认可和反对,团队在资源和经费上也更富余了一些。  
    不论怎么样,历经1年时间,ChatExcel终于公布demo。  
    但这只是方案的第一步。   
    团队表现,接上去还将对产品做更多迭代降级,并会开源代码、揭秘面前技术。  
    关于ChatExcel的定位,他们坚持“小而美”。  
    Kid引见说,大模型确实是当下的趋向,如OpenAI、百度等都在通用大模型畛域不停推动效果。但他们以为,在一些子工作畛域上,模型的才能还有待晋升,这可能会是将来的一个趋向。  
    由此,他们目前会更为专一于模型特定场景下的才能晋升。  
    至于久远指标,团队但愿打造一个 “Chat生态”交互式AIGC。   
    终极“Chat生态” (空想版)大略会长这样:   


    而回到ChatExcel自身,团队表现确实有商业化的斟酌,但会是To B层面的。  
    (据说demo一公布就曾经有不少公司分割他们了)  
    在To C这边,会坚持 公益凋谢的方式,人人都能用。   
    而回看全部开发进程,Kid和CY的得多感触都浮光掠影。  
    好比看到ChatGPT做表格大火后,他们又惊又喜。  
    “惊”,是由于开始耽忧会不会有得多同类产品出来?本人的名目没有生存余地了?  
    Kid说本人看到这些新名目不停涌出后,晚上都要睡不着觉了。  
    “喜”,则是由于感觉本人的设法和趋向开展统一,这也是一种确定。  
    至于名目自身,他们的态度十分安然,问题全盘承受,但对本人的效果也颇有自信。  
    咱们当初仍旧感觉本人的计划很“优雅”。
      觉得做实践的人转来做运用,老是能想到一些奇怪的思绪hhh。
        咱们当初仍旧感觉本人的计划很“优雅”。  
    觉得做实践的人转来做运用,老是能想到一些奇怪的思绪hhh。  


    (应受访者要求文中Kid、CY为化名)  
    —   
    「中国AIGC产业峰会」启动  
    邀您共襄盛举  
    「中国AIGC产业峰会」行将在往年3月举行,峰会将约请AIGC产业相干畛域的专家学者,独特讨论生成新世界的过来、当初和将来。   
    峰会上还将公布 《中国AIGC产业全景讲演暨AIGC 50》,片面平面描画我国以后AIGC产业的竞争力求谱。点击链接或下方图片查看大会详情:   
    寻觅中国版ChatGPT,量子位邀你独特参预中国AIGC产业峰会   
    点这里 ?关注我,记得标星哦~   
    一键三连「分享」、「点赞」和「在看」  
    科技前沿停顿日日相见 ~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题31

    帖子39

    积分187

    图文推荐