华人澳洲中文论坛

热图推荐

    数据剖析师:入行半年多,我学到了这些经验…

    [复制链接]

    2022-10-9 15:24:40 38 0



    CDA数据剖析师 出品
    作者:Amanda West
    编译:Mika
    【导读】
    关于刚入行数据剖析师来讲,在任务中总会遇到各种问题。本文作者就分享了她的感触。
    数据剖析很酷,但是我不以为在2000年代或更早的时分,会有小孩梦想长大后成为一位数据科剖析师。
    对我来讲,我在小时分有得多梦想,我首先想成为一位兽医,而后是公园办理员、训狗员、作家、最初是经济学家。就像过后许多小孩子想在长大后成为律师、医生或宇航员同样。
    固然,指标会跟着时间而改动,在往年5月份,我获取了弗吉尼亚大学的数据迷信硕士学位。结业几个月后,我找到了我的第一份任务,正式成为一位数据剖析师。刚找到任务的我悲痛欲绝,由于我能够把用上我所学的技巧,并向我的新同行们证实本人。但理想很骨感,在我入职这半年来,我也经常感到手足无措。
    上面我就跟大家分享一下,任务以来我在数据剖析行业所学到的技术层面和非技术层面的经验。固然这只是我集体的教训领会,毕竟每集体的感触都会有些不同。
    01
    学校中所学的技巧会用到多少?
    不到20%
    我十分喜爱用R言语进行编程。当我有选择的时分,我在这份任务的编程面试中我都使用了R言语。
    只管如斯,在我的日常任务中,有95%的时间我都使用了Python和终端(在VS Code中),5%的时间我会用会SQL,而R言语根本用不到了。能够说在读书期间,比起学的Python课程,我花了大半时间学习的R言语课程的实际作用要小很多。其中我学习的得多例如网络爬取、NLP、Apache Spark或Tableau等工具根本没派上用场。
    这也是正常的,由于很难预感到你在实际任务中究竟要做甚么。


    假如你是努力于用特定言语编程的人,我的倡议是,及早讯问招聘人员,公司的团队次要使用甚么言语。即便你 准则上能够用你选择的编程言语,假如团队使用其余言语,这将加大代码审查和整合的难度。对我来讲,晋升Python方面的技巧让我很受用,但关于使用Scala等言语的人来讲,可能就不是这类状况了。
    02
    AWS以及云办事很弱小
    在我刚开始使用AWS时,我还不太纯熟,但如今我天天都要跟它打交道。但AWS也是出了名的产品单一,让人很难知道针对特定的工作需求甚么办事。更蹩脚的是,当你搜寻如安在AWS中做某事时,往往会失掉好几种不同的谜底。为理解决这个问题,我始终在不停学习AWS相干常识。
    像谷歌云和Azure这样的办事也很受欢送,但若你不知道你可能会使用哪个,说瞎话,我仍是保举AWS。按照数据显示,AWS在2020年新企业云运用中占76%。只管如斯,大少数公司都在一定水平上使用云办事,理解云办事的根本任务原理和根本状况是很不错的。


    03
    理解硬件很首要
    特别是在排除软件毛病时
    在学校里,咱们常常会失掉洁净、荡涤后的数据样本,以便深化钻研某些详细的深层问题。但当你实际任务后,特别是公司的数据团队较小,那末你往往需求面对实在、凌乱且无序的数据。
    这是无妨理解一下计算机面前在做些甚么,这会有很大的改观。在处置有问题的数据时,我会使用如下命令 watch -d -n 0.5 nvidia-smi 和 htop 用来追踪诸如GPU/CPU的使用和内存的使用状况。我还会用 df -h 来监控特定目录中的文件大小,以防空间超限。


    我还使用tmux会话,以便同时关上多个终端窗口,并使我的任务在进入近程机器时不会断开。最初,当我找到无效的解决计划时,我依然会在网上寻觅更好的代替计划,在处置大数据集时,这能够节俭几分钟到几天的处置时间。
    这些只是我测试机器下限数据的几种办法,欢送在留言区别享你的办法。
    04
    要不断的搜寻和学习
    作为一个刚入行的数据迷信老手,是需求继续进行学习的。你将被要求做的工作,在得多时分会会让你不知所云,这象征着你要分秒必争地找出解决计划,解决你乃至不知道存在的过错。你需求不断的搜寻,看看其余人是怎么解决的,不停学习晋升本人,缓缓的你编程方面变得更好,代码库将开始在每次迭代中变得更为公道。
    最少对我来讲,我感觉我在第一份任务中所学到的货色和我在大学期间所学到的同样多,这出乎我的意料。


    假如你所在的公司使用主流编程言语,这是有一定劣势的,由于你能够多阅读下Stack Overflow等平台,这有数次帮了我的大忙。
    05
    你的坏习气不会跟着开始任务而改掉
    这并非针对数据剖析方面。在我读书时,我给本人很大的压力,不像我的同龄人那样常常放松。期中考试前,我会高强度的学习整整一周,除了打印更多的练习题或增补咖啡外,我简直不分开我的房间。在非期中考试的几周里,我会强制本人学习到深夜,而后一大早强制本人醒来匆匆赶去上课。
    始终以来,我都以为一旦我拿到学位,我就会养成正常安康的作息。天天包管8小时的睡眠,而且浏览、熬炼、安康饮食。任务也不会感觉让人感到干燥,由于我喜爱编程,因此我糊口中的所有都会变得美妙。
    然而,这并无产生。
    虽然任务的确减少了我的一些糊口习气,然而假如你在大学里也会加班加点搞学习,那末在任务中你也多是个任务狂。反过去假如你在读书时就有些懒散,那末任务后也可能会拖延。总之,要善待本人,筋疲力尽是欠好的,均衡是症结,这一点我还在学习中。
    结语


    显然,我的一些观念有些全面。但我很快乐成为一位数据剖析师,我依然置信从更大的角度来看,我的缺乏和自我疑心是值得的。


    点这里关注我,记得标星哦~

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题33

    帖子46

    积分207

    图文推荐