|
作者 | 李安琪
编纂 | 苏建勋
36氪得悉,近日「恺望数据」获取了千万元级天使轮融资,本轮融资由辰韬资本、三一团体和溪山天使汇投资。据悉,本轮融资次要用于团队建立与技术研发,搭建范围化自动驾驶数据办事平台。
恺望数据成立于2022年2月,是一家为车企与自动驾驶公司提供一站式数据解决计划的公司。针对数据供应不不乱、流程复杂、工具低效等痛点,恺望努力于让数据出产线从手任务坊向规范化、范围化和自动化转变,晋升自动驾驶数据出产效力,放弃产能不乱并升高本钱,减速自动驾驶落地。
恺望数据开创人于旭硕士结业于法国昂热大学,是字节跳动、Momenta、Uber等企业数据出产及经营体系的第一搭建者,具有多段从零到一的大数据平台搭建教训。团队成员来自字节跳动、阿里巴巴、Uber、Momenta、梅赛德斯-奔跑等公司。
近些年来,跟着汽车智能化、智能驾驶的开展,汽车的传感器品种与数量愈来愈多,包罗摄像头、毫米波雷达、激光雷达等;同时传感器硬件构造、参数变动增多、车辆驾驶的场景繁杂度减少、软件OTA速度放慢等,这些都对数据的品质、时效性要求愈来愈高。
以标注数据为例,数据标注实质上是经过2D图象视频和3D激光点云中的物体标注,教会自动驾驶零碎辨认路途环境和交通参预者。过往,自动驾驶感知算法大多只掩盖了十几类数据,但当下数据标注类型激增到了五十多类,就连特斯拉此前也建设了上千人的数据标注团队。
恺望数据开创人兼CEO于旭告知36氪,往年自动驾驶数据的处置需要量处于暴增形态,但当上行业的数据标注处置根本还属于一个密集型休息功课,大多出产流程都是包工头式的名目分包模式,存在着诸多痛点。
最为典型的就是,数据标注办事团队短少自动驾驶技术配景,很难了解算法面前的数据需要规定。于旭举了一个例子,某车企对自动驾驶数据的标注规定长达200页,但数据办事公司很难在短期内彻底消化这么多内容。往往是一知半解地标注,而后让车企指出哪里不合错误,能力正确了解标注的规定。一来一回间,大大晋升了数据的处置周期。
症结在于,这类需要规定并不是变化无穷。当车企的算法产生变动,标注的规定也会产生相应改动,尤为是在智能驾驶软件疾速OTA降级确当下。
当规定需要产生变动,且泛起数据处置需要波峰时,小型的数据办事团队在筛选及沟通环节更是无奈应答。以某智驾研发公司为例,其算法团队有近百人,但对应的数据办事团队仅2人,当算法设计泛起较大变动时,基本无奈及时应答激增的数据需要,只能在一地利间内拼凑出一份隐约不清的需要仿单。
行业的痛点,成为了恺望选择的切入点。以上述车企的需要为例,于旭告知36氪,得益于团队的自动驾驶技术了解与经营办理配景,两周内就消化了车企200页的内容,并将文档稀释成5页精髓,大大增加了数据标注履行层的了解担负。
图源:恺望数据
据于旭引见,恺望数据次要做了两件事:一是集结低本钱人力和预标注技术的数据办事平台,以半人工、半自助的模式范围化出产数据;另外一方面,则是提供一站式的数据闭环办事解决计划,在寻求全自动的过程当中提供全链条办事,更好地知足终端客户的数据闭环运用需要。
简而言之,成为车企/自动驾驶公司与数据标注办事团队、标注履行人员多方之间的平台型桥梁。
针对这个平台,恺望从供应资源、出产流程、出产工具三个数据出产中心因素总结了三个特征:
第一,打造一个多方共用的海量数据标注平台,构建低门坎参预的生态体系,造成范围又灵敏的产能,知足弹性较大的人力需要;关于传统标注公司而言,试错本钱变低;关于车企/自动驾驶公司而言,也可以有短缺人力资源来反抗数据的波峰波谷。
但随之而来的一个问题是,每个企业的自动驾驶标注规定、言语不尽相反,恺望如何知足不同客户的需要?因此恺望平台的第二个特征是,将平台功用进行原子化拆解,灵敏的功用模块能够知足不同用户的需要,以缩短名目周期。
于旭表现,虽然每家的算法和阶段会有不同,然而数据这一层是有较大的通用性的,由于要标注的中心元素都同样的,只是标注办法有所区分,而恺望会把某个元素进行原子化拆解。好比标注一辆车,恺望能够合成成车本体、朝向、定位等多种信息。经过尽量细分属性,这样面对车企的每一个个选择都能提供规范参考。
第三则是借助以数据驱动的自动化标注技术,努力于将平台打磨成真实的自动化工具,晋升数据出产的效力。
恺望表现,在平台的自动分化机制下,平台能够公道将工作分给最适合的供给商、完成标注链最短门路、零碎可自动判别需要公道性、本钱及ROI等,进而将标注本钱升高到1/10,算法预标注本钱优化为原来的30%-80%。预计往年10月,恺望会推出这个数据标注SaaS平台。
目前,恺望已与策略投资方三一团体在自动驾驶畛域发展数据协作,其余客户包罗集度汽车、字节跳动、亿咖通、元戎启行、地平线、寒武纪、中交兴路、旷视及商汤等。 |
|