本篇文章2750字,读完约7分钟

2019年,当人们再次谈论人工智能时,他们经常谈论如何应用它。因为每个人心里都知道,如果人工智能想要为企业和社会服务,它必须首先走出实验室,放下它神秘而高贵的外表,还有脚踏实地

然而,就像半导体技术一样,它在诞生之初没有被业界所认可,主要是因为生产成本高,而晶体管的成本高达10美元,在实验室里被称为玩具。直到硅提纯、精密加工等技术的发展,杰克·基尔比发明的现代集成电路才出现。目前,几千万甚至几亿个晶体管只需10美元就能买到。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

人工智能的成本是多少?与芯片不同的是,它对BOM有明确的定价。一般认为,这主要来自R&D人员和工程师的工资以及服务器维护。事实上,这个想法还不够全面。大多数企业采用的人工智能技术称为机器学习,它需要脱敏训练数据来运行。即使实现了Hopfield,它也需要比想象中多得多的数据,更不用说那些现在具有很强鲁棒性的模型了。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

数据收集标签看起来很简单,只不过是拍照和标记一个点,但操作起来却不是一回事。首先,如果我们想在足够短的时间内收集足够的数据,我们必须有足够的人力。如果有10万张面部表情照片,300分需要打分,平均每人每天贡献20份合格的资料,企业数据采集和打分团队有50人,那么完成这一单笔业务需要100天,也就是3个多月。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

在获得数据后,需要将近半年的时间来复习和训练,最后才能在网上获得该功能。这显然不符合软件迭代更新的概念。再加上这些人员的培训、组织和运营成本,提供合格的数据收集服务可能高达数万甚至数十万元。这就是为什么有人认为人工智能不会取代劳动力,而是会增加就业。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

在海外,我们率先注意到一个新的蓝色海洋——数据收集和数据注释,它首先由阿彭代表。后来,随着MightyAI和Scale等公司的出现,它逐渐变得稳定。这次爆发发生在2016年左右,像后者这样的公司都出现在2015年和2016年。就在最近,王,22岁的中国年轻人,规模人工智能的创始人,宣布他已经收到了1亿美元的C系列融资,公司的估值超过10亿美元,使他成为一个新的硅谷独角兽。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

相比之下,中国的人工智能浪潮实际上比国外更为汹涌,但专门从事数据收集和注释的公司发展却相对滞后。虽然有几家关联公司,但大部分都是个体户,这与服务海外许多人工智能企业的平台模式完全相反。当然,每个人都在吃顾客的订单,差异并不意味着他们错了。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

国内有一家名为龙猫数据的公司,该公司是中国第一家以众包形式经营收藏和注释业务的公司。众包的优势在于大量使用人员。与传统的员工制度相比,众包更加灵活。同时,员工不用在淡季支付工资,这降低了运营成本。

然而,众包的缺点在于用户管理。数据采集成员与龙猫之间没有劳动合同,只有平台操作规范作为约束。因此,龙猫数据采用了一种精细化的管理方法,描述用户的能力,并将不同的用户分配到不同的链接,包括数据收集和注释、数据审查等。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

为了提高数据输出的质量和效率,配合龙猫数据的众包模式和良好的用户操作,龙猫数据采取了两种措施:预标注工具和人机跨数据验证。前者是指龙猫众包平台的人工智能工具首先对需要标注的数据进行预标注,然后标注人员对预标注结果进行微调;后者意味着龙猫数据将通过机器和人员对标记的数据进行双重交叉检查,并增加合理数量的随机检查,最终满足数据交付的要求。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

借用众包模式,从任务发布到数据交付,即使是一个包含数十万数据的大订单也可以在一两周内完成。

龙猫数据也头疼。他们的一个客户是世界上著名的通信设备制造商。根据GDPR的规定,在GDPR保护区内消费的所有产品必须符合相关规定。这使得龙猫在收集数据时符合GDPR标准。为此,龙猫招募了对GDPR有深刻了解的人。

人工智能的快速发展给数据行业带来了大量不同的基础数据需求。龙猫数据的客户订单一般分为两类:收集的标签数据和未收集的标签数据。再次收集和标记现有数据是对资源的浪费。因此,龙猫数据推出了数据商城服务,即用户可以直接在商城购买现有的数据集,从而快速获取数据。当然,数据商城的数据将在恢复销售前与客户签订一定的协议,这就保证了龙猫数据仍然合法享有出售这批数据的权利。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

类似于知识产权,数据在销售后仍然存在,也就是说,企业购买数据后,可以将其复制到其他公司。相当于许多企业只要购买一个数据就可以完成所有的培训。从经济角度来看,即使买家卖出一次数据,对龙猫来说也是一个损失。区块链可能是一个解决方案,但目前,龙猫正专注于另一件事。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

龙猫数据将其目前的发展分为三个层次。第一层是龙猫1.0,它是一套数据注释工具。在1.0时期,龙猫开发了基于三个领域的注释工具:视觉、音频和文本,用于手动处理数据,以服务于机器学习的训练。第二层是龙猫2.0。在此期间,龙猫开始从整体流程上优化数据采集和标注,实现了从接收需求到完成需求的全过程自动化管理。其中一个非常重要的部分是数据收集和注释任务的详细划分,它将一个复杂的任务划分为极小粒度的需求,极大地提高了满足需求的时间。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

2019年,龙猫数据进入3.0时代,人工智能预标记工具得以开发。目前,这种预标注工具主要用于视觉层面,而音频和文本很少使用。龙猫数据3.0代表了预注释技术和工具的全面采用,可被所有数据收集和注释人员使用,从而提高效率。对于龙猫数据,该工具的应用可以大大缩短交付周期。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

龙猫数据3.0将持续一段时间,然后进入4.0周期。在此期间,龙猫全面使用自动标签工具。用户只需对收集的数据和预标注结果进行微调,标注、审核和质量检验工作完全被人工智能所取代。只是这条路还很远,所以现在很难估计。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

然而,不难想象,未来的数据采集公司必须通过工具和预先标记形成自己的技术壁垒。采购过程主要依靠人员,其规模和效率主要来自市场运作和任务回报,这意味着人工时间越短,成本越低,可以完成的客户订单数量越多。

从客户数量来看,龙猫大约有200个客户,基于众包的优势,这是合理的。毕竟,从外部来看,在质量合格的前提下,我们自然会选择产品周期最短、价格最便宜的公司。这种模式也造成了龙猫数据客户购买更多,核心客户单价高的局面。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

从内部来看,龙猫数据的模型并没有太大的变化,但是过程已经改变了,最根本的原因在于工具的进化。同时,自3.0时代以来,龙猫不再是一家传统的数据收集和标签公司,而是一家人工智能公司。

也许他们想要的是从基础数据服务到人工智能的发展和转变,从纯人工智能数据服务到细分领域的整个人工智能着陆。借助人工智能的力量,解放了人工智能中最需要劳动的部分,实现了人工智能领域中最智能的劳动。这是他们最擅长的。毕竟,他们是人工智能领域的建设者,他们也知道如何充分利用人工智能这一强大的本土力量。

这家公司如何利用人工智能来实现人工智能中更智能的劳动?

再者,作为人工智能的上游,数据收集和注释也需要人工智能的能力发展,最终形成一个闭环。

责任:张洋

标题:这家公司如何利用人工智能来实现人工智能中更智能的劳动?

地址:http://www.71vw.com/zlxw/3377.html