数据注释工具市场规模 2023 年估值为 12.6 亿美元,预计到 2036 年底将超过 257 亿美元,在预测期内(即 2024-2036 年)复合年增长率超过 26.1%。预计到2024年,数据标注工具的行业规模将达到15.6亿美元。市场的增长可归因于视频和照片等数据产量的增加。为了训练机器学习模型,使用数据注释工具将更多信息/元数据添加到各种数据类型中,例如文本、音频、图像和视频。全球每天有超过 30 亿张照片和约 720,000 小时的视频在社交媒体上分享。
除此之外,据信推动数据注释工具市场增长的因素还包括人工智能、机器学习、机器人等先进技术的兴起。工业机器人等先进技术主要是由高质量的数据注释推动的。在开发和测试机器人导航系统的计算机视觉 (CV) 模型等任务中使用标记数据是很常见的做法。根据国际机器人联合会发布的新的《2020年世界机器人工业机器人》研究报告,世界各地的企业中,目前有创纪录的270万台工业机器人在工作,比上年增长12%。此外,2019 年全球出货量为 373,000 台。此外,机器学习中数据注释的日益使用预计也将促进市场增长。在世界各地的机器学习项目中,80%以上的工程劳动都致力于数据准备和标记。此外,到 2024 年,第三方数据注释市场预计将增长近两倍。
。
。
增长动力
挑战
。
基准年 |
2023 |
预测年份 |
2024-2036 |
复合年增长率 |
26.1% |
基准年市场规模(2023 年) |
12.6亿美元 |
预测年度市场规模(2036 年) |
257亿美元 |
区域范围
|
|
。
全球数据注释工具市场按最终用户的需求和供应进行细分和分析,包括零售和电子商务、IT 和电信、BFSI、政府、汽车、医疗保健等。在数据注释工具的六大最终用户中,零售和电子商务领域预计将在 2036 年获得最大的市场份额。该领域的增长可归因于电子商务的日益普及以及消费者需求的不断增长。人工智能在零售和电子商务中的整合。根据 2020 年 10 月进行的一项调查,北美和欧洲约 70% 的电商决策者表示,人工智能将有助于 2021 年公司运营的个性化。对于零售商和客户来说,人工智能和数据注释服务都将极大地促进电子商务的发展。增强在线购物体验。过去几年,各公司见证了电子商务行业采用人工智能和数据注释的转变。因此,为了更好的用户体验和更有效的解决方案,一些公司已经利用人工智能和数据注释服务。
全球数据注释工具市场还按文本、图片和视频以及音频类型进行需求和供应细分和分析。在这三个细分市场中,文本细分预计将在 2035 年占据重要份额。文本是最常用的数据类型。大约 70% 的企业都使用该文本。文本注释中包含多种注释,包括情感、意图和查询。该细分市场的增长主要归因于数据标签中注释的使用不断增加。标签使用(自然语言处理)NLP 技术、自动问答(Q&A)平台、智能聊天机器人、情感分析等。因此,聊天机器人和基于云 NLP 技术的文本分析的日益使用预计也将推动细分市场的增长。自 2019 年以来,全球范围内,聊天机器人作为品牌沟通渠道的采用率增加了约 92%。2020 年,近 25% 的客户通过聊天机器人与企业互动,而 2019 年这一比例略低于 13%。
我们对全球数据标注工具市场的深入分析包括以下部分:
按类型 |
|
按组件 |
|
按注释类型 |
|
按最终用户 |
|
。
。
在所有其他地区的市场中,北美的数据注释工具市场份额预计将是最大的,到 2036 年底,份额约为 30%。市场的增长主要归因于连接到物联网 (IoT) 的设备数量不断增加。 2022年,北美有近30亿台联网物联网设备,预计到2030年这一数字将增至超过60亿台。另一方面,人工智能在医疗保健领域的日益普及预计也将推动市场增长。在一项针对美国医疗保健高管的民意调查中,约 41% 的人表示,截至 2021 年,他们对人工智能的使用已达到功能齐全的水平。另有近 26% 的人声称他们的人工智能系统部分正常工作。
据估计,亚太地区数据注释工具市场将成为第二大市场,到 2035 年底,其份额约为 28%。该市场的增长主要归因于互联网普及率的不断上升,而互联网的普及率不断提高预计将扩大数据生成。印度每三个月新增智能手机用户达 2500 万,移动数据使用率全球最高,每用户每月约 12 GB。除此之外,中国在 2018 年产生了约 8 万亿千兆字节的数据。预计到 2025 年,这一数字将增至约 49 万亿千兆字节。此外,该地区对自动驾驶汽车的需求不断增长,预计也将促进市场增长。为了促进现代出行服务,日本政府计划到2025年在全国40多个地区使用自动驾驶汽车。
此外,预计到 2035 年底,欧洲市场以及所有其他地区的市场将占据大部分份额。该市场的增长主要归因于面部识别技术的日益普及。此外,人脸识别已迅速从前沿的好奇心转变为日常生活的重要组成部分。面部识别技术正在迅速发展,算法也日益完善。在 11 个欧洲国家,执法机构已在调查中使用生物识别系统。此外,法国、德国、希腊、匈牙利、意大利、奥地利、芬兰等地区警方在刑事侦查中也使用人脸识别技术进行过往身份识别。
。
。
。
。
Innodata, Inc.宣布将其 Synodex 医疗数据提取平台与数据注释平台相结合,扩大服务范围,以支持医疗记录预测模型的开发。此次扩展展示了 Innodata 方法从医疗记录中提取高质量 AI 训练数据的有效性。
Telus Corporation宣布其 Telus International 部门收购了全球市场领先的注释平台和基于人群的培训数据解决方案供应商 Lionbridge AI。 Lionbridge AI将协助TELUS International扩大其在快速扩张的新经济服务市场的渗透率
。
作者学分: Abhishek Verma