预计到 2036 年底,合成数据生成市场规模将达到 124.5 亿美元,在预测期内(即 2024-2036 年)的复合年增长率为 35%。2023 年,合成数据生成的行业规模为 3.4 亿美元。计算机视觉和自动驾驶的人工智能系统已经严重依赖于这项发展中的技术。汽车制造商可以通过将电影和游戏行业的技术(模拟、CGI)与生成神经网络(GAN、VAE)相结合,在无需实际驾驶的情况下大规模构建逼真的数据集和模拟景观。2021 年,汽车产量同比增长 3%,全球生产了约 8000 万辆汽车。
此外,计划扩大投资组合的主要公司将从必须遵守 GDPR 等隐私立法的紧迫性中受益匪浅。生成数据的其他日益增长的用途包括在没有真实数据的情况下加快模型开发和训练模型。人工数据是在获得真实数据之前训练和培养模型的宝贵资源,同时还可以降低成本。
增长动力
挑战
基准年 | 2023 |
预测年份 | 2024-2036 |
复合年增长率 | ~ 35% |
基准年市场规模(2023 年) | 约 3.4 亿美元 |
预测年份市场规模(2036 年) | 约 124.5 亿美元 |
区域范围 |
|
数据类型(表格数据、文本数据、图像和视频数据)
根据数据类型,预计在预测期内,合成数据生成市场中的表格数据将占据约 50% 的最大收入份额。最近,隐私问题使企业难以获取真实数据。由于这些困难,人们生成了类似于真实数据的合成数据,并且可以以有组织的表格方式保存。这增加了对表格数据的需求,预计在预测期内,表格数据的需求将以显着的复合年增长率增长。企业可以利用生成对抗网络 (GAN) 创建合成表格数据,从而提高运营数据的安全性和隐私性。
研究分析师预测,到 2030 年,使用人工表格数据训练人工智能模型的速度将以比真实结构化数据快三倍左右的速度增长。
应用(人工智能训练与开发、测试数据管理、数据共享与保留、数据分析)
根据应用,预测期内,合成数据生成市场中的测试数据管理部分将占据约 35% 的最大份额。市场将由对测试和验证的代表性、多样化和高质量数据的需求驱动。与标准测试数据管理技术相比,合成数据可以帮助企业提高测试程序的有效性和效率,从而提高产品质量、加快上市时间并节省成本。由于测试数据管理员对数据测试和数据屏蔽的最低数据收集的需求不断增长,该细分市场占有最大的份额。它还试图避免与 GDPR 相关的法律问题。由于企业在跨境交换数据时面临的挑战,企业数据共享市场正在大幅扩张。
我们对全球合成数据生成市场的深入分析包括以下部分:
成分 |
|
部署模式 |
|
造型类型 |
|
奉献 |
|
数据类型 |
|
应用 |
|
垂直的 |
|
北美市场预测
在预测期内,北美地区的合成数据生成市场将占据最大的收入份额,约 33%。北美是技术开发的中心,尤其注重数据驱动的突破、人工智能和机器学习。由于该地区初创企业、科技公司和研究机构众多,因此迫切需要高质量的合成数据来进行实验和训练人工智能模型。在全球前 1,000 名初创生态系统中,北美拥有惊人的 291 个初创生态系统。美国保持着领先地位,其中 252 个来自该国。加拿大拥有自己蓬勃发展的初创生态系统,贡献了 39 个生态系统。该地区重要竞争对手的存在进一步推动了该领域的市场生产。
亚太市场统计
亚太地区的合成数据生成市场预计将在预测期内占据第二大收入份额,约为 38%。这是该地区采用越来越多的尖端技术的结果。此外,亚太地区中国的合成数据创建市场占有最大的市场份额,而印度的市场则以最快的速度扩张。由于多个行业越来越多地采用 AI/ML 和基于云的服务来确保企业基础设施的安全,亚太地区预计将以最快的复合年增长率发展。
作者学分: Abhishek Verma