2024 年,合成資料產生市場規模超過 3.0742 億美元,預計到 2037 年底將超過 182.3 億美元,在預測期內(即 2025-2037 年)複合年增長率超過 36.9%。到2025年,合成數據生成的產業規模預計將達到3.9817億美元。
用於電腦視覺和自動駕駛的人工智慧系統已經嚴重依賴這種正在發展的技術。透過將電影和遊戲產業(模擬、CGI)的技術與生成神經網路(GAN、VAE)結合,汽車製造商可以在不實際駕駛的情況下大規模建立真實的資料集和模擬景觀。 2021年,汽車產量年增3%,全球汽車產量約8,000萬輛。
此外,計劃擴大其投資組合的主要公司將從必須遵守 GDPR 等隱私立法的緊迫性中受益匪淺。產生資料的其他日益增長的用途包括在缺乏真實資料的情況下加強模型開發和訓練模型。人工資料是在獲得真實資料之前訓練和培育模型的寶貴資源,同時還可以降低成本。
成長動力
挑戰
基準年 |
2024年 |
預測年份 |
2025-2037 |
複合年增長率 |
36.9% |
基準年市場規模(2024 年) |
30742萬美元 |
預測年度市場規模(2037 年) |
182.3億美元 |
區域範圍 |
|
資料類型(表格資料、文字資料、圖像和視訊資料)
根據資料類型,預計在預測期內,合成資料產生市場中的表格資料將佔據最大的收入份額,約 50%。最近,隱私問題使得企業很難取得真實資料。由於這些困難,產生了類似於真實數據的合成數據,並且可以以有組織的表格方式保存。這增加了對表格數據的需求,預計在預測期間將以顯著的複合年增長率增長。企業可以利用生成對抗網路 (GAN) 創建合成表格數據,從而提高營運數據的安全性和隱私性。
研究分析師預測,到 2030 年,使用人工表格資料訓練人工智慧模型的速度將比真實結構化資料快三倍左右。
應用程式(人工智慧培訓和開發、測試數據管理、數據共享和保留、數據分析)
根據應用情況,在預測期內,合成資料產生市場中的測試資料管理部分將佔據最大份額,約 35%。市場將由對用於測試和驗證的代表性、多樣化和高品質數據的需求所驅動。與標準測試資料管理技術相比,合成資料可以幫助企業提高測試程序的功效和效率,從而提高產品品質、加快上市時間並節省成本。由於測試資料管理人員對資料測試和資料屏蔽所需的最低資料收集的要求不斷增長,因此該細分市場擁有最大的份額。它還試圖避免與 GDPR 相關的法律問題。由於企業在跨國交換資料時面臨挑戰,企業資料共享市場正在大幅擴大。
我們對全球合成數據生成市場的深入分析包括以下部分:
成分 |
|
部署方式 |
|
造型類型 |
|
奉獻 |
|
資料類型 |
|
應用 |
|
垂直的 |
|
北美市場預測
北美地區的綜合數據生成市場在預測期內佔據最大的收入份額,約 33%。北美是技術開發中心,特別注重數據驅動的突破、人工智慧和機器學習。由於該領域有大量新創公司、科技公司和研究機構,因此迫切需要高品質的合成資料來進行實驗和訓練人工智慧模型。北美擁有 291 個躋身全球前 1,000 強的新創企業生態系統。美國保持其領先地位,其中 252 個來自該國。加拿大擁有蓬勃發展的新創生態系統,貢獻了 39 個生態系統。該地區重要競爭對手的存在進一步推動了該地區的市場生產。
亞太地區市場統計
亞太地區的綜合數據生成市場預計在預測期內將佔據第二大收入份額,約 38%。這是該地區採用越來越多尖端技術的結果。此外,亞太地區的合成數據創建市場中,中國的市佔率最大,而印度的市場擴張速度最快。由於多個行業越來越多地採用人工智慧/機器學習和基於雲端的服務來確保安全的企業基礎設施,亞太地區預計將以最快的複合年增長率發展。
作者学分: Abhishek Verma