“大数据”概念首次诞生十多年来,数据仍然是大型企业和新兴初创企业最重要且增长最快的创新驱动力之一。 从提供业务运营基础的脉搏检查到通过机器学习智能自动化日常任务,数据已成为各种规模组织决策的中枢神经系统。 此外,数据的使用现在已经远远超出了数据科学家、数据分析师和数据工程师的范围——每个人都是数据生产者和消费者。
日益关注数据的结果是:管理数据业务已经成为基础设施中增长最快的领域之一,估计价值超过 $70B,占 2021 年所有企业基础设施支出的五分之一以上。 这个市场形成的原因在于它结合了软件工程、分析和人工智能领域,同时乘上了云计算的浪潮。 (有关这一大趋势背后的架构演变和驱动力的更多信息,请参阅这篇文章《现代数据基础设施的新兴架构》,该文章刚刚针对 2022 年进行了更新。)
过去几年,数据行业的增长也催生了一些最令人兴奋和最具影响力的企业软件公司。 Snowflake 和 Confluence 等最近的公共巨头已经改变了数千家企业的运营方式和数百万种产品的制造方式。 然而,大多数人不太熟悉那些影响深远的公司——下一代定义类别的公司。
在经历了创纪录的 2021 年(数据公司获得了数百亿美元的风险投资)以及本已强劲的 2022 年之后,为了帮助消除噪音,我们编制了首届 Data50 榜单。 这些是数据领域最令人兴奋的类别中的领头羊公司。 总的来说,这 50 家公司的估值超过 $100B,筹集的总资本约为 $14.5B,其中 20 家公司到 2021 年已达到独角兽地位。
言归正传,我们很高兴推出 2022 年 Data50。
全球流量 50强(top50)AI初创公司排名
| RANK | COMPANY | CATEGORY | LOCATION | VALUATION RANGE | WEBSITE |
|---|
| 1 | ![]() |
Query and Processing | San Francisco, CA | $5B+ |
Databricks |
| 2 | ![]() |
ELT & Orchestration | Oakland, CA | $5B+ |
Fivetran |
| 3 | ![]() |
AI/ML | Palo Alto, CA | $5B+ |
Scale.ai |
| 4 | ![]() |
Data Governance & Security | Atlanta, GA | $5B+ |
OneTrust |
| 5 | ![]() |
ELT & Orchestration | Philadelphia, PA | $1B-$5B |
Dbt labs |
| 6 | ![]() |
Query and Processing | Boston, MA | $1B-$5B |
Starburst |
| 7 | ![]() |
Data Governance & Security | Brussels, Belgium | $5B+ |
Collibra |
| 8 | ![]() |
Query and Processing | Santa Clara, CA | $1B-$5B |
Dremio |
| 9 | ![]() |
Query and Processing | New York, NY | $1B-$5B |
Dataiku |
| 10 | ![]() |
AI/ML | New York, NY | $250-999M |
Hugging Face |
| 11 | ![]() |
Query and Processing | Boston, MA | $5B+ |
DataRobot |
| 12 | ![]() |
AI/ML | San Francisco, CA | $250-999M |
Primer.ai |
| 13 | ![]() |
AI/ML | Palo Alto, CA | $1B-$5B |
Snorkel |
| 14 | ![]() |
AI/ML | San Francisco, CA | $1B-$5B |
Anyscale |
| 15 | ![]() |
Query and Processing | Tel Aviv, Israel | $1B-$5B |
Firebolt |
| 16 | ![]() |
ELT & Orchestration | Cincinnati, OH | $100-$249M |
Astronomer |
| 17 | ![]() |
Data Governance & Security | Redwood City, CA | $1B-$5B |
Alation |
| 18 | ![]() |
AI/ML | San Francisco, CA | $1B-$5B |
Weights & Biases |
| 19 | ![]() |
BI & Notebooks | San Francisco, CA | $1B-$5B |
Sigma Computing |
| 20 | ![]() |
Data Observability | San Francisco, CA | $250-999M |
Monte Carlo |
| 21 | ![]() |
AI/ML | Seattle, WA | $250-999M |
OctoML |
| 22 | ![]() |
Customer Data Analytics | San Francisco, CA | $250-999M |
Census |
| 23 | ![]() |
BI & Notebooks | San Francisco, CA | $250-999M |
Hex |
| 24 | ![]() |
Customer Data Analytics | San Francisco, CA | $250-999M |
Hightouch |
| 25 | ![]() |
Customer Data Analytics | Seattle, WA | $1B-$5B |
Amperity |
| 26 | ![]() |
Data Governance & Security | New York, NY | $1B-$5B |
BigID |
| 27 | ![]() |
Data Governance & Security | Fremont, CA | $250-999M |
Privacera |
| 28 | ![]() |
Data Governance & Security | Boston, MA | $250-999M |
Immuta |
| 29 | ![]() |
Data Observability | San Francisco, CA | $250-999M |
Bigeye |
| 30 | ![]() |
ELT & Orchestration | Greater Manchester, United Kingdom | $1B-$5B |
Matillion |
| 31 | ![]() |
Customer Data Analytics | San Francisco, CA | $1B-$5B |
Heap |
| 32 | ![]() |
AI/ML | San Francisco, CA | $250-999M |
Tecton |
| 33 | ![]() |
Query and Processing | Burlingame, CA | $250-999M |
Imply |
| 34 | ![]() |
BI & Notebooks | San Francisco, CA | $250-999M |
Sisu Data |
| 35 | ![]() |
ELT & Orchestration | San Francisco, CA | $100-$249M |
Rudderstack |
| 36 | ![]() |
Customer Data Analytics | New York, NY | $250-999M |
ActionIQ |
| 37 | ![]() |
Query and Processing | Portola Valley, CA | $1B-$5B |
ClickHouse |
| 38 | ![]() |
ELT & Orchestration | San Francisco, CA | $1B-$5B |
Airbyte |
| 39 | ![]() |
Query and Processing | San Mateo, CA | $250-999M |
Rockset |
| 40 | ![]() |
AI/ML | San Francisco, CA | $250-999M |
Labelbox |
| 41 | ![]() |
AI/ML | San Mateo, CA | $250-999M |
Explorium |
| 42 | ![]() |
AI/ML | San Francisco, CA | $100-$249M |
Rasa |
| 43 | ![]() |
ELT & Orchestration | Washington, DC | $250-999M |
Prefect |
| 44 | ![]() |
Query and Processing | New York, NY | $250-999M |
Materialize |
| 45 | ![]() |
AI/ML | New York, NY | $100-$249M |
Coiled |
| 46 | ![]() |
BI & Notebooks | San Mateo, CA | $100-$249M |
Preset |
| 47 | ![]() |
BI & Notebooks | San Francisco, CA | $100-$249M |
Metabase |
| 48 | ![]() |
AI/ML | San Francisco, CA | $100-$249M |
Iterative.ai |
| 49 | ![]() |
AI/ML | San Francisco, CA | $100-$249M |
Robust Intelligence |
| 50 | ![]() |
AI/ML | Mountain View, CA | $100-$249M |
Fiddler |
Data50 公司成立于 2008 年之后,在过去两年筹集了新资金,其员工数量同比增长至少 30%。 他们的产品是为跨行业的数据或数据应用团队服务的横向技术。
排名综合考虑了最新估值、公司规模、过去两年的员工增长、运营年限和当前收入规模。 员工数据基于 LinkedIn 的公开数据。 融资数据基于 Pitchbook 和 Crunchbase 的公开数据,截至 2022 年 3 月 22 日准确。
请注意,此列表不包括 CockroachDB、PlanetScale 和 Yugabyte 等事务数据库公司,因为使用这些技术的数据本质上是事务性的,而不是分析性的。

















































