智能的AI需要更智能的人类

    |     2025年7月10日   |   场景研究   |     评论已关闭   |    217

印度领先的商业报纸之一《经济时报The Economic Times》于2025年7月8日载文(作者:Himanshi Lohchab)——随着人工智能技术的发展,对复杂、高质量训练数据的需求激增,数据标注也因此成为一个关键行业。印度正逐渐成为全球重要的枢纽,为各领域提供高技能人才。随着市场快速增长和复杂程度的不断提升,数据标注如今需要具备深厚的科学、技术和语言方面的专业知识。

随着AI模型智能达到顶峰,它对复杂的、由人工整理的数据的依赖也在不断加深。

起初,数据标注员的工作是进行音频转录、勾选选项框、语言翻译和图像中的物体标注等微型任务。如今,随着AI模型训练需求的复杂化,他们已经开始修正软件代码、核查财务报表、分析诊断报告等。

数据标注,或称为数据标签,是构建高质量训练数据集的最关键和基础的步骤,它有助于提升AI模型的准确性,减少“幻觉”现象,并建立防范不当或有害内容的安全防线。而印度正迅速崛起成为数据标注服务的中心,灵活的劳动者、中层业务分析师,甚至包括专业的数据工程师、审计员、放射科医生和律师等,他们都在为构建高质量数据集做出贡献。

“说实话,我认为我们该弃用‘数据标签’这个词,”帕洛阿尔托人才和AI工具公司 Turing 的创始人乔纳森·西达尔特 (Jonathan Siddharth) 说道。“这就像把智能手机称为‘便携式电话’一样。”

“我们现在做的事情已经完全不同了。我们不再是给猫狗打标签,而是在组建一支奥林匹克竞赛水平的人才团队,来解决各行各业中极其复杂的问题,”他解释说,如今的AI模型已经变得非常智能,有时甚至需要物理学家、软件工程师和数据科学家共同协作才能生成对这些模型有挑战性的数据。

早期初创公司 Macgence 的创始人兼首席执行官 Harshul Arora 表示,他的公司专注于为AI/ML(机器学习)模型和代理整理定制数据集。“如今企业需要能捕捉语言和文化细微差异的定制数据。这些数据集在 Hugging Face 这样的开放库中是找不到的,”他说道。

根据人力资源公司 TeamLease Digital 的数据,全球数据标注市场规模预计将从 2025 年的约 65 亿美元扩大到 2030 年的近 200 亿美元,年增长率约为 25~30%。在印度,这一市场在2023年价值约为8000万美元,预计到2030年将增长到近5亿美元,年增长率接近 30%。

这一趋势也体现在从业人员数量的增长上,从 2022 年的 2 万人增至目前的 7 万人。这其中包括标注员、质检员和项目经理,他们分布在初创公司、IT服务企业和众包平台中。

“随着大语言模型(LLM)的兴起,数据标注工作变得更加复杂,催生了许多专门领域的高薪岗位,”Quess IT Staffing 首席执行官 Kapil Joshi 补充说,实现了每年50%的增长。TeamLease Digital 首席执行官 Neeti Sharma 则表示,随着这种增长,行业很快将面临人才短缺。“到 2026 年,该行业可能面临 40% 至 50% 的熟练技术人员短缺。”

总部位于澳大利亚、已交付超过15,000个AI数据项目(包括LLM微调、评估、安全测试和多模态标注)的公司 Appen 首席执行官瑞安·科伦(Ryan Kolln)表示:“随着模型的发展,数据需求将发生变化——某些类型的数据可能需求减少,而另一些类型将迅速增长。”“一个很好的例子是在LLM的训练中,初级数学问题的数据正在减少,但对于更复杂的STEM(科学、技术、工程和数学)问题的数据需求却在增长。”

Meta最近斥资143亿美元收购了Scale AI 49%的股份,使这家数据公司的估值达到290亿美元,这凸显了该行业的重要性。据报道,科技巨头OpenAI、Google 和 Microsoft已终止与Scale的合同,这为图灵和Appen这样的全球公司带来了数百万美元的商机。图灵公司的Siddharth表示,这笔交易证实了“在通用人工智能(AGI)的竞赛中,数据的战略地位不亚于算力,并预示着该领域的投资规模将匹敌甚至超过前沿实验室每年数十亿美元的水平”。据《时代》杂志报道,图灵公司仅在过去几周就新增了价值达5000万美元的潜在合同。

印度的优势

长期以来,数据公司一直依赖印度的人才和规模来服务全球项目。“印度在技术专业深度方面的实力非凡——从印度理工学院(IIT)毕业生到数学、物理和工程等领域的专业博士应有尽有。而且这些人才的发展方向正与AI的需求同步:不仅仅是编程能力,而是能够推动推理能力、多模态理解和自主智能流程边界的前沿思维人才。”图灵公司创始人西达哈特(Siddharth)说道,图灵40%的员工来自印度。

他补充说,数据实验室要想在竞争中脱颖而出,就需要顶尖人才,“而不是仅仅重复硅谷的人才库。当班加罗尔的一位物理学家帮助训练一个可能治愈疾病的模型,或者一位浦那的工程师改进了一个可能彻底改变教育方式的AI时,这就是智能和机会的真正民主化。”

Appen 公司的 Kolln 指出,印度教育体系对数学和科学的重视,使其在逻辑思维和问题解决能力方面具备显著优势。该公司拥有来自印度的 5 万名数据贡献者。

Indika AI 创始人兼首席执行官 Hardik 表示:“在过去三年中,我们看到全球对多语言、行业专属数据基础设施的需求迅速上升,这为我们带来了 5 倍的营收增长。” 他补充说,公司旗下的自由职业平台 Flexibench 目前注册用户已达7万人,其中约5%-10%在任何时候都处于活跃工作状态。

 

原文链接:https://economictimes.indiatimes.com/tech/artificial-intelligence/smarter-ai-needs-smarter-humans/articleshow/122304298.cms

转载请注明来源:智能的AI需要更智能的人类

相关文章

噢!评论已关闭。