世博shibo登录入口再通过众包机制把任务拆解、分发给外部劳能源池-世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口

世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口
你的位置:世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口 > 新闻中心 > 世博shibo登录入口再通过众包机制把任务拆解、分发给外部劳能源池-世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口
世博shibo登录入口再通过众包机制把任务拆解、分发给外部劳能源池-世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口
发布日期:2025-10-19 06:56    点击次数:143

世博shibo登录入口再通过众包机制把任务拆解、分发给外部劳能源池-世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口

文 | 新眸世博shibo登录入口,作家 | 简瑜

两个月前,Meta 豪掷约 150 亿好意思元(约合东谈主民币 1078 亿元)入股 Scale AI,一举拿下 49% 股份。往复完成后,Scale 估值被推高至 290 亿好意思元。

四肢硅谷 AI 赛谈近几年最猛的黑马,Scale AI 从斥地到估值飙升至 138 亿好意思元,仅用了 5 年期间,险些创造了一个行业的外传。

这家公司的主业,是数据标注。低成本的职工门槛和海量的东谈主工参与,这个看似没趣且"夫役活"的规模,永远以来被视为是 AI 产业链里最不性感、最阑珊联想力的一环。

关连词,恰是凭借这门"脏活累活",Scale 在大模子期间飞速完成了从幕后到台前的跃迁,成为硅谷最炙手可热的明星公司。Meta 的动手,则进一步将数据标注这个蓝本处于产业底层的智力,推向了聚光灯下。

更耐东谈主寻味的是,这场收购并不单是是成本层面的"下注"。

四肢往复的一部分,Scale 创举东谈主兼 CEO 汪滔将卸任,携带部分中枢职工加入 Meta,组建所谓的「超等智能小组」,同期保留 Scale 董事会席位。换句话说,Meta 买的不单是数据,更是汪滔本东谈主的计策目光和履行能力。

这场来势汹汹的收购背后,折射出的是 Meta 的数据火暴。

2024 年,Meta 推出的 Llama4Behemoth,曾因测验数据质地问题饱受诟病,原因在于 Llama4Behemoth 约 30% 的语料源自低质地酬酢媒体内容,导致模子在多模态清醒、长文本推理等中枢蓄意上,仍过期 GPT-4.5 约 12%。对 Meta 而言,阑珊高质地数据成为了限度其模子追逐的最大短板。

某种进程上,在 AI 模子测验对数据依赖日益加深确当下,数据标注四肢模子测验的第整个防地,其计策地位正在被重新估值。

01   从夫役活到智能化,数据标注进化之路

什么是数据标注?

一句话综合,就是给原始数据打上标签,把"东谈主类能清醒的信息"飘浮为" AI 能识别的测验样本"。比如在自动驾驶场景中,网罗车上传的只是谈路影像,但 AI 无法平直看懂。惟一当东谈主类标注员把车谈线、路牌、行东谈主等元素一一框选、象征,这些影像才信得过具备测验价值。

在这个行业里,简短存在三类玩家:

第一类是纯东谈主力型公司。依靠大量低成本劳能源完成标注,妥当作念图像分类、语音转写等法度化任务。时间门槛不高,客户经常需要自带器用和平台,妥当全球对"数据标注就是膂力活"的固有印象。

第二类是互联网大厂的众包平台。典型代表如京东众智、百度众测,主要用于知足公司自身业务场景需求,再通过众包机制把任务拆解、分发给外部劳能源池。

第三类则是智能型处事商。这类公司具备自主研发平台和算法能力,能提供自动化标注器用、质地贬抑体系以及高度定制化的惩办决策,尤其擅长 3D 点云、多模态等复杂任务,经常在恶果和准确性上权贵着手同业。

永远以来,前两类公司内容上都是"东谈主力堆砌型"企业,限度和利润空间有限,天花板尽头彰着。尤其是第一类,更多时候只是第三类智能公司的外包池子。事实上,今天大多数头部智能型企业,险些都是从这种东谈主力公司一步步进化而来。

以行业龙头 Scale AI 为例,它的前身其实叫" ScaleAPI "。最初,它并不是一流派据平台公司,而是提供一个"东谈主力 API ":开发者只需写一滑代码,就能曲折一支而已劳能源团队,维护完成内容审核、数据索要、预约安排等琐碎任务。

这种以东谈主工驱动的轻量模式,既帮 Scale 拿下了丰田、本田等早期大客户,也积存了大量高价值数据。

有了基础数据的积存,再加上 AI 能力的升级,自 2018 年起,Scale 就开动迟缓用模子替代掉部分重迭性、套路化的东谈主力使命,构建起一套"机器预标注 + 东谈主工复核"的羼杂使命流。先由算法完成预标注,再由东谈主工行家审核和修正。

这种 AI 代替的模式,为公司的恶果和质地带来了双重提高。左证 OpenAI 的测算,ChatGPT 的平均标注成本低于 0.003 好意思元,比传统众包平台低廉 20 倍。而在准确率上,GPT-4 完成的标注收尾可达到 88.4%,致使越过了东谈主类标注员的 86.2%。

02  全球数据标注疆域

左证 DMR(DimensionMarketResearch)在 2024 年 7 月发布的掂量证明,全球数据标注行业市集限度约为 20 亿好意思元,其中好意思国市集限度为 8.38 亿好意思元,占据约 40% 的份额。这亦然当今能查到的最新数据。

为什么好意思国能永远占据全球数据标注的主导地位?

一方面,数据标注内容上是东谈主力密集型产业。标注员的使命门槛低、流动性大,导致东谈主力险些成为成本贬抑的中枢竞争力。

为了放松组织压力,企业频繁会选用外包或众包的方式来派发名堂。在这少许上,好意思国公司凭借全球化单干的上风,将基础标注任务外包给低成本国度,罢了了极致的成本压缩。

典型的例子,Scale AI 通过旗下众包平台 Remotasks,它将最基础的框选标注任务分发给菲律宾、肯尼亚等低成土产货区。除官网裸露的 900 名厚爱职工外,其平台上注册工东谈主越过 24 万东谈主,遍布全球。

其次,在时间水慈悲自动化进程上,国表里厂商存在彰着差距。当今国内最大的标注公司云测数据,早在 2021 年就尝试引入自动标注功能,但诈欺范围仍主要靠拢在智能驾驶规模;另一家专注语音的海天瑞声,也在研发自动语音切割等器用,但举座智能化水平有限,仍高度依赖东谈主工。

比拟之下,Scale AI 在 2018 年就布局自动化标注,诚然雷同是自动驾驶起家,但业务也曾膨大到话语、金融、医疗致使军事等规模。

更紧要的是,Scale AI 不单是一家单纯的数据标注商公司,这次 Meta 重金挖走的汪滔,被称为华侨"天才少年",19 岁那年从好意思国麻省理工学院辍学,创立 Scale AI,在最近的一段采访中,他提到,不仅是数据标注,在招聘经由、质控经由、数据分析、销售证明等智力,Scale AI 都也曾罢了了自动化照顾。

某种进程上来说,四肢一个因大模子测验需求而出身的行业,国内企业布局的短板,很猛进程上是由市集需求的缺失所决定的。

数据标注最大的两个处事场景区别是大模子和自动驾驶,而这两个产业的实足主力军大多漫衍好意思国。出于数据自然触及秘籍和安全考量,企业更倾向于选用本国标注商互助。

正因此,好意思国既滋长出了 Scale 这么的万能型选手,还有 surgeAI、Turing 这么面向微调处事,以及 Lionbridge 这么面向文本、语音的数据公司。

比拟之下,国内由于自身劳能源较为密集,互联网大厂频繁会吸收众包模式而非有意标注公司,且在部分模子吸收蒸馏的前提下,国内市集需求要远少于国际。

03 大模子下半场, 数据标注地位正在回转

跟着 AI 时间的快速迭代,业界曾一度流传一种不雅点:AI 标注与合成数据将透顶取代东谈主工标注。但就当今的时间实践而言,这种可能性依然远处。

AI 标注的前提,是数据结构和规则高度明确,况且有饱和的历史样本复旧。因此,它的诈欺范围自然受限,当今仍只可笼罩交通图像、东谈主脸识别等较为法度化的任务。

在使命流上,AI 主要替代的是标注的中游智力,而规则制定、质地把关等要害节点,仍然需要东谈主工介入。

与此同期,跟着大模子渐渐强调垂直化场景,测验重点也从预测验转向了强化学习。不同于预测验对数据质地要求相对宽松,强化学习更依赖高精良度和专科化数据,不绝触及医疗影像、法律文本、时势话语等高门槛规模。

这种变化使得标注员的脚色愈发复杂。

他们不仅要具备专科学问,还需要抽象念念维与跨学科能力。正如一位业内东谈主士所说,如今的任务经常攀扯推理链条、多模态对都等新场景,"早已不是浅易的框选和分类大概惩办的"。

Surge AI 就是这一趋势的典型代表。该公司自 2020 年创立起,就将中枢放在高质地数据的生成上,举例为编程模子提供优质代码数据,以提高模子性能。凭借这种定位,SurgeAI 在 2024 年的营收已达到 10 亿好意思元,致使超过了行业大哥 Scale AI 的 8.7 亿好意思元。

另一条被委托厚望的替代旅途是合成数据。表面上,它大概在数据不实时填补空白,但实践问题掩饰冷漠:合成数据毕竟是在既有条目下生成的,当实践场景发生变化,它难以保抓灵验性;同期,数据安全风险也限度了其大限度泛化的可能。

从这个角度来看,数据标注并不会消散,而是会向更高质地、更强专科化主义演进。

归来以前,数据标注永远被视为"三驾马车"里最弱的一环:算法有 OpenAI,算力有英伟达,而在数据标注规模,即即是行业龙头 Scale AI,其市值也不到 OpenAI 的十分之一。

究其原因世博shibo登录入口,很猛进程上源于行业门槛低、收入上限有限。但当 AI 模子测验插附近半场,数据标注的时间壁垒被束缚拔高,Meta 对 Scale AI 的收购,只是一个开动,在不远的明天,数据资源正在被推向产业竞争的中枢。



上一篇:世博登录(网站)登录入口官方网站开源了全新文生图模子   Qwen-Image-世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口
下一篇:世博体育(中国)官方网站马斯克接管在此时敞开 Grok-世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口

Powered by 世博登录(网站)登录入口官方网站IOS安卓/网页通用版入口 @2013-2022 RSS地图 HTML地图