《潮报》 作者:谢丹英。
3月,春雨朦胧,黄土高坡山路雾蒙蒙,能见度极低。 当地司机已经习惯了,熟练地打开双跳灯,仍然开着快车。
向窗外望去,只能看到前尾灯发出的红光。 超新闻记者谢丹英摄。
与飞驰的汽车不同,记者此行的目的地,山西省临汾市永和县,一直“走”得很慢。
这里面积不大,自西汉芝县以来,隋改名为“雍和”,历史悠久。 根据公开资料,永和市登记人口不足5万。 迄今为止,还没有火车服务。 2016年底高速公路正式开通后,从永和到临汾至少需要两个半小时车程。
很难想象,在这个耕地贫瘠、交通受阻、产业薄弱的县城,AI(人工智能)为当地打开了一扇新的窗口。 自2020年8月3日以来,全县已有100多名女性加入永和县偶像科技***,从事数据标注员的工作。 手中的计算机成为数字经济的一部分。
数据标注员是人工智能发展下的新职业。 智能训练软件通常用于AI产品实际使用中的数据库管理、人机交互设计、性能测试跟踪等辅助操作。
四年来,这些偏远县城从事数据标注的女工,在容貌、衣着、言语、思想,甚至家庭状况上都发生了翻天覆地的变化。
2023年世界人工智能大会数据标注员合影 受访者提供。
标记。 在县城里,结构最稳定的是家,最中心的部分也是家。 过去,永和对女性最大的期望和赞美,就是生儿育女,做一个好妻子、好母亲。
而现在,在主街的尽头,一幢标有“永和人才基地”的低矮建筑里,坐满了化着各种精致妆容的女人,面对着台式电脑,挺直的脊背,双手灵巧。 大房间很安静,除了快速的键盘敲击声和鼠标点击声。
永和县偶像科技***数据标注员正在工作。 照片由受访者提供。
他们从事数据标注员的职业,也称为AI培训师,他们通过标注、框架、排序等方式对文本、图像和声音进行标注,为AI喂食,让AI更智能。
至于数据标注到底会用什么,就连项目经理王丽娜都说不出来,“有的做多了,能猜到一个粗略的想法”,比如让地图更准确,自动售货机更准确。
这家在县里看似“突兀”的公司,起源于蚂蚁集团、浙江蚂蚁公益协会、中国妇女基金会于2019年发起的“AI豆计划”数字产业扶贫项目。 在国家卫健委的协调下,永和成为该项目在欠发达县的第二批试点。 在项目的第二年,成立了数据标注公司。
主力是马宝。 冯秦是最早的员工之一,也是其中之一。 她今年40岁出头,身材不错。 当她用手在屏幕上画框并讲解贴标的步骤时,纤细的手指和鲜艳的指甲都引起了记者的注意。
*,汽车,时尚。 冯秦如同珍宝一般,一举一动,在西部欠发达地区,丝毫没有孤立感。“职业女性”和“两个女儿的母亲”的气质巧妙地融入了她身上。
如果愿意工作,一个月挣五六千不是问题,也不比在外面打工差。 冯秦没想到,在永和,工资能达到这个数字——数据标注行业基本工资很少,计件工资是中流砥柱。 她记得,第一个月她不精通业务,收入超过3000元。 ”
永和县清晨。 超新闻记者谢丹英摄。
经济基础决定了家庭的地位。 王丽娜发现,在这四年的工作中,夫妻俩的地位逐渐趋于平等。 她的丈夫在家务上从未碰过她的手,现在她会在她忙于工作时帮忙照顾孩子和做饭。 三年的疫情,让很多可以在家工作的女性数据标注员,第一次成为小家庭的养家糊口者。 “吵架少了,没有闲暇时间,赚钱很重要。 ”
在空闲时间,他们花在“变美”上——纹身眉毛、染发、做指甲和买新衣服。 县里没有商业综合体,就和三五个小妹妹约好了,周末或节假日开车去临汾。
有时满载而归,一个月的工资被结清。 冯秦坦言,有这份工作让他们敢花钱,“顶多加班几天就能把钱赚回来。 ”
不知不觉中,各种数据标注项目都积聚了他们对世界的广阔想象——曾经做过旅游相关标注业务的王岚兰,搜索了不少关于西湖、乌镇等景区的信息。 “它很漂亮。 坐在电脑屏幕前,她仿佛看到了1400公里外的浙江的样子,“以后有机会就想去那里! ”
变形。 因为这份工作,2023年4月,王丽娜和冯琴作为“AI豆计划”永和项目代表,受邀参加蚂蚁集团首届“数字花木兰”女性发展年会,飞到杭州,在那里“学到了很多新东西,结识了很多新朋友,玩了很多地方”。
也正是因为这份工作,他们平时都在幕后打标数据,2023年7月,他们赶到上海世博展览馆,一睹世界人工智能大会的盛况。 “以前,我只知道我在为人工智能工作。 这一次,我终于知道了最新的大模特在做什么。 机会来之不易,当时王丽娜已经怀孕7个月,肚子很大,她不愿意缺席。
2023世界人工智能大会上,王丽娜(左一)和冯琴(中)正在听取相关负责人介绍受访者提供的照片。
一切都是以前的永和女人想不到的。
据当地人介绍,山西临汾市的主煤产区、铁矿资源区和小麦产区都“路过”永和。 直到2015年,永和才检测到天然气,几家加油站成为当地男性劳动力的主要雇主。
走在永和街上,除了老人,县城里的人物大多是妇孺。 “永和家的劳动分工最为普遍:男人出去开大货车,一个月挣七八千; 妇女留下来照顾孩子。 永和县偶像科技负责人李林峰说。
离开工作岗位,成为家庭主妇,是永和大部分女性角色的缩影。 不少女性数据注释员告诉记者,就算家里有老人帮忙照顾孩子,女性也有时间,但县城本身太小,找工作也不容易; 超市店员、餐厅服务员等工作机会少,月收入不超过3000元。
以前靠丈夫在外面打工挣钱,送孩子上学后,她的生活不是打牌就是缩短**。 王丽娜坦言,当年县里有的棋牌室甚至直接开在学校旁边,针对这些母亲群体。
永和姑娘**丹,谈起自己成为数据标注员之前的生活,尤其是生完孩子后,眼眶湿润,“她整天什么都不做! 丈夫朋友的一句话让她感觉像是喉咙里的鱼,每天做饭、洗衣服、给孩子喂奶,“你为什么说我什么都没做? ”
还是那个小县城,据说比四五年前“繁华”多了。 在主要街道上,有一个蜂蜜雪冰城,每个周末,附近的中小学生都可以买到店里所有的冰淇淋。 记者到达时,主街两旁缠绕着行道树的红灯笼还未摘下,星星红红的,透露着小镇的欢乐与活力。
行道树还没长出绿芽,大年红灯笼高高挂在树上。 超新闻记者谢丹英摄。
对于移民县妇女来说,她们在身份认同上更加困难,面临着“进不了城,回不了老家”的尴尬。 通过数字化就业,他们实现了工作与生活相结合的新型城镇化。 “蚂蚁集团相关负责人表示。
据悉,永和县偶像科技是一家县属国有企业,由国家卫健委、永和县、人力资源和社会保障局、蚂蚁集团共同支持,现有员工110人,目前是永和县最大的就业企业,平均月收入4000元以上。 公司员工90%为女性,60%以上为近两年外地归来。
提前。 2023年以来,ChatGPT诞生,AI受到前所未有的关注,整个行业开始加速。 但黄土高原上的女工们,依然活在自己的节奏里,紧张而舒适。
数据标注已经不是一个行业了很长时间,它的起源可以追溯到 2012 年。 从一个新概念到2020年被国家正式列为新兴职业,历时8年。
刚开始,数据标注工作质量不高,可以通过反复装帧来实现项目需求。
近年来,自动驾驶的发展带动了数据标注市场。 根据德勤的报告,2022年自动驾驶领域对标签的需求占整个AI下游应用的38%,预计到2027年将占52%。
智能驾驶 来源:视觉中国。
自动驾驶需要高水平的数据标注,因为它需要接近 100% 的准确率。 业内人士坦言,大多数人工智能产品对模型准确率的要求都高于90%,但当精度想要从90%提高到95%,或者从95%提高到更高一点时,对背后的数据量的要求可能是几百万甚至几千万。 “精度要求越高,需要的数据就越多,这意味着数据标注的数量也增加了一倍。 ”
今年大型模型的兴起,给数据标注行业又添了一把火。 基于大模型训练场景的大量订单纷纷涌向数据标注企业,再次为枯燥乏味的数据标注业务注入活力。
于是,一些科技公司走在了前列,尝试利用AI自动合成数据进行AI训练。 合成数据基于少量真实数据,由AI无限生成,无需标注,不再依赖人工标注。
在他们的愿景中,合成数据将在未来取代手动注释。
没有技术、仅依靠人力的标签公司将被逐步淘汰。 据数据显示,国外用于人工智能的基础数据中有70%是合成数据,这条路径正在得到验证。
*Dan 正在做注释工作,由受访者提供。
李林峰告诉记者,公司目前没有受到太大影响,因为公司本身源于扶贫项目,具有公益性质。 过去四年,收到的业务订单一直比较稳定,大部分来自蚂蚁集团内部,或者说蚂蚁集团作为枢纽,为这些小型县级企业从其他公司引进业务。
整体来看,我们的业务量在增加,但与此同时,贴标业务的难度也在增加。 在李林峰看来,200人的标签公司是永和县的天花板。 目前,已经开始对高学历或专业员工有需求,比如金融、医疗专业的年轻人,除了极少数,并不是所有的女性职工都具备自强不息的能力和愿望。
为什么我在一些票务软件上找不到从临汾到杭州的直飞航班? 记者的遭遇,引发了几位数据注释者的热议。 他们最近负责了一个文化旅游项目,该项目通过注释使导航更智能,地图更准确,推荐更智能。 经过反复搜索,我们发现需要准确搜索“耀都”才能每天预订一次直飞航班,“看来地图AI推荐的准确性有待提高,我们正在做的项目需要进一步推广! ”
电脑屏幕上的文字,**一一闪过,间隔以秒为单位计算,让别人眼花缭乱。
*请注明出处”。