湖北老河口警方帮助迷途老人回家
(来源:极目新闻)4月5日,湖北老河口警方快速反应,及时帮助一名迷路奶奶回到家人身边。5日下午3时许,张集派出所民警在镇工作群中发现一则
本文转自:https://zhuanlan.zhihu.com/p/620334140
之前我在这篇文章(OpenAI 研究人员发文称「约 80% 美国人的工作将被 AI 影响」,如何看待这一观点?)中介绍了OpenAI的工作论文,那篇文章研究了GPT对于美国职业的替代。
(资料图片仅供参考)
那篇文章的各个版本在这两周的自媒体中广为流传,但需要注意的是,OpenAI的研究是对于美国职业来说的,中国的劳动力市场和美国有不少差异。
因此最近两周,我们使用中国在过去8年的数亿条招聘数据完成了这个研究,看中国哪些职业最有可能被GPT之类的大语言模型和其衍生品替代。
具体结果可以在微信小程序的“数据团+”里面看到(没错就是之前计算疫情达峰过峰的那个小程序)
分析不同职业被GPT替代的可能性,需要对每种职业的职能和具体工作进行分拆。
比如你笼统地问,“人力资源专员”这个职业,被GPT替代的可能性有多大呀?
这类问题就不好回答,因为太模糊了。
但是你可以根据招聘网站的情况,将“人力资源专员”给分拆成不同的职能,比如
1, 新员工的招聘,员工入职手续办理2, 安排以及开展新员工入职培训3, 考勤及工资绩效的核算4, 维护和拓展公司招聘渠道,协助社招及其他招聘活动
去问其中一个职能,例如“安排以及开展新员工入职培训”,人力资源专员工作的这一部分有多大可能被GPT替代,就直观了一些。
我们还可以继续分拆,把“安排以及开展新员工入职培训”,进一步分拆成下列具体工作内容——1,撰写、准备培训材料;2,交流、沟通并安排计划时间表;3,演讲、培训,提升员工技能……
再问其中每一个具体工作,
撰写准备培训材料,GPT可以替代多少?
交流和沟通安排时间表,GPT可以替代多少?
演讲培训,GPT可以替代多少?
我们用O*net的数据,将中国的职业映射到O*net,再分拆成19265条工作任务和23534种工作内容。
这么分拆下来,每一个职业拆分研究,再汇总,那么我们对每一个职业中有多少部分可以被GPT替代,就比较有把握了。
分析每一种具体的职能和工作内容被GPT替代的可能性。
但是,要分析19265种工作任务,23534种工作内容其中的每一种被GPT替代的可能性有多大,也是一个非常繁重的工作。一般来说我们会让人工来打标,这么四万条内容全部打标,大概一个人就需要1周,一个人力的成本就要至少1万元。这已经是最低的价格了。
但我们知道,在对美国研究的工作论文中,OpenAI的工作论文提出了一种重要的方法。那就是让GPT来打标。
那我们何不也用GPT来打标呢?
于是我们用了GPT的API,让GPT扮演打分者,大概是这样的prompt:
你是一名“大型语言模型替代劳动力评估师”。大型语言模型,是一种用于处理和生成自然语言文本的深度学习模型,最新的大型语言模型能够基于自然语言文本生成、描述创建图像与视频。在这样的背景下,你需要从“该任务是否能够在大语言模型帮助下,在同样时间达成同样产出或者同样效果的前提下,减少人类劳动时间的参与”的角度,给下列每一个任务打分。评分从0到5分,0代表该任务不能通过大语言模型的帮助减少人类劳动投入,1代表可以减少20%人类劳动投入,2代表可以减少40%的人类劳动投入,3代表可以减少60%的人类劳动投入,4代表可以减少80%的人类劳动投入,5代表可以减少100%的人类劳动投入,即该任务不再需要人类劳动参与。你的评分,代表着大语言模型可以在每一个任务中节省多少比例的劳动投入,请根据当前大语言模型的进步情况和你认为未来可能的发展状况,谨慎评分。请按照“id,评分”的格式,每一行返回一条任务的评分结果。
这段算是API里面system部分输入的内容,然后在内容部分输入具体的工作任务和工作内容,GPT就会刷刷返回了,一次可以输入100条,gpt-3.5-turbo的返回很快,一屏幕一屏幕的0-5的分数就这么回来了。
说实话,在看到这一屏屏的分数出来,知道这是GPT在为自己能多大程度上替代人类劳动打分,有种审判日到了的感觉。
由于任务已经被拆解得比较细致,对于每一条任务的打标将会十分准确,稳健性也极高。更重要的是,使用GPT打标,成本之低令人发指。标注4万条内容,每次标注100条,只需要400次,一次标注和返回大约在4000token左右,且主要内容是在prompt中,使用GPT-4的模型,每标注100条,仅需要0.12美元。也就是说,共标注4万条内容,只需要耗费48美元。如果使用不那么精确,但速度更快且更便宜的gpt-3.5-tubo模型,4万条只需要耗费3美元。在这样简单的任务上,GPT-4和gpt-3.5-turbo的表现几乎没有差异。
人类数据标注员要完成4万条内容的标注,需要至少1万元,一星期。
GPT只需要半小时,3美元,合20元人民币左右。
而两者的质量是几乎一样的。
因此,很难不再次强调一遍这样的事实——
刚刚出现没几年的全新职业——人类标注员,他们喂养出来的大型语言模型GPT,在完成一项“GPT能够替代哪些职业”的标注工作任务时,首先替代掉了把GPT训练成材的人类数据标注员自己。
将标注结果汇总到职业层面
使用下图的流程,我们将每一个具体工作被GPT替代的可能性汇总到每一个职业上。
就能得到中国所有职业被GPT替代的可能性了。下表是招聘规模比较大的职业被GPT替代可能性的前25名和后25名:
上表的这50个职业,可以理解为未来职业发展的晴雨表。
AI替代率最高的职业是翻译,其次是保险核保专业人员以及剧作家。这三个职业,有90%以上的工作任务和内容都暴露在AI替代的风险中。
接下来,视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师,这些与美术、视频、作图相关的职业,被AI替代的工作内容也超过了80%。
文字编辑、网络编辑、文学作家、文字记者,这些与文字生成和修改高度相关的职业,被替代的工作内容也超过了75%。
呼叫中心服务员、前厅服务员(即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员)、节目主持人、秘书……这些职业,也出现在了前25名中。
不过最出乎意料的可能还是排名第25的计算机程序设计员,平均来说,程序员有75%的工作内容,面临被AI替代的风险。
AI替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外,因为我们让GPT评分标注时扮演的角色就是“大型语言模型替代劳动力评估师”,它自然无法评估可能被其他机器所替代的职业。但仍然有几个制造业工人以外的人员值得注意——绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师……看起来并不需要太高学历,工资也不算最高的这些职业,反而成了最难被AI替代的职业。
容易被替代的职业都有什么样的特征?
在OpenAI的那篇工作论文中,研究者发现了稳定的正相关关系——工资越高的职业,被GPT们替代的可能性越高。这个趋势在年收入大于10万美元的职业之后才区域相反,见下图。
但在我们的研究中,在中国,每个职业能够被GPT替代的程度和该职业的收入却并没有相关性,见下图:
但是,每个职业除了工资以外,还有一个重要的参数——成长性。
“成长性”是我们另外计算的一个数据,是使用分经验年度的招聘岗位数据,计算跨年度的经验-工资差异得出的。
举个例子,A岗位,在2018年时,市场上对0年经验需求的招聘岗位平均工资为5000元。2019年时,市场上对1年经验需求的A岗位招聘平均工资为6000元。
不难发现,2018年0年经验的这批人,和2019年时有1年经验的这批人来自同一个队列。因此,6000÷5000=120%,就是同一个队列的人口,从2018到2019年,0到1年经验带来的工资增长倍数。
我们算出所有年份,包括2015到2016、2016到2017……2020到2021、2021到2022这样7个0到1年的经验带来的工资增长倍数,再按照招聘人数加权求平均,就得到了A岗位在过去8年时的0到1年经验带来的工资增长倍数。
用同样的方法,我们再一次算出1到2年的工资增长倍数、2到3年的工资增长倍数……8到9年的工资增长倍数。将每一年的工资增长倍数连乘,就得到了这个岗位从0年经验到9年经验一共10年工作的工资增长倍数,将这个倍数再开九次方,就得到了这个职业的“成长性”,即每增加一年工作年限,工资可能上升多少。
那么,从业年限的工资增长率,即这个工作的“成长性”,和每个职业的AI替代率之间存在什么关系?
可以看到,各职业的AI替代率,和每个职业的年限工资增长率有着非常显著的关系,两者之间存在正相关的显著性水平在0.001以下。如果我们将上图改为分段柱状图,我们将可以看到更明显的趋势。
从上图可以看到,每增加一年从业年限工资增长最慢,低于8%的职业,相对最不容易被AI替代的。但如果一个职业每工作一年工资增长超过20%,被AI替代的可能性平均将大于60%。
这个趋势,说明的是在本轮大语言模型和其衍生出来的相关AI的一个显著特征,那就是人们在一个行业上积累的经验、学到的技巧、掌握的诀窍,是被大语言模型首先替代掉的东西。
被GPT们替代掉的,究竟是什么?
“成长性”越高的工作,越容易被替代,这说明什么呢?
第一种可能,是因为那些学习、工作后能积累更多经验,提高更快生产率的职业,本身更贵,因此更促使人们去找到能替代这些职业的AI,给这样的AI产品更大的投资,因此这样更贵的劳动力就成了第一批牺牲品。
这样的说法初看有道理,但我们也能找到很多反例。最大的反例就是自动驾驶。一方面,驾驶这个技能,人们学习几个小时至多十几个小时就能掌握;另一方面,自动驾驶领域投资在人工智能行业内数一数二,但目前的效果距离全路况自动驾驶依然有很长一段距离。
反过来,一些生物、化学方面的技能,化合物寻找、蛋白质折叠,或者是在实验流程上的全自动化,这些人们需要数年专业训练才能掌握的知识,尽管资本的介入比起自动驾驶只能算九牛一毛,却已经有了非常不错的替代AI。
从这点看,因为某职业劳动更贵——为了节省这些劳动力而更多投资AI——更容易造出替代这些职业的AI,这样的逻辑似乎是行不通的。
因此,我们不得不考虑第二种可能——AI确实已经实现甚至超越了人类通过后天的实践学习知识、积累经验和诀窍的技能。
是的,有必要再强调一遍,不是单个技能,也不是一组技能,而是那种通过艰苦的学习实践来获取知识、积累经验的技能,人类已经落后于AI。那些高成长性的职业,不管现在是否还处在安全区,出现替代AI,也许就是这几年,甚至几个月之内的事。
到头来,那些人类孩提时期甚至出生时就已经掌握的技能,那些精巧的人类生物学本能,似乎反而是AI最难模仿和替代的部分。
而那些后天学习到的知识,花上好长时间学会算术、学会写作,学会画画,学会编程、学会做好看的ppt、学会看X光片、学会写法律文书,学会很多种语言并且自如地交流……人类学会了各种各样以此为傲的东西,并觉得这些特征似乎使人类和其他生物产生了哲学上的差异。
但在AI看来,这些东西一文不值。
关键词:
(来源:极目新闻)4月5日,湖北老河口警方快速反应,及时帮助一名迷路奶奶回到家人身边。5日下午3时许,张集派出所民警在镇工作群中发现一则
1、橘子良品是上海界虹实业有限公司旗下著名的清洁日化品牌。2、作为一家专注于提供高端家居民生离不开的日化家居产品的品
杜绝违规作业+盲目施救!鹤山工友有限空间作业要注意这些事~
国家外汇管理局4月7日发布数据显示,截至2023年3月末,我国外汇储备规模为31839亿美元,较2月末上升507亿美元,升幅为1 62%。资料图新华社记者刘开
大家好我是指尖,有些英雄会随着版本变动而逐渐淡出大家的视野,有备受关注的,也有默默离开的,在看是数据的时候发现了个英雄挺有意思,明明
图为厦门山海健康步道。胡康强摄提升城市品质是社会治理的重心,也是与居民群众息息相关的民生重点。如何有效破解旧城区的改造难
双子座的朋友能给人们带来无穷的欢乐跟乐趣,能让在最短的时间忘记痛苦,振作起来,近段时间内和他们在一起,你会发现这个时间上美好的事情实
1、1 anumberof一些修饰可数名词,就像some,many,lotsof,alotof那样的。2、
1、三国电视剧目录:每个都是故事1桃园三结义2十常侍乱政3董卓霸京师4孟德献刀5三英战吕布6
封面新闻记者代睿4月7日,封面新闻记者从水利部了解到,日前,水利部部长李国英率代表团出席在老挝万象举行的湄公河委员会第
1、String类型转换为long类型是l=*** parse***(s);其中l为long类型,s为String类型如
据俄罗斯卫星通讯社4月7日报道,土耳其多安集团(DoganHolding)表示,俄罗斯鞑靼石油公司以2亿美元价格收购了土耳其一加油站连锁,加
泰康人寿伊春中支两宗违法被罚内控制度执行不到位等
1、红油腐乳笋材料:小竹笋,红油腐乳,糖,料酒,水制作过程:炒锅烧热加少许油,油热将笋放入翻炒几下。2、将
同花顺(300033)金融研究中心4月7日讯,有投资者向紫光国微(002049)(002049)提问,请问公司是否涉及EDA开发业务,若是有,这部份整体营收占
小伙伴们,超人气手游《看不见的真相》荒野喜轿完整通关攻略来了,小编今天要讲得是一个发生在荒郊野外的嫁娶的喜轿故事,游戏《看不见的真相
1、雅培菁智,是雅培的超高端奶粉品牌,欧洲原罐进口。2、品牌旗下共拥有2大系列产品,有机系列和纯净系列,分别拥有欧盟有机
【CNMO新闻】4月7日,荣耀官方宣布,荣耀MagicBook14系列新品发布会将于4月13日14:30正式举行。荣耀笔记本“三叉戟”集结中!在去年荣耀的秋季
四川经济网近日,交通银行新市民主题信用卡正式上线,该卡结合新市民需求,在出行、购物及消费等方面提供多项活动,切实让利消费者。我国约有3
美食的制作作文600字第1篇我做过很多事,但是令我最难忘的一件事就是炒饭,接下来我给你们讲讲吧!一天早上,妈妈早早的就给我做好了一盘香喷
人力资源和社会保障部近日发布《关于开展2023年高校毕业生等青年就业创业推进计划的通知》(以下简称《通知》),要求各地充
近日,永州市市场监管局印发《制止餐饮浪费专项行动实施方案》(以下简称《方案》),成立制止餐饮浪费专项行动领导小组,组织在全系统开展为
【服务动态】中工网讯(工人日报-中工网记者黄洪涛)3月30日9时55分,在江苏省南京市雨花台区市场监管局雨花分局,个体经营者张康从江苏省市场
1、1、颜色区别2、红酒是葡萄酒的一种,颜色单一,只有纯正的红色,而葡萄酒的颜色丰富,除了红色之外,还有白色、桃红等多种
记者从中国电科成都多家单位获悉,网上有关“中国电科陈志龙”的信息,均为虚假信息。集团公司所有单位已经开展了多轮次排查,包括劳务派遣和