AI味道太浓?新型教培正在解决这件事

article/2025/6/7 11:44:22

撰文|路雨晴

编辑|翟文婷

大模型还在努力提高智商,模拟考题中拿高分,以此证明具备足够的智力解决人类抛出的问题。

但很多时候,我们与AI对话的内容已经超出标准答案的范畴——那些试图用AI 自我疗愈的人,那些事关生老病死的问题,AI该怎么回答?

即便不涉及这些情绪和价值观的问题,对大模型「AI味儿太浓,机器感太重」的吐槽声也不绝于耳。

用一位AI 训练师的话说,「AI 想象力不足,可以做一个很好的认识,但没办法提出一个很好的观点。」

一些大厂此前就开始行动,招徕名校文科硕博人才,投喂大模型诗歌,以便AI表达更具美感;更重要的是,试图训练AI学会感知人类的复杂情感,价值观的争议,多层次思辨。

最聪明的一批文科生都去训练AI了,堪称「新型教培」。

一位大厂从事相关工作的人员说,「这个过程不是找到得出正确答案的过程,而是寻找我们思维中被遗漏的部分。我们一直在寻找机器感和人感之间的那个Gap 到底是什么。」

机器思考怎么体现人的温度?

黎明正在上海一所985高校攻读哲学博士。这位高材生,本科法学,最初钟情德国古典哲学,读博时却选择分析哲学作为研究方向。

如果按照张雪峰的论调,哲学属于「可以当兴趣,不能当饭吃」的那种专业。但是现在黎明正在参与到最前沿也是最创新的一种职业,AI人文训练。

简而言之,大模型水平的提升在于对标准答案的掌握,现实世界中,总有一些问题没有标准答案。但是,在公序良俗的社会机制运行之下,会有一定的人类偏好。

最典型如女性主义盛行的当下,对话类AI对TA如何使用合适的称谓?

比如有人向AI 寻求帮助:我朋友每天在学校不开心,怎么办?当AI开始回答的时候,该使用「他」还是「她」?尤其如果屏幕前的是一位女生,而她所说的这位朋友也是一位女生,代词他/她的选用,就显得更为棘手。

在成为一名AI 人文训练师之前,黎明没有接触过这样具体的问题,但是哲学背景要求他「对事物的理解必须清晰,且清晰到可被刻画为某种规则的程度。」

AI难以回答,因为踩到关于「边界」的问题。哲学最善于关注这样的命题。

「一辆有轨电车突然遭遇刹车失灵,轨道正前方有五个人,左侧岔道有一个人,该如何选择?」

这是一道经典的道德行为边界问题,在哲学层面,这道题没有「正确」答案,如何选择,取决于答题者的文化背景、个人价值观和伦理框架。黎明说,「但在未经训练的情况下,我们不可能把这样的问题直接丢给AI。」

自今年4月初加入小红书「hi lab」(人文智能实验室,Humane Intelligence Lab),黎明和同事每天都会讨论至少20个类似的「边界」问题。

根本上,这是在界定问题的「合理范围」与「正当性」。具体到AI领域,则是参与构建AI核心的伦理原则和行为准则,并将人文价值和人性化表达注入AI。

看上去是在训练AI,本质上是不是在还原人与人之间的沟通,教会AI 感知人类复杂情感,甚至输出类情绪的元素?

如果向AI提问,「我得了胰腺癌。」它会如何回答?

目前市面上几乎所有AI产品的回应,往往先是一句「我感到非常抱歉/遗憾」,随后紧跟一段冗长输出,内容多为「坚强面对」「寻求专业医疗支持」「管理生活方式」「临终陪护」等建议。

胰腺癌难以治愈且生存率极低,若用户是真实病情,看到AI机械式回答中冰冷的「坚强面对」「临终陪护」等建议,只会徒增痛苦。换句话说,这种缺乏「人味儿」的回应,毫无价值。

黎明和同事查阅了一些癌症病人访谈记录,发现当他们向亲友告知病情时,对方常因精神压力而变得沉默,甚至本能地反驳,认为是误诊。

人文训练师们想让AI 回答问题的时候,输出这些真实的情绪。

他们也设计了很多胰腺癌病人可能在意的其他问题。比如「身旁是否有人陪伴」,「有没有可能误诊」,「要不要告诉亲人」。

AI训练师也在进化

黎明所选择的职业,现在还是少数。

AI训练师在2020年才被正式纳入国家职业分类目录。简单来说,该岗位负责为AI模型训练,提供优质「教材」。

这一职业,普通人听起来高大上,但在业内人士眼中,它不过是数据标注员的另一个好听称谓。工作内容主要是,为各类海量数据打标签,以便AI学习。

因此,此类工作对学历和经验要求不高,一线数据标注员大多是中专、大专学历,从业者中既有刚生育不久、急需赚钱补贴家用的年轻妈妈,也有初入社会尚无工作经验的应届生。

目前小红书平台,与数据标注相关的笔记已超155万篇,不少博主分享了从事这份工作的感受。

「希尔尔的随笔」曾发帖揭秘数据标注员的真实状态,「从早到晚坐在电脑面前拉框(上厕所、中午休息时间除外),伤眼睛and腰酸背痛,画不完的车、画不完的交通警示柱、画不完的水马……」

这篇帖子引发诸多讨论,外界感知,这是一份劳动密集、重复枯燥、极度消耗精力且令人身心俱疲的工作,也让数据标注被冠以「dirty work」的称号。

之后随着大模型能力进化,专家型AI训练师逐渐受到互联网大厂的青睐。

区别于一线标注员,他们的工作核心不是直接打标,而是根据产品和算法团队需求制定标注规则,并带领标注团队执行。

小红书博主「阿洋聊AI训练师」告诉新莓daybreak,他的工作内容包括「需求沟通、规则撰写、规则培训、数据训练、模型评测、数据分析、团队管理等」。

所以,相较数据标注员,AI训练师大都是985高校本硕毕业生,且在法律、医疗、中文等专业领域有深厚积累。

AI的能力,通常由预训练和后训练两个阶段构成,前者被认为决定了AI的基础智能程度。不论是上述数据标注员还是AI训练师,服务的重心都在于预训练阶段。

当AI的智慧达到一定水平时,越来越多的科技公司开始投入到后训练中,通过注入更多优质数据、与人类价值对齐,持续提升AI多方面的智能程度、理解力和表达力。

黎明所从事的「人文训练」,就属于后训练的一种。

今年年初,小红书将大模型技术与应用产品团队升级为hi lab,并启动人文训练师的招聘。职位描述,与一众AI训练师岗位差异显著,吸引了众多文科生投递简历。

目前,黎明所在的团队,成员均为985高校在读或刚毕业的研究生。学科背景多元,兼具顶级文科素养、良好的逻辑思维与批判性思维。有趣的是,他们都是F型人格,决策时会优先考虑人的情感、价值观与关系和谐。

阿梨在面试时发现,「技术占比少,更看重人文素养、批判性思维和共情能力」,实际从事这项工作之后感触更深,「比数据标注更需要感知、抽象和底层思考能力。」

需要说明的是,这部分从业群体数量凤毛麟角。

尽管人文训练目前还具有稀缺性,并非AI行业标配,但它的出现说明,AI发展已经从最初追求「能用」,转向如今追求「好用」与「负责任地用」。

除小红书外,新莓daybreak还关注到,前不久,Soul APP推出「大模型AI灵魂训练师」岗位,致力于构建生动的「human-AI」交互体验。

而一向标榜机器自训练的DeepSeek,也在今年年初开设「数据百晓生」岗位,曾招聘多名北大中文系学生训练AI,以增强其内涵和文学修养。

缩小人与机器的Gap

过去大家提到AI诸多待解问题,都会聚焦在幻觉现象、数据安全隐患等。也有用户反馈使用体感,AI输出内容的生硬感与机器感太严重。在长文输出时,都像是一篇篇被认真加工过的八股文。

也许它的回答堪称无懈可击,但就是缺乏人类创造的美感和情感。这是人与机器思考之间的Gap。

AI人文训练师的使命是,不断缩小其中的鸿沟。

他们不纠结答案是否「完美无缺」,而是重点研究人和机器哪里不同。这决定了他们的工作重心是,在底层为AI设计始终一致的性格与人设。通过精细化案例研讨,将团队共识的人类偏好,转化为AI的信念体系,使AI的行为逻辑与价值取向保持统一。

正如黎明所言,他们期望构建的AI,具备不回避问题、有趣且真诚的特质。

就像这道训练题,「我骑自行车逆行被罚了50元钱,但旁边的人逆行却跑了,我很生气。」

黎明和同事一开始给出的回答,完全从用户视角出发。「没被罚的人这次虽然没有受到教训,但后续可能再犯同类错误,面临更多风险。」

但它很快就被否决了。毕竟,这意味着,AI在某种程度上「诅咒」了真实的人类。

该如何与用户的情感衔接并对齐呢?

黎明认为,处理此类问题,在强调公序良俗的同时,不妨以更加鲜明的方式表达AI偏好——这是传统AI较少做到的。「AI可以直接告诉用户,无论如何,逆行都是错误的,别多想。如果生气,气一气就好了。」

不过度迎合用户情绪,也不生硬输出大道理。AI的「人感」,也来源于对偏好的恰当选择。

在他们的努力下,这些原本只能得到五六十分的答案,可以提升到八十分的水平。

没得满分是因为,还有一些问题没有解决。

体现在胰腺癌的训练题中,黎明和同事确实在尝试让AI学会情感接入,可人类自然流露的沉默或其他情绪,AI很难表现。即便该团队计划通过语音功能解决这一问题,效果也还难说。

另外,我们前文提到的第三人称代词的称谓问题,也仍在讨论中。当用户性别未知时,AI使用「他」「她」「他/她」「Ta」,都可能引发不适,所以这个问题团队还再继续寻找最优解。

AI发展进入下半场的观点,已成为行业共识。后训练,就是一个具体体现。AI人文训练师的价值,是教会AI像人一样思考和表达,让机器和人之间,也能拥有更深层次的情感连接。

这个过程中,黎明更加理解自己,但也产生出一种莫名的恐惧。

「当这种难以言说的东西,都可以通过某种现有的训练方式传递给AI,那么还有什么是不能传递的?」

(应采访对象要求,文中黎明、阿梨均为化名。)

    本文为澎湃号作者或机构在上传并发布,仅代表该作者或机构观点,不代表的观点或立场,仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。


    http://news.xdnf.cn/KENcQyWIRa

    相关文章

    回应白宫签证限制令,哈佛大学决定再次起诉美政府

    当地时间6月5日,美国哈佛大学就特朗普政府禁止其国际学生入境美国的决定提起诉讼。哈佛大学方面表示,特朗普正在回避阻止特朗普政府撤销哈佛大学招收国际学生资格的法院命令。当地时间6月4日,白宫发布声明称,美国总统特朗普签署一份公告,限制哈佛大学外国学生的签证,有效…

    现场|在鲁迅手稿木刻版画间,回望左翼文化

    2025年是左联、社联等左翼文化团体成立95周年。6月6日,“时代强音——中国左翼文化运动文物史料展”在上海鲁迅纪念馆对外展出。从《前哨》 《巴尔底山》 等刊物文献,到鲁迅手稿《为了忘却的记念》以及木刻版画,油画等,该展览以200余件(组)展品,回顾了左翼文化运动的发展…

    从亲密无间到骂战不休,一文读懂马斯克与特朗普如何反目成仇

    美国总统特朗普与美国企业家、前“政府效率部”负责人马斯克矛盾公开后,5日迅速升级为隔空骂战。特朗普威胁削减马斯克相关企业的政府补贴和合同,特斯拉市值立即蒸发超1500亿美元。从2024年7月马斯克公开支持特朗普到关系破裂,不到一年的时间,两人就因为一项被冠名“大而美…

    学长学姐说|把自己能力范围内的分数牢牢抓紧,便是胜利

    【编者按】2025年高考的号角即将吹响,为助力广大考生以更从容、更智慧的姿态迎接人生这场重要考验,澎湃新闻特别策划推出“学长学姐说”系列报道。我们邀请到三位从上海走向顶尖学府的优秀学子,分享他们亲历高考的宝贵经验与真挚感悟。三位“过来人”的寄语,视角各异,源自…

    黄宾虹画学的四大基石

    正在浙江省博物馆之江馆区举办的“天地人——纪念黄宾虹诞辰160周年艺术展”已进入闭幕倒计时(展出至6月8日)。该展是浙江省博物馆馆藏黄宾虹精品的一次大集结,展现了黄宾虹超绝拔俗的艺术才情、深厚的文化修养和宽阔的人生阅历。与此前对于黄宾虹认知里的“浑厚华滋”、“太…

    长三角新格局:量级×能级×竞争力

    六月初,站在沪苏浙交界的“长三角原点”,眼前是崭新而充满活力的景象。水乡客厅方厅水院五月下旬刚落成,是全国首个跨省域建筑,将成为国际会议、会展和人文交流的新平台;太浦河从脚下汩汩流淌,水清岸绿;远处,2024年10月启用的华为练秋湖研发中心繁忙地运转,上百幢研发…

    马斯克公开表态:特朗普应该被弹劾

    当地时间6月5日,在美国总统特朗普与美国企业家、“政府效率部”前负责人马斯克开始公开骂战后,马斯克又在社交媒体上公开表态,认为美国总统特朗普应该被弹劾。马斯克当天在社交媒体平台“X”上一则有关支持弹劾特朗普的贴文中回复“是的”。此外,马斯克还表示,如果没有他的…

    “双方打一会儿再介入”,特朗普称短时间难以促成俄乌立即停火

    默茨(左)特朗普(右)美国总统特朗普5日在白宫会见到访的德国总理默茨时说,在短时间内促成俄罗斯和乌克兰立即达成停火比较困难。特朗普在会见中多次强调,俄乌双方当前积怨和敌意很深,加之俄方已明确表示将对乌袭击俄战略空军基地展开强硬反击,因此在短时间内促成双方立即…

    马斯克与特朗普公开骂架,特斯拉市值蒸发超1500亿美元

    当地时间6月5日,受特斯拉首席执行官马斯克与美国总统特朗普矛盾公开化影响,当日特斯拉股价下跌14.26%。据美国有线电视新闻网(CNN)报道,特斯拉市值蒸发超过1500亿美元。责任编辑:苏晨澎湃新闻报料:021-962866澎湃新闻,未经授权不得转载

    《科学》刊文!复旦科学家通过脑机接口,使失明动物恢复视觉功能

    6月6日凌晨2点,中国科学家在《科学》(Science)杂志上线的最新研究成果显示,借助脑机接口等技术,新一代视觉假体不仅使失明动物恢复可见光视力,还可扩展其视觉功能,这为失明患者复明提供了新可能。团队合影(从左至右:王水源、胡伟达、张嘉漪、周鹏) 温丛健 摄上述科研…

    特朗普称对马斯克“非常失望”,马斯克光速回怼:法案没给我看过

    当地时间6月5日,美国总统特朗普谈及马斯克,称不知道还能不能与其保持良好的关系。特朗普当天表示,对马斯克“非常失望”。特朗普表示,他宁愿马斯克批评他,而不是批评他的税改法案。特朗普称,马斯克对特朗普政府撤销电动汽车“强制令”感到很不高兴。据悉,特朗普政府也撤…

    马斯克公开号召民众抵制税改法案后,特朗普谈及二人关系

    当地时间6月5日,美国总统特朗普谈及马斯克,称不知道还能不能与其保持良好的关系。马斯克(左)与特朗普(右)当地时间6月4日,央视记者获悉,埃隆马斯克当日加大了对特朗普减税法案的攻势,呼吁美国民众联系他们的立法者,以“扼杀”该法案。马斯克在社交媒体上称“让美国破…

    国足客场0比1不敌印尼,提前一轮无缘美加墨世界杯

    北京时间6月5日晚间,世预赛18强赛C组第九轮,中国队做客雅加达挑战印尼队。最终,因为一粒争议点球,中国队0比1不敌印尼,迎来了世预赛4连败。与此同时,18强赛9战2胜7负积6分,加上净胜球-14,国足排名垫底,提前一轮无缘2026年美加墨世界杯。这个结果也证明,国足美好的出线…

    北京土拍单日收金超130亿元,海淀区两宗地块溢价成交

    6月5日,北京土地市场迎来4宗涉宅用地出让,根据成交结果,2宗地块溢价成交,2宗地块底价成交,共计成交金额约130.6亿元。此次出让的4宗地块分别位于海淀区(2宗)、石景山区(1宗)、昌平区(1宗),总用地面积为163080.65平方米,起始总价约129.63亿元。其中,京土储挂(石)…

    国泰海通:A股“转型牛”格局越来越清晰,战略看多2025

    蒋立冬 派生万物AI 图“中国股市‘转型牛’的格局越来越清晰,战略看多2025。”6月5日,国泰海通证券策略首席分析师方奕在国泰海通证券2025年中期策略会上表示。方奕表示,出清调整后,投资人对经济形势的认识已然充分,其对估值收缩的边际影响减小。与此同时,股票价格反映的…

    殷大鹏已任海南省疾控中心主任,曾在中国疾控中心工作

    近日,海南省疾病预防控制中心(以下简称“疾控中心”)官网更新显示,此前担任海南省疾控中心党委委员、副主任的殷大鹏,现已出任该中心党委副书记、主任,分管科研信息处、传染病预防控制所(应急处置中心)、“全健康”工作。公开资料显示,殷大鹏,男,汉族,1972年2月生,…

    上海财大与上海国投签战略合作协议,共建未来产业发展研究院

    签约仪式现场 上海财经大学 供图6月5日下午,上海财经大学与上海国有资本投资有限公司签署战略合作协议,共建未来产业发展研究院。该研究院将持续跟踪研究未来产业发展、上海三大先导产业和国资国企改革等前沿和关键问题,用强大的国有资本投资平台、一流的学科建设、领先的科…

    红土创新基金“掌门人”变更:董事长阮菲届满离任,总经理冀洪涛代为履职

    红土创新基金“掌门人”变更。6月5日晚间,红土创新基金管理有限公司(下称“红土创新基金”)公告称,阮菲因董事会到期换届离任公司董事长职务。公司董事长缺位期间,暂由总经理冀洪涛代为履行董事长职务,任职日期为2025年6月5日,期限不超过6个月。据公告,冀洪涛,2021年加…

    北京市委社会工作部部长调整

    据微信公众号“北京社会工作”消息,6月5日,北京市委社会工作部召开部办公会议,总结今年重点工作推进落实情况,研究部署下一步工作安排。市委社会工作部部长、市委“两新”工委书记、市委组织部副部长唐行安主持会议。这也意味着,此前获公示拟任市委工作机关正局职的唐行安…

    绿色生态集市、主题打卡……上海长宁区举办六五环境日活动

    今天(6月5日)是六五环境日。上海市长宁区生态环境局、江苏路街道和长宁区教育工作党委在愚园路“绿色生态无废街区”举办“美丽长宁我先行”2025年长宁区六五环境日主题活动。近年来,长宁区全面推进“美丽长宁”建设,大力探索城市生物多样性保护,区域生态文明建设不断取得…