新质观察|开发AI的程序员,担心被AI取代么?

article/2025/8/20 12:59:48

“秒杀”大厂开发岗面试的AI

当前,人工智能正以汹涌之势,席卷所有行业。一些行业首当其冲,相关岗位正在加速萎缩。那么,作为孕育AI的“母体”,计算机行业能独善其身吗?一个自然冒出的疑问是——在AI开发上“卷生卷死”的程序员们,会不会也在担心,终有一天会被自己创造的AI取代?

早在2021年,OpenAI就推出了AI辅助编程工具Codex,它的诞生比公众熟知的ChatGPT(2022年发布)还要早。Codex基于GPT-3模型,并在此基础上加入了海量程序代码数据进行训练,因此在编写代码方面更具优势。

视觉中国 图

Codex能帮开发者处理很多写代码的工作。比如,它能读懂你已经写好的部分代码,并自动把剩下的内容补全;也能根据一句简单的提示写出完整的功能代码。举个例子,如果你输入一行说明——“给定一个数组,计算滑动窗口内的平均值”,Codex就能马上写出实现这个功能的代码。

最初,AI写代码只是开发者手边的“小帮手”,主要用来代劳那些枯燥、重复的代码片段。可随着模型能力的快速提升,再加上ChatGPT的爆火,越来越多的公司看到了新的机会——AI不再只是辅助,而是有可能开辟出一个全新的市场——AI软件开发。

此后,大量AI软件开发创业公司如雨后春笋般涌现,例如当前知名的ClaudeCode、Cursor、Devin、Windsurf等。国内几家头部大模型企业也不甘落后,字节跳动、阿里巴巴、腾讯等亦相继推出了类似产品。

相比四年前的Codex,如今的AI编程工具已取得令人瞩目的进步。OpenAI最新的o3模型在编程竞赛网站Codeforces上斩获2727分,超过99.8%的人类选手;Anthropic的Claude4则能自主运行长达7小时,完成上千个步骤,不断尝试直至达成目标。

这些突破带来了全新的编程方式——开发者无需逐行写代码,只需用自然语言描述需求,AI便能自动生成并根据反馈反复修改。人类与AI的合作因此变得更像“对话”而非“指令”。这种全新的编程方式有个颇具浪漫色彩的名字——“氛围编程”(vibe coding),这一变化似乎意味着编程正从少数人的专业技能,逐渐走向人人可用的创造工具。

颇具戏剧性的是,AI的能力如今已经延伸到专业软件开发的招聘面试中。

一般情况下,专业软件开发的招聘面试都会包含代码考查,要求应试者在限定时间内写出既正确又高效的程序。而哥伦比亚大学的一名学生则开发了一款“AI面试助手”:它能在视频面试时自动读取题目,并调用AI编程工具实时生成符合要求的代码。据他透露,这套工具已经帮助他顺利通过TikTok、Meta和亚马逊等公司的面试,并拿到录用通知。他还将自己在亚马逊面试中AI“出手”的全过程录制下来并上传网络,引发了广泛讨论。

这一切突飞猛进的进展发生在短短几年内,速度之快出乎人们的意料。但我们是否就能断言——AI真的能全面接管人类的编程工作?

找个“助手”,竟成“杀手”

并非如此。

相比于人类,AI在编程中的“失误”往往难以预料。即便它的正确率能达到90%,听起来已经很高了,但这也意味着平均每十次就会错一次。对于程序开发来说,这样的错误率并不容忽视——人类开发者必须逐一检查并修正,结果常常比自己亲手写代码还要费心费力。

2025年7月,知名编程社区StackOverflow发布了今年5月开展的一项调查结果。在5万名受访用户中,约80%正在使用AI编程工具。然而,其中“不信任AI”的用户(46%)比例,明显高于“信任AI”的用户(33%)。相比2024年,用户对AI的正面评价从70%以上跌至60%;而在应对复杂开发任务时的信任度,也从35%下滑到29%。

AI编写的代码往往包含细微的错误,需要人类检查并修正。尽管AI在编程竞赛中已经取得了非凡的成绩,但在面对现实的软件开发需求时,往往不能正确完整地实现所有功能,有时甚至会错误地执行危险操作。

AI开发协作平台Replit曾发生过一次严重事故。尽管用户明确要求不得擅自修改代码,Replit仍然删除了该公司整个生产环境的数据库。更糟糕的是,它还声称数据“不可恢复”。然而,用户最终通过手动操作,成功将数据库恢复。

这一事件引发了人们对AI编程工具可靠性的广泛讨论。公开信息显示,类似的情况并非个例——一些用户甚至报告称,自己的数据库或代码仓库被AI整个清空。

“AI,给我做个像淘宝的网站”可行吗?

软件开发通常要走一整套流程:先做需求分析,再设计技术方案,接着开发、联调、测试,最后才能上线。为了追求更快的迭代,如今互联网公司大多用“敏捷开发”,流程上精简了不少,但基本框架没变。

需求分析是关键的第一步,它要求清晰、完整地描述软件应该实现的功能。比如,要说明当用户执行某个操作时,系统应如何反馈。优秀的需求文档会尽可能细致到每个操作细节,而不是一句含糊的“给我做个像淘宝的网站”。

接下来是技术方案设计。这一步要把需求拆分成可以单独开发的软件模块,还得考虑架构设计、资源消耗、异常处理等等细节问题。

最后才是开发和测试。这一阶段几乎必然会冒出各种没预料到的问题,开发者需要通过反复测试确保功能正确实现。而在实际项目里,常常会发现需求或方案本身有漏洞,导致不得不推翻重来,这也是家常便饭。

除了开发流程繁琐,程序本身的复杂度也是个大难题。举几个例子:一款普通的iPhone应用平均就有约4万行代码,Chrome浏览器包含约600万行代码,而知名操作系统Linux的内核代码更是超过了4000万行,如果全部打印出来需要70万页。

面对如此复杂的项目,优秀的人类开发者团队往往能精准定位每个模块的功能,并在出问题时迅速定位到具体的代码行进行修复。但对AI而言,这种任务却充满挑战。受限于输入长度,它往往只能“看到”局部片段,难以像人类一样建立对整个项目的全面理解。

普林斯顿大学的研究者构建了一套考察AI软件开发能力的测试基准(SWE-bench),包含来自开源网站Github的数十个软件项目。得益于Github对代码改动历史的详细记录,研究者从中整理出超过两千个由人类开发者正确完成的功能需求。研究者要求AI开发工具在已有的软件项目上完成相同的需求。实验结果显示,哪怕是当前最强的AI,最多也只能完成约四分之三的任务。

斯坦福大学和Anthropic的研究者构建了一个更具挑战的测试基准(Terminal-bench):他们设计了80个软件开发需求,要求AI开发工具从零开始开发。实验结果表明,当前的AI最多只能完成一半的开发任务。

与之形成鲜明对比的是,优秀的人类开发者总是可以以近乎100%的正确率完成这些开发任务。纽约大学的研究者还联合多位信息学奥林匹克竞赛选手,构建了一套高质量的编程竞赛评测基准(LiveCodeBenchPro),当中的评测问题取自最新的编程竞赛,互联网上缺乏题解,从而避免了AI“背答案”的可能。颇具戏剧性的是,现有的所有大模型在该测试基准的困难问题上全都取得了0分的离谱成绩。 

你要成为工具的主宰,还是润滑工具的数据?

那么,回到最初的问题上,AI会取代人类开发者吗?

毋庸置疑,AI会是优秀的工具。对于专业的开发者而言,AI是一位执行力极强的助手。在AI开发工具普及之前,开发者不得不手动实现许多繁琐而无趣的代码。即便有开发文档或者互联网上有功能类似的代码,开发者仍必须尝试理解然后自己修改。借助AI,这一工作将会大大简化。对于没有开发背景的用户而言,AI可以准确实现功能较为单一的软件。借助这一能力,普通用户可以将日常的重复性工作转化为AI编写的代码,大大提升工作效率。

至于说让AI完全替代人类开发者,目前看来为时尚早。

当今的大语言模型基于互联网上已被数字化的数据,以及图书报刊之类被人类“写”出来的知识。尤其在软件开发领域,大语言模型只看到了人类开发的结果(软件代码),而对于开发过程的细节了解甚少。DeepMind科学家David Silver和Richard S.Sutton指出,当前的AI基于人类数千年来产生的数据,但这并不是人类知识的全部。人类在与真实世界的交互中积累了大量的经验。AI并没有这些经验,因而不太可能超过人类。而要让AI学会这些经验,依然困难重重。

公众常会探讨所谓的“35岁危机”。然而事实上,技术相比年龄更具碾压性。就软件开发而言,AI已经能承担不少基础、重复性的工作,例如简单的代码生成、常见功能的实现,以及部分调试环节等。但难以被替代的,仍是需求把握、架构设计、复杂系统的理解分析,以及团队协作等环节——这些涉及抽象思维、跨领域知识和人类判断力,是程序员真正的核心价值。

作为程序员,不妨考虑这样一个问题:如果把你最近一周完成的工作全部交给AI,它能完成多少?如果你的工作只是重复性地构建功能单一的软件系统,例如实现一个问卷表单记录用户提出的10个问题、从一个表格里统计平均数之类常见的指标——功能仅此而已,那么你不得不考虑被AI替代的可能性。而如果你的工作充满挑战,例如实现全新的软件架构、针对业务特点设计独特的算法,甚至是从客户含糊不清的诉求中抽象出具体的开发任务,那么AI只会是你的得力助手。

这不仅适用于软件行业,也同样适用于其他行业:与其担心被AI取代,不如思考在这个人机协同的时代如何做好自己的角色定位。上述的问题对于其他行业同样适用:试试让AI完成你的工作。如果它可以胜任,那么对你来说既是坏消息,也是好消息。坏消息是你的工作很快就会被AI取代;好消息是你已经发现了驾驭AI完成工作的途径,你可以试试站在你的领导的位置上,操控更多的AI完成更多的工作。

与其任由AI夺走你的工作,不如跳出现有的岗位,想想怎样利用AI解决你所在行业的问题。当AI都不甘只做执行者,而是开始决定任务怎么被拆解,流程怎么被安排时,人类个体若只是抱怨即将被碾压的命运,便会失去主动选择的空间,最终不是沦为工具的工具,就是化作喂养和润滑工具的茫茫数据。

(作者知虚为中国科学技术大学计算机专业博士,在自然语言处理和人工智能方向发表多篇高水平论文,先后在微软及多家国内知名互联网企业从事相关研究工作)

    责任编辑:蔡军剑
    图片编辑:施佳慧
    校对:施鋆

    http://news.xdnf.cn/eNAwbVNbUU

    相关文章

    沪指连创新高,公募单周调研环比增46%!哪些公司成焦点?

    沪指迭创新高,公募基金调研热情攀升。公募排排网数据显示,上周(2025年8月11日至8月17日)共有139家公募机构参与A股调研活动中,合计调研次数达729次,较前一周环比增46.39%。医药生物、计算机、电子、美容护理等行业为近期公募调研“主战场”。上周调研次数居前的5只个股分…

    “新产业鸡娃”兴起,家长们开始卷“科技特长生”

    “焦虑是商机的温床,面向科技特长生和信息学奥赛的‘信息学’校外培训市场,预计未来三年市场份额达到20%。” 文 / 巴九灵(微信公众号:吴晓波频道) 为了“鸡娃”,现在的家长可谓是紧跟潮流,各路奇招。 比如在不久前的世界机器人大会和刚召开的机器人运动会上,观众席…

    山姆北上,争抢中产

    出品|新品略财经作者|吴文武在中国市场一路狂飙的山姆,正在加速北上,押注北方市场,把门店开到更多北方城市,很显然,山姆想北上争抢中产。01 狂飙的山姆,加速北上1999年,沃尔玛进入中国市场,立足经济特区深圳,开了第一家沃尔玛购物广场和山姆会员店。在此后多年的传统…

    首席展望|摩根士丹利王滢:多重利好加持中国资产,市场上攻动能有望延续

    “我们从去年九十月份开始,就逐渐对中国股票市场的整体生态取得的进步表示密切的关注和肯定,今年2月也正式上调了中国市场在全球新兴股票市场里的配置评级。”8月15日,摩根士丹利中国首席股票策略师王滢在做客澎湃新闻“进击新周期——《首席连线》2025年中经济展望”专题时…

    到底谁是线上空调第二名?格力市场总监晒图反击:格力依旧领先小米

    到底谁才是今年7月份线上空调市场的第二名?小米还是格力?8月18日晚,格力电器市场总监朱磊在微博上发文反击”小米空调线上销量超越格力“说法,称“我们也去奥维云网查了下,公开的数据和那几张截图并不一样。按照同样的查询条件7月线上市场格力仍然保持领先。”近日,有网友…

    人体里的沉默杀手,正在偷偷伤害爸妈

    长期高血压是冠状动脉疾病、中风、心脏衰竭、心房颤动、周边动脉阻塞、视力损伤、慢性肾脏病及痴呆症等病症的主要危险因子,全球每年由高血压并发症导致的死亡为 940 万例。 降压是一场持久战。一定有很多患者和儿女,在为慢病管理这场艰难的持久战而头疼,稍有松懈就可能输给…

    行医之谈|段涛:不要神化也不要污名化医生,大家共同的“敌人”是疾病

    【编者按】何为医者?医者何为?“药王”孙思邈曾说:胆欲大而心欲小,智欲圆而行欲方。一千多年前后的当下,这样的问题,还在不断叩击着医生、患者和公众的心灵。当人们把更多期望和光环赋予医生,也意味着把更大压力、更多不确定摆在他们面前。所以真实的医生是怎样的?医患…

    “佐德将军”特伦斯·斯坦普去世,享年87岁

    就在新版《超人》全球热映并于近日登陆流媒体平台的日子里,却传出了老版《超人》中饰演反派的英国著名演员特伦斯斯坦普(Terence Stamp)撒手人寰的消息。当地时间8月17日,他因病离世,享年87岁。特伦斯斯坦普在1978年上映的克里斯托弗里夫版《超人》中,时年40岁的特伦斯斯…

    特朗普与普京通话,支持俄乌代表团进行直接谈判

    俄罗斯总统助理乌沙科夫表示,美国总统特朗普18日与俄罗斯总统普京通电话,持续时间约40分钟。乌沙科夫称,通话是坦诚而且非常有建设性的。普京与特朗普在通话中均表态支持俄乌双方代表团进行直接谈判。双方还讨论了提升俄乌直接谈判代表级别的问题。责任编辑:王卉澎湃新闻报…

    中东媒体:哈马斯同意停火60天并释放一半被扣押人员

    当地时间2025年8月18日,加沙地带北部,巴勒斯坦民众涌向齐基姆过境点,领取有限的粮食援助。视觉中国 图新华社快讯:巴勒斯坦伊斯兰抵抗运动(哈马斯)18日发表声明说,包括哈马斯在内的多个巴勒斯坦派别已宣布同意加沙地带停火谈判调解方埃及和卡塔尔关于停火方案的最新提议…

    视频丨特朗普与欧洲领导人举行多边会晤

    特朗普与到访的多位欧洲领导人合影当地时间8月18日,美国总统特朗普在白宫东厅与欧洲多国领导人举行多边会晤。与会者包括欧盟委员会主席冯德莱恩、法国总统马克龙、德国总理默茨、意大利总理梅洛尼以及北约秘书长吕特等。当天稍早前,特朗普在白宫与到访的乌克兰总统泽连斯基举…

    巴勒斯坦成立临时宪法起草委员会,为大选做准备

    巴勒斯坦总统阿巴斯(资料图)据巴勒斯坦官方通讯社当地时间8月18日消息,巴勒斯坦总统阿巴斯当天晚间颁布总统令,成立临时宪法起草委员会,为举行大选做准备。据报道,此举旨在通过起草宪法草案,为建立巴勒斯坦国及其各机构奠定基础。该草案应体现基于法治、权力分立、尊重和…

    特朗普与欧洲领导人举行多边会晤

    特朗普与到访的多位欧洲领导人合影当地时间8月18日,美国总统特朗普在白宫东厅与欧洲多国领导人举行多边会晤。与会者包括欧盟委员会主席冯德莱恩、法国总统马克龙、德国总理默茨、意大利总理梅洛尼以及北约秘书长吕特等。当天稍早前,特朗普在白宫与到访的乌克兰总统泽连斯基举…

    埃及媒体:哈马斯已同意调解方提出的新加沙停火提议

    7月27日,在加沙地带北部城镇拜特拉希亚,人们领取通过边境口岸进入加沙的援助物资。新华社发(里泽克阿卜杜勒贾瓦德 摄)巴勒斯坦伊斯兰抵抗运动(哈马斯)谈判代表团18日称,哈马斯已同意由调解方提出的新加沙停火提议。责任编辑:王晓峰澎湃新闻报料:021-962866澎湃新闻,…

    舞台剧《千与千寻》收官:近8万人次观演,外地观众占一半

    2025年8月17日,历时一个多月的日文原版舞台剧《千与千寻》上海站演出在上海文化广场收官。演出自7月14日开启,42场演出全部售罄,一票难求,成为这个夏天上海乃至全国演出市场的热议话题。据主办方统计,此次演出共有超7.8万人次观演,50%观众专程从上海以外的城市赶来,海外…

    独家|范曾一切安好?友人证实其已乔迁新居

    “古藤老树,小桥流水。在这样一所充满了豪华与古典氛围的私家宅院里,画家范曾仍然保持着每天清晨五点起床,读书、画画的习惯。他坦言,喜欢深居简出的生活。”这段开场白,出自央视纪录片栏目《人物》过往播出的《范曾》一集。然而,眼下这座私家宅院以及他的主人,又被其女…

    媒体:数千万建成的客运站闲置十余年,不能没有“教训”

    不管出于何种原因,此事都应该有个水落石出的责任划分机制,要有人为项目的长期闲置付出该有的代价。3600万建好的车站却10年未用?据人民日报报道,有黑龙江绥化市民反映,当地东城客运站作为向社会公布的惠民工程之一,总投资3600余万元。然而该工程2015年建成后,一直未启用…

    欧菲光上半年净亏1亿元,智能手机产品营收增长0.43%

    欧菲光 视觉中国 资料图8月18日晚,国产手机摄像头供应商欧菲光(002456)发布了2025年上半年业绩,今年上半年公司实现营业收入98.37亿元,同比增长3.15%,归属于上市公司股东的净利润-1.09亿元,同比减少378.13%,扣非净利润为-1.5亿元,同比减少944.18%。欧菲光表示,2025年…

    淳中科技:不涉及液冷服务器生产制造,如后续股票交易进一步异常,可能申请停牌核查

    淳中科技 视觉中国 资料图8月18日,北京淳中科技股份有限公司(以下简称“淳中科技”,603516)公告称,公司股票于8月13日、8月14日、8月15日连续3个交易日内收盘价格涨幅偏离值累计达20%,根据《上海证券交易所交易规则》的有关规定,属于股票交易异常波动情况,公司已于8月…

    远洋集团公布境内债务重组方案:本金总额180.5亿元,现金购回上限8亿元

    澎湃新闻获取的文件显示,8月18日,远洋集团(03377.HK)旗下北京远洋控股集团有限公司发布境内债务重组方案,并将于9月9日至9月12日召开债权人会议,重组包括7笔公司债和3笔PPN,本金额合计180.5亿元。远洋控股称,经远洋集团协调,对标的债券本金和利息偿付安排作出调整,并…