国家超算互联网平台上线超长文本多模态大模型,助力AI智能体开发

article/2025/4/28 19:04:39

随着越来越多的智能体(Agent)进入应用场景,无论是单个智能体工作时产生的记忆,还是多个智能体协作产生的上下文,都会对大模型的上下文窗口长度提出更高要求。澎湃科技4月15日获悉,国家超算互联网平台近日已上线超长文本多模态大模型,该模型由上海稀宇科技有限公司(以下简称“稀宇科技”)研发,分别为MiniMax-Text-01和MiniMax-VL-01。

SCNet超算互联网平台chat页面截图  来源:MiniMax供图

国家超算互联网作为国家级算力服务平台,于2024年4月正式上线,今年2月启动了“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励,并通过技术赋能、市场协同、资源扶持三位一体,加速生态伙伴全面发展。

统计数据显示,自上线一年以来,国家超算互联网平台总用户量已突破35万,连接了全国14个省区市20多家超算和智算中心,并上线算力商品超6500款。澎湃科技注意到,其中AI模型服务有近240款,既有阿里通义千问Qwen、DeepSeek等国内开源模型,也有Llama、Stable Diffusion、Gemma等国外AI开源模型。

稀宇科技认为,该公司此次与国家超算互联网平台的合作能激发更多关于长上下文技术的创新研究与实际应用。长上下文能力与多模态处理能力的提升,有助于智能体为各行业带来更丰富、高效的解决方案。

“放眼国内外的大模型,‘大脑’虽大,但‘记忆力’往往不够。”稀宇科技研发负责人表示,“如果让大模型理解一份长达1000页的法律合同、一部长篇小说或一个几十万行的源代码项目,并给出准确的摘要、发现潜在风险、提出结构化建议,大多数大模型都无法完成任务,因为它们连读完材料也做不到,更不用说音视频等多模态信息处理了。而MiniMax-01可以做到,因为它的上下文窗口约为700万字,相当于一下子读完中国四大文学名著和哈利波特全集。”

据了解,今年初发布并开源的新一代系列模型MiniMax-01首次将线性注意力机制扩展到商用模型级别,综合能力跻身全球第一梯队。特别是在“上下文长度”这个指标上,它达到了国内外一些顶尖模型的20—32 倍水平,推理时的上下文窗口能达到400万token(词元)。在架构上,MiniMax-Text-01几乎重构了训练和推理系统,模型的参数量高达4560亿,每次激活459亿。在注意力机制层面,它的80个注意力层有架构创新,使大模型在处理长输入时在确保处理效果的同时做到了低延迟。这意味着该模型不仅能一次性完成大量文字的分析,还能做到真正理解并高效处理超长内容。

此次MiniMax加入国家超算互联网,将充分利用平台强大的算力资源、开放协作的生态体系以及广泛的开发者网络,稀宇科技认为,“此次合作不仅能够激发更多关于长上下文技术的创新研究与实际应用,推动Agent时代更快到来,也能通过开源形式进一步激励我们开展更深入、高质量的模型研发和创新工作。”未来,该公司还将继续以开源形式发布新版旗舰模型,并与国家超算互联网展开深入合作,共同推动国产人工智能技术加速发展。

    责任编辑:宦艳红
    图片编辑:施佳慧
    校对:张艳

    http://news.xdnf.cn/TRFEVUWssx

    相关文章

    国家喊你减肥了|减肥门诊遍地开花,多学科加入,如何更高质量发展?

    2025年“减肥”话题热度居高不下。4月14日,全国爱卫会发布通知,结合健康中国建设工作实际和健康中国行动推进情况,决定将健康体重管理行动等纳入健康中国行动。行动提到,鼓励有条件的医疗卫生机构设置体重管理门诊或肥胖防治门诊。此前的4月10日,国家卫生健康委《关于做好…

    体坛联播|逆转好戏还差一点,多特蒙德、维拉昂首告别欧冠

    巴萨淘汰多特晋级欧冠四强。欧冠八强战次回合,巴萨客场1比3不敌多特仍过关北京时间4月16日,欧冠四分之一决赛次回合,多特坐镇主场伊杜纳信号公园球场迎战巴塞罗那。首回合比赛中,巴萨4比0大胜多特,基本已经一只脚踏进了四强。次回合比赛,处于劣势的多特积极进攻,开场第1…

    消博会参展外企坚定看好中国市场:对中国经济基本面和强大韧性充满信心

    外资企业持续看好中国市场。4月13日至18日,第五届中国国际消费品博览会(以下简称:消博会)在海南举办。作为亚太地区规模最大的消费精品展,本届消博会共有来自71个国家和地区的1700余家消费企业、4100余个消费品牌参展,境内外展客商数量均超过往届。消博会进一步向世界展现…

    快手可灵发布2.0版本:上线多模态视频编辑功能

    随着AI生成视频日渐走红,如何准确将用户心中的想法转化成AI视频,成为难题。用户常常发现,仅仅依靠文字很难描述自己的需求。4月15日,快手旗下可灵AI宣布,面向全球发布可灵2.0视频生成模型及可图2.0图像生成模型,快手高级副总裁、快手社区科学线负责人盖坤向澎湃新闻记者表…

    五一小长假前夜火车票今日开抢,预计客流最高峰为5月1日

    五一小长假前夜火车票今天开抢!4月16日,五一假期前一天(4月30日)的火车票正式发售。2025年五一小长假自5月1日至5月5日,共5天。根据目前铁路客票提前15天预售的规则类推,4月17日开售5月1日假期首日火车票;4月21日开售5月5日假期最后一天火车票。通常而言,假期前一天傍晚…

    龙华机场将升级为A类通用机场,低空经济如何抢抓风口“飞”更高

    位于上海徐汇滨江的龙华机场。上海徐汇 图在上海中心城区唯一的机坪空域——龙华机场,搭载旅客的直升机缓缓起飞,沿黄浦江上空飞行、观光、返航;将海鲜从沿海的金山区运至上海市区,这些海鲜随后被分送至成百上千个商超和餐厅;由上百架无人机组成的灯光矩阵,常常点亮徐汇滨…

    技术派|菲律宾“史上最强”护卫舰交付,性能如何?

    菲律宾为其海军目前史上最强护卫舰举行归国仪式。日前,菲律宾海军在苏比克海军基地为其“历史上最强战舰”——“米古尔马尔瓦尔”号导弹护卫舰(舷号FFG-06)举行了正式的归国欢迎仪式。菲律宾国防部长特奥多罗、武装部队总参谋长布劳纳、海军司令埃斯佩莱塔等政府及军方高层…

    世界噪音日|“好房子”的噪声标准:卧室上限30分贝

    4月16日是世界噪音日。生活在都市里,忍受噪音似乎已成为一门必修课。从清晨睡眼惺忪,对面楼装修钻墙入耳开始,到深夜熄灯闭眼,楼上洗衣机排水助眠结束。因噪音扰民引发的邻里纠纷更是屡见不鲜。住房和城乡建设部在3月底发布的国家标准《住宅项目规范》(以下简称《规范》)…

    专访|巴西气变国务秘书:历史将全球南方国家推到引领的位置

    第30届联合国气候变化框架公约缔约方大会(COP30)将于今年11月在巴西亚马孙雨林城市贝伦举行。近日,大会主办国巴西发布了一封“致世界的信”,以严峻而紧迫的语调向国际社会发出警示:在全球注意力被地缘政治冲突、极端主义抬头等议题分散的当下,人类社会正面临“选择还是灾…

    “没法做无糖的”,这句话被星巴克杀死了

    原创 云无心 果壳 控糖星人等来了一个好消息。 这几年市面上花式咖啡风头正旺,大多数做法是在黑咖或奶咖的基础上加风味糖浆,比如焦糖味糖浆、香草味糖浆、水果味糖浆等等,总之要风味就得要糖,要风味浓就要多加糖,导致许多人只敢看不敢喝。对有控糖需求或不爱甜的人来说…

    国际首个!我国成功构建地月空间三星星座,还有一批新突破

    记者4月15日从中国科学院获悉,由中国科学院A类战略性先导专项“地月空间DRO探索研究”部署研制的三颗卫星目前已经在地月空间稳定建立百万公里级星间测量通信链路,标志着我国已成功构建国际首个地月空间三星星座,并取得多项原创性科技成果,为我国开发利用地月空间、引领空间…

    上海是他永远倾心的城市,黄永玉90岁后作品在沪展出

    4月15日,“如此漫长如此浓郁——黄永玉新作展”在上海世博会博物馆开幕,并于4月16日正式对公众展出。此次展览由世博会博物馆与北京画院联合主办,通过上海叙事的新视角,集中展示了黄永玉90岁后创作的彩墨、版画、雕塑等200余件作品,并系统性地展出了他的手稿、出版物及文献…

    上昆亮相大阪世博会;京昆歌舞伎东京合演《中日杨贵妃》

    樱花纷飞的四月,适逢2025年日本大阪世博会盛大启幕,上海昆剧团受邀于4月14日亮相世博会中国馆首演活动。在结束大阪世博会的演出活动之后,上海昆剧团还将在日本东京接续文化展示和交流,京昆和歌舞伎合演《中日杨贵妃》。从4月14日至18日,持续开启一段中日人文交流佳话。活…

    秘鲁前总统乌马拉因洗钱罪被判15年监禁

    当地时间4月15日,秘鲁法庭以洗钱罪判处该国前总统乌马拉及其妻子埃雷迪亚15年有期徒刑。15日,秘鲁前总统乌马拉在法庭结束其宣判听证后通电话。当天的庭审法官认为,乌马拉夫妇隐瞒了2011年大选期间巴西最大建筑公司奥德布雷希特公司提供的资金并用于购买房产。乌马拉夫妇在竞…

    法国驱逐12名阿尔及利亚外交人员并召回大使

    法国外长巴罗(资料图)新华社巴黎4月15日消息,法国总统府15日晚发布公告说,将驱逐12名阿尔及利亚驻法外交人员,并召回驻阿尔及利亚大使述职。公告说,法方对阿方驱逐12名法驻阿外交人员的决定感到震惊,阿方应对两国关系“突然恶化”负责。公告还说法方将继续维护自身利益,…

    上海是他永远倾心的城市,“黄永玉新作”在沪展出

    4月15日,“如此漫长如此浓郁——黄永玉新作展”在上海世博会博物馆开幕,并于4月16日正式对公众展出。此次展览由世博会博物馆与北京画院联合主办,通过上海叙事的新视角,集中展示了黄永玉90岁后创作的彩墨、版画、雕塑等200余件作品,并系统性地展出了他的手稿、出版物及文献…

    涉嫌泄密,美防长高级顾问被调查

    五角大楼(资料图)总台记者获悉,当地时间4月15日,在调查美国国防部泄密事件中,国防部长赫格塞斯的高级顾问丹考德威尔在被确认涉嫌泄密后,被“护送”出五角大楼。有美国官员透露,丹考德威尔因“未经授权的披露”而被行政休假,针对他的调查仍在进行中。责任编辑:王晓峰澎…

    白宫称在停火前提下或与俄建立经济伙伴关系

    美国白宫新闻秘书莱维特(资料图)当地时间4月15日,美国白宫新闻秘书莱维特表示,美国中东问题特使史蒂文威特科夫和俄罗斯的对话富有成效。威特科夫和特朗普相信俄罗斯希望结束俄乌冲突,俄罗斯有结束这场冲突的动机。莱维特表示,俄罗斯或许可以与美国建立经济伙伴关系,但美…

    法国决定驱逐12名阿尔及利亚使馆工作人员并召回驻阿大使

    法国外长巴罗(资料图)当地时间4月15日,法国外长巴罗在社交媒体上发布消息称,法方决定驱逐12名阿尔及利亚驻法使馆工作人员,并召回法国驻阿大使,作为对阿尔及利亚驱逐12名法国驻阿使馆工作人员的回应。14日,阿尔及利亚外交和海外侨民部发表声明,宣布将12名法国大使馆工作…

    光明网评论员:治理学术不端如何更精准有效

    一段时期内出现数量相对较多的学术不端事件,可见治理学术不端对有责部门而言仍然任重而道远。因此,就需要关注一定时期内学术不端事件的共通性,有的放矢地进行查缺补漏。近期,国家自然科学基金委员会通报了2025年第一批次不端行为事件处理结果,事件总数15件,涉及13所高校…