上海AI实验室:开源发布书生·浦语数学大模型

AIINNEWS 2024-01-26 14:34:20 108

上海人工智能实验室(上海AI实验室)最近发布了新一代数学模型书生·浦语数学(InternLM2-Math)。这是一项具有创新性的开源项目,InternLM2-Math成为首个同时支持形式化数学语言及解题过程评价的模型。基于书生·浦语2.0(InternLM2)的强大基础能力,InternLM2-Math以中轻量级参数规模在多项数学评测中刷新了开源模型数学能力的上限。

与传统数学大模型应用相比,InternLM2-Math不仅具备“解题”能力,更能够进行“判题”。这一突破意味着该模型将为数学基础研究和教学提供更为优质的应用基础,超越了以往的局限。InternLM2-Math的代码和模型完全开源,同时支持免费商用,秉持“以高质量开源赋能创新”的理念。

这一次发布的数学模型不仅仅关乎技术社区,更在全球数学大模型领域引起瞩目。数学能力一直是衡量大语言模型推理水平的重要体现。最近,谷歌 DeepMind 利用AI数学模型AlphaGeometry成功解答几何问题,其水平已经接近人类奥林匹克金牌得主,引起了广泛关注。虽然全球数学大模型领域研究取得了显著进展,但与顶尖人类水平相比仍存在一定差距。

上海AI实验室将继续秉持开源开放理念,与全球研究人员合作,共同探索提升语言模型数学推理能力的路径。InternLM2-Math以其强大的内生计算和推理能力为技术社区提供了一种创新的数学工具和模型范式,为数学领域的发展注入了新的活力。

开源地址:

https://github.com/InternLM/InternLM-Math

https://huggingface.co/internlm

https://modelscope.cn/organization/Shanghai_AI_Laboratory

相关资讯
最新资讯
最新问答
华为发布首个通信大模型

华为发布首个通信大模型

作者:崔爽来源:科技日报科技日报记者 崔爽记者从华为公司获悉,近日,华为在MWC24巴塞罗那期间发布通信行业首个大模型。据了解,针对行业提出的敏捷业务发放、精准用户体验保障、跨领域高效运维的高阶智能化目标,大模型提供基于角色和场景的智能化应用,助力运营商赋能员工、提升用户满意度,提升网络生产力。MWC24巴塞罗那期间,华为以“引领智能世界”为主题,探讨如何促进“网云智”协同创新,推动数智化转型深入发展,加速5G商业正循环,拥抱更繁荣的5G-A时代。同时,华为展示了全系列、全场景的5.5G产品解决方案,包括5G-A、F5G-A、Net5.5G等。MWC24巴塞罗那华为Hall1展区根据最新数据,截至2023年底,全球已有超过300张5G商用网络,超过16亿5G用户。5G进入高速发展期,全球5G用户增长速度是4G同期的7倍。在2023年全球知名机构测试中,华为在德国、奥地利、荷兰等重要城市助力运营商网络体验取得测试第一。据了解,截至目前,华为联合运营商客户在全球20多个城市启动5G-A商用验证和测试。在中东,5G-A已成产业共识,海湾阿拉伯国家合作委员会(GCC)六国均已完成5G-A 10Gbps速率验证以及RedCap(Reduced Capability,5G轻量化)和Passive IOT(无源物联网)等新业务孵化。中国内地,三大运营商已启动全国重点城市的5G-A网络部署,并全面开展联人、联物、联车、联行业、联家庭的五联业务探索;在中国香港,运营商完成C-band+毫米波的5G-A万兆测速验证,并启动发放5G-AFWA业务;在芬兰,运营商在商用网络上完成5G-A技术验证,实现超过10Gbps峰值速率和Passive IoT的技术验证;在德国,运营商通过6GHz多载波突破12Gbps峰值速率。2024是5G-A商用的元年,华为表示,将联手全球运营商积极探索向5G-A时代的演进,构建极致体验、高效协同、绿色低碳、高稳智能的泛在网络,推动数智化转型深入发展,引领智能世界加速到来。据悉,华为企业业务以“引领数智基础设施,加速行业智能化”为主题亮相MWC24巴塞罗那,发布十大行业数智化解决方案,以及系列旗舰产品。华为终端业务携一系列科技新品亮相,展现让科技进一步融入消费者生活、丰富场景化体验的追求,以创新技术打造丰富的个性化生活方式。(主办方供图)(本文来源科技日报,如有侵权请联系删除)
2024-02-29 09:00:00 75
“两会”代表委员谈AI大模型

“两会”代表委员谈AI大模型

从ChatGPT到Sora,以大模型为代表的人工智能浪潮席卷全球。伴随着人才、数据、算力的不断跃级,以大模型为代表的人工智能产业正展现出巨大的潜力和应用前景,正在或将在多个领域发挥重要作用。在今年的全国两会上,代表委员们已就人工智能、大模型的话题展开热议,并带来了富有前瞻性和洞察力的建议。趋势全国政协委员、中国移动党组书记、董事长杨杰:全面推进“AI+”行动 加快形成新质生产力当前,AI大模型取得实质性突破、加速迈入规模应用的新阶段,推动人工智能从助力千行百业提质增效的辅助手段,升级为支撑经济社会转型升级不可或缺的基础设施和核心能力,加快从“+AI”向“AI+”转变。全国人大代表、小米集团董事长雷军:应支持AI与制造业深度融合建议主管部门尽快出台专项政策,以智能制造系统软件、AI大模型和通用仿生机器人的部署应用为重点产业突破方向,支持打造以大模型为代表的人工智能与制造业深度融合的应用场景。建议鼓励智能制造领域企业,特别是龙头企业牵头打造智能制造的实践和示范样点,建设示范性工厂和生产线,探索未来制造模式和企业形态;继续鼓励产学研用深度融合,引导科研机构和高校协同企业,共同投入智能制造标准、规范制定。全国政协委员、360集团创始人周鸿祎:AI上的差距应该能在一两年内追上过去两年中国企业在通用大模型领域追赶得不错,2024年应该会是中国AI的“应用之年”,在许多企业层面的垂直领域,大模型将大有可为。尽管在AI方面,国内入局者与国际领先公司还存在差距,但中国企业学习能力强,AI上的差距应该能在一两年内追上。周鸿祎建议政府和央国企率先提供更多应用场景,专注于“小切口,大纵深”,以推动大模型在垂直领域的实际应用和产业化落地。他认为,企业在采用大模型时要谨慎行事,避免冒进,应该逐步运用人工智能改造业务,循序渐进,通过积小胜为大胜。应用全国政协委员、天娱数科副总经理贺晗:加快拓展人工智能大模型技术应用场景作为新一轮科技革命和产业变革的重要驱动力,人工智能大模型技术正在为经济社会发展持续注入新动能。加快拓展人工智能大模型技术应用场景,对促进人工智能更高水平应用,培育新质生产力,更好支撑高质量发展具有重要意义。应鼓励搭建多层次应用场景供需对接平台,为市场提供“看得见、摸得着”的应用场景,推动应用场景拓展从“出文件”“给政策”向“建机制”“创机会”转变。全国政协委员、上海市竞技体育训练管理中心射击射箭运动中心主任陶璐娜:推动人工智能在“冠军模型”场景应用在我国竞技体育领域,“冠军模型”与人工智能和大数据的结合应用,尚处于探索和试验阶段。为此,陶璐娜建议,加快推动人工智能和大数据技术在“冠军模型”的更多场景应用,进一步开辟竞技体育与科技创新融合发展的新赛道,打造竞技体育全面发展的新动能新优势。全国人大代表、无锡灵山拈花文旅董事长吴国平:建议加快大模型在文旅行业中的应用ChatGPT等问世后正深刻地改变着每一个行业,文旅行业具有市场规模大、应用场景多的特点,呼吁国家有关部门要加大指导力度,鼓励有条件的文旅类企业创新研发,进行产业基础再造、产业链提升及应用赋能。多地旅游业的爆火都昭示着文旅行业成为人民美好生活的重要组成部分。让游客能更加主动参与互动体验,从物质到精神有更好的情绪满足。监管全国政协委员、民建福建省委员会主席吴志明:建议强化我国主要超级平台反垄断监管大部分头部平台企业在市场竞争中逐渐占据优势地位后,将市场资源加速向自身集中,导致平台经济从多元竞争过渡到少数巨头主导的局面。所以,要制定公平的利润分配政策。加强互联网平台监管,引导平台设立公平的利润分配政策,确保各方利益得到平等对待。要建立健全平台权力约束机制。加强对平台经济的反垄断监管力度,从事后监管向事前事中监管转变。要提升反不正当竞争、反垄断执法能力。建立、完善“双反”执法体系和合作机制,形成执法合力。全国人大代表、南昌大学元宇宙研究院院长闵卫东:建立数字之“盾” 拉紧人工智能的“缰绳”在人工智能飞速发展的同时,也要建立起相应的数字之“盾”,拉紧人工智能的“缰绳”。闵卫东认为,目前部分AIGC的内容无法用肉眼识别是虚拟还是现实,就应在数字技术层面加快识别AIGC内容的研究,能够作出智能判断,防范相应的风险。闵卫东还认为,元宇宙、虚拟现实、人工智能等作为一种新质生产力,也将很好赋能地方经济发展,建议部分地区应把握住未来产业的风口以实现跨越式发展。全国政协委员,知乎创始人、CEO周源:对大模型的数据采集进行监督和审查尽管我国在大模型领域取得了一定的成就,但仍面临着一些挑战,其中最显著的问题之一是高质量中文语料资源的短缺。随着大模型技术的深度发展,建议相关政府部门和监管机构针对数据合规应建立相应的监管机制,推动完善AIGC监管立法,保护和规范人工智能领域的数据合规。对大模型的数据采集来源、处理方法、合规性等进行监督和审查。此外,应加强对大模型的社会影响和风险评估,及时发现和解决可能存在的问题,同时要加强数据安全和知识产权的保护措施和加快高质量中文数据集的开发与利用。(本文转载自北京商报,如有侵权请联系删除)
2024-03-07 08:20:00 126
零一万物:开源Yi-9B模型

零一万物:开源Yi-9B模型

零一万物公司最新发布的开源大模型Yi-9B在人工智能领域引起了广泛关注。被冠以“理科状元”之名的Yi-9B在其开源声明中强调了其出众的代码和数学能力,自豪地宣称在这两个领域超越了大多数竞争对手,位列排行榜第二。这一消息是在零一万物宣布Yi-9B模型开源的同时发布的。该模型具有巨大的8.8B参数和默认的4K tokens上下文长度。据公司公布的数据显示,Yi-9B在综合能力(Mean-All)方面表现卓越,超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B。在代码能力(Mean-Code)方面,Yi-9B仅次于DeepSeek-Coder-7B,胜过了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B。在数学能力(Mean-Math)方面,Yi-9B仅次于DeepSeek-Math-7B,胜过了SOLAR-10.7B、Mistral-7B和Gemma-7B。此外,在常识和推理能力(Mean-Text)方面,Yi-9B的表现与Mistral-7B、SOLAR-10.7B和Gemma-7B持平。Yi-9B的开源发布以其卓越的性能和全面的能力而备受瞩目,为人工智能领域的发展贡献了一份重要的力量。模型地址:https://github.com/01-ai/Yi
2024-03-08 08:00:00 91
北京获准开放AI大模型产品占全国近半

北京获准开放AI大模型产品占全国近半

北京市第十六届人民代表大会第二次会议透露,2023年北京生成式人工智能大模型产品获准向公众开放的数量占全国近一半。市长殷勇在会议开幕式上作政府工作报告,报告中指出,北京市将巩固和提升高精尖产业发展优势,出台了30多项细分产业支持政策,其中涉及通用人工智能、人形机器人等领域。今年,北京市计划推动人工智能模型与国际先进水平对标,并加速在政务、医疗、工业和生活服务等领域的应用。生成式人工智能(生成式AI)大模型产品已获准向公众开放,占全国近一半份额。此外,“京通”、“京办”、“京智”三个智慧城市应用终端快速升级拓展,高级别自动驾驶示范区实现了160平方公里的连片运行,全国首个数据基础制度先行区也已启动建设,数字经济增加值占地区生产总值比重达42.9%。
2024-01-24 08:26:26 107
谷歌:发布AI视频生成模型Lumiere

谷歌:发布AI视频生成模型Lumiere

最新发布的视频生成模型——Lumiere,由谷歌推出,展示了卓越的视频生成和编辑能力。该模型采用了创新的空间-时间 U-Net 架构,通过一次传递即可生成完整视频,与传统模型的方法有所不同,后者通常需要先合成远距离关键帧,再进行时间超分辨率处理,以实现全局时间一致性。尽管Lumiere的视频输出被描述为“低分辨率”,分辨率为1024×1024像素,长度为仅5秒,但在用户研究中,其受欢迎程度超过了目前现有的AI视频合成模型。该模型在从书面提示生成视频、将静止图像转换为视频、生成特定风格的视频等方面表现卓越,同时还提供了一系列有趣的功能,如改变图像中特定区域的动画、视频修复等。Lumiere的训练数据来源并未在论文中具体披露,但谷歌表示他们在包含3000万个视频及其文字说明的数据集上训练了T2V(文本到视频)模型。尽管人工智能生成的视频仍处于不断发展阶段,Lumiere似乎在视频合成技术的潮流中处于领先地位,尤其在处理动物在荒谬、不合理、虚拟场景中的视频方面表现突出。论文地址:https://arxiv.org/abs/2401.12945地址:https://lumiere-video.github.io/
2024-01-27 08:05:00 104
社群
人工智能学堂 加入
扫描二维码
Glen 加入
扫描二维码