央视上线两会AI主播小天和小东

央视上线两会AI主播小天和小东

今年两会期间,央视财经新媒体推出了AI主播项目,以总台央视主持人郭若天和孟湛东为原型,分别命名为小天和小东。这两位AI主播在两会期间全天候为用户提供经济、产业、旅游等领域问题的解答服务,以“全天在线、真人形象、实时解答”为特点,为用户呈现了全新的视觉与互动体验。这一创新项目得到了蚂蚁灵境数字人平台的技术支持,采用了行业领先的数字人技术,包括虚拟形象驱动、动态神经辐射场和预训练语音合成等技术。其在数字人建模精度和动态细节效果上表现出显著优势,仅需5分钟的视频数据即可成功“复刻”AI主播,具备高建模精度、完整的动态细节、自然的发音和高还原度。用户可以通过央视财经APP随时提问这两位AI主播有关“2024年值得投资的方向”、“有哪些风口行业”、“科技创新政策支持”等问题,即时获取答案。这一AI主播项目不仅在内容呈现和互动形式上进行了创新,也为新闻报道领域引入了全新的模式。借助AI技术,不仅提高了新闻报道的效率,还使新闻从业人员更专注于创造性工作,从而为观众提供更高质量的内容。
2024-03-08 08:10:00 75
高通发布《通过NPU和异构计算开启终端侧生成式AI》报告

高通发布《通过NPU和异构计算开启终端侧生成式AI》报告

最近高通公司发布了《通过NPU和异构计算开启终端侧生成式AI》技术白皮书中文版,深度探讨了NPU和异构计算在芯片设计中的关键作用。报告详细解释了NPU(神经网络处理器)的低功耗AI推理加速设计,并着重强调其在高通旗舰智能手机芯片中的核心地位。这一设计允许NPU随着新的AI算法、模型和用例的不断发展而持续演进。报告还介绍了高通的AI引擎,它是一种包含Hexagon NPU、高通Adreno GPU、Kryo、Oryon CPU、传感器中枢和内存子系统的异构计算架构。该引擎的设计旨在充分利用异构处理器组合,如CPU和GPU,以实现最佳应用性能、能效和电池续航。通过结合NPU的使用,异构计算为终端用户提供了全新的生成式AI体验,特别是在应对垂直领域中多样化需求和计算需求的情境下。高通公司强调了异构计算的重要性,认为这是为生成式AI定制设计的全新计算架构的核心。报告强调生成式AI用例的增加需要专为AI设计的神经网络处理器(NPU),并通过异构处理器的组合,如CPU和GPU,来实现最佳性能。公司还展示了第三代骁龙8和骁龙X Elite在AI性能方面的领先地位,并强调了异构计算的能力,以最大化生成式AI终端用户体验。高通公司通过整合技术、定制芯片设计、全栈AI优化和生态系统支持,推动终端侧生成式AI的发展和应用,并促进规模化扩展。通过NPU架构的不断演进和强大的异构计算引擎,高通为终端用户提供了更为卓越、高效的生成式AI体验,引领AI技术在移动设备领域的前沿。关注以下公众号,回复【AI技术白皮书】,免费获取文档。
2024-03-08 08:10:00 72
阿里:发布高保真图像到视频生成新方法

阿里:发布高保真图像到视频生成新方法

阿里团队提出了一项创新性的技术,名为免调谐噪声校正(Tuning-Free Noise Rectification),适用于改善主流视频扩散模型的性能。该方法以实现高度保真的输出为目标,通过注入更准确的图像信息和进行噪声校正的方式来达到这一目标。具体来说,在给定特定图像的情况下,该方法首先向输入图像潜在地引入噪声,以保留更多细节,然后通过适当的校正对潜在噪声进行去噪,以减轻噪声预测偏差。此外,该方法的独特之处在于其无需任何额外调整即可直接应用。论文链接:https://noise-rectification.github.io/
2024-03-08 08:05:00 68
零一万物:开源Yi-9B模型

零一万物:开源Yi-9B模型

零一万物公司最新发布的开源大模型Yi-9B在人工智能领域引起了广泛关注。被冠以“理科状元”之名的Yi-9B在其开源声明中强调了其出众的代码和数学能力,自豪地宣称在这两个领域超越了大多数竞争对手,位列排行榜第二。这一消息是在零一万物宣布Yi-9B模型开源的同时发布的。该模型具有巨大的8.8B参数和默认的4K tokens上下文长度。据公司公布的数据显示,Yi-9B在综合能力(Mean-All)方面表现卓越,超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B。在代码能力(Mean-Code)方面,Yi-9B仅次于DeepSeek-Coder-7B,胜过了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B。在数学能力(Mean-Math)方面,Yi-9B仅次于DeepSeek-Math-7B,胜过了SOLAR-10.7B、Mistral-7B和Gemma-7B。此外,在常识和推理能力(Mean-Text)方面,Yi-9B的表现与Mistral-7B、SOLAR-10.7B和Gemma-7B持平。Yi-9B的开源发布以其卓越的性能和全面的能力而备受瞩目,为人工智能领域的发展贡献了一份重要的力量。模型地址:https://github.com/01-ai/Yi
2024-03-08 08:00:00 77
OpenAI、谷歌、微软、Meta联名签署AI公开信

OpenAI、谷歌、微软、Meta联名签署AI公开信

在飞速发展的科技领域,人工智能(AI)的初衷变得愈发明确——为人类提供比以往更为强大的力量,使我们能够在前所未有的程度上茁壮成长。尽管AI仍处于早期阶段,但其发展趋势承诺将以前所未有的方式彻底改变我们的日常生活。AI带来的一个关键进展是AI辅导,旨在协助个体的学习旅程。这些智能工具通过提供个性化、易于获取的学习体验,重新定义了教育。此外,由AI驱动的翻译工具正在打破语言障碍,促进更好的全球连接和交流。在医疗领域,AI引导的医学诊断正崭露头角。通过利用机器智能,医疗专业人员可以提高诊断准确性,最终改善患者的治疗效果。AI加速科学发现的潜力也在不远的将来,研究人员正在利用其力量深入探讨复杂问题并找到创新解决方案。通过自然语言交互处理日常任务的AI助手正变得无处不在。这些虚拟伙伴注定要简化和增强我们的日常生活,使其更加便捷和高效。尽管AI具有巨大的潜力,但其对人类的影响是一种微妙的平衡,需要深思熟虑。与历史上的变革性技术如印刷术、内燃机、电力和互联网相媲美,AI对社会的影响将由其人类创造者和使用者的选择和深思熟虑来塑造。最大化AI的好处并减轻潜在风险的责任落在我们作为一个集体的肩上。作为个体,我们必须认识到在开发和利用AI方面所做的选择,以确保对当前和未来的世代都产生积极的影响。呼吁行动是明确的——每个人都在塑造AI未来中发挥一定的作用。无论是通过创造、学习、开发新产品和服务,还是解决全球性挑战,每个人都可以为构建改善人类生活的AI做出贡献。在此签署的人们已经亲身体验了AI的变革性好处,并致力于构建一个为人类谋福祉的AI未来。这一集体承诺邀请其他人加入这一运动,共同塑造一个为所有人提供更加光明和有前途的未来的AI格局。
2024-03-07 08:30:00 85
ChatGPT新增文本朗读功能

ChatGPT新增文本朗读功能

OpenAI 宣布 ChatGPT 推出了全新的“朗读”功能。现在,用户只需点击并按住消息,然后点击“Read Aloud(大声朗读)”按钮,即可在 iOS 或安卓系统上轻松聆听对话文本内容的朗读。在网页端,用户同样可以通过滚动并点击消息下方的“Read Aloud”按钮来享受这一便捷功能。
2024-03-07 08:30:00 79
“两会”代表委员谈AI大模型

“两会”代表委员谈AI大模型

从ChatGPT到Sora,以大模型为代表的人工智能浪潮席卷全球。伴随着人才、数据、算力的不断跃级,以大模型为代表的人工智能产业正展现出巨大的潜力和应用前景,正在或将在多个领域发挥重要作用。在今年的全国两会上,代表委员们已就人工智能、大模型的话题展开热议,并带来了富有前瞻性和洞察力的建议。趋势全国政协委员、中国移动党组书记、董事长杨杰:全面推进“AI+”行动 加快形成新质生产力当前,AI大模型取得实质性突破、加速迈入规模应用的新阶段,推动人工智能从助力千行百业提质增效的辅助手段,升级为支撑经济社会转型升级不可或缺的基础设施和核心能力,加快从“+AI”向“AI+”转变。全国人大代表、小米集团董事长雷军:应支持AI与制造业深度融合建议主管部门尽快出台专项政策,以智能制造系统软件、AI大模型和通用仿生机器人的部署应用为重点产业突破方向,支持打造以大模型为代表的人工智能与制造业深度融合的应用场景。建议鼓励智能制造领域企业,特别是龙头企业牵头打造智能制造的实践和示范样点,建设示范性工厂和生产线,探索未来制造模式和企业形态;继续鼓励产学研用深度融合,引导科研机构和高校协同企业,共同投入智能制造标准、规范制定。全国政协委员、360集团创始人周鸿祎:AI上的差距应该能在一两年内追上过去两年中国企业在通用大模型领域追赶得不错,2024年应该会是中国AI的“应用之年”,在许多企业层面的垂直领域,大模型将大有可为。尽管在AI方面,国内入局者与国际领先公司还存在差距,但中国企业学习能力强,AI上的差距应该能在一两年内追上。周鸿祎建议政府和央国企率先提供更多应用场景,专注于“小切口,大纵深”,以推动大模型在垂直领域的实际应用和产业化落地。他认为,企业在采用大模型时要谨慎行事,避免冒进,应该逐步运用人工智能改造业务,循序渐进,通过积小胜为大胜。应用全国政协委员、天娱数科副总经理贺晗:加快拓展人工智能大模型技术应用场景作为新一轮科技革命和产业变革的重要驱动力,人工智能大模型技术正在为经济社会发展持续注入新动能。加快拓展人工智能大模型技术应用场景,对促进人工智能更高水平应用,培育新质生产力,更好支撑高质量发展具有重要意义。应鼓励搭建多层次应用场景供需对接平台,为市场提供“看得见、摸得着”的应用场景,推动应用场景拓展从“出文件”“给政策”向“建机制”“创机会”转变。全国政协委员、上海市竞技体育训练管理中心射击射箭运动中心主任陶璐娜:推动人工智能在“冠军模型”场景应用在我国竞技体育领域,“冠军模型”与人工智能和大数据的结合应用,尚处于探索和试验阶段。为此,陶璐娜建议,加快推动人工智能和大数据技术在“冠军模型”的更多场景应用,进一步开辟竞技体育与科技创新融合发展的新赛道,打造竞技体育全面发展的新动能新优势。全国人大代表、无锡灵山拈花文旅董事长吴国平:建议加快大模型在文旅行业中的应用ChatGPT等问世后正深刻地改变着每一个行业,文旅行业具有市场规模大、应用场景多的特点,呼吁国家有关部门要加大指导力度,鼓励有条件的文旅类企业创新研发,进行产业基础再造、产业链提升及应用赋能。多地旅游业的爆火都昭示着文旅行业成为人民美好生活的重要组成部分。让游客能更加主动参与互动体验,从物质到精神有更好的情绪满足。监管全国政协委员、民建福建省委员会主席吴志明:建议强化我国主要超级平台反垄断监管大部分头部平台企业在市场竞争中逐渐占据优势地位后,将市场资源加速向自身集中,导致平台经济从多元竞争过渡到少数巨头主导的局面。所以,要制定公平的利润分配政策。加强互联网平台监管,引导平台设立公平的利润分配政策,确保各方利益得到平等对待。要建立健全平台权力约束机制。加强对平台经济的反垄断监管力度,从事后监管向事前事中监管转变。要提升反不正当竞争、反垄断执法能力。建立、完善“双反”执法体系和合作机制,形成执法合力。全国人大代表、南昌大学元宇宙研究院院长闵卫东:建立数字之“盾” 拉紧人工智能的“缰绳”在人工智能飞速发展的同时,也要建立起相应的数字之“盾”,拉紧人工智能的“缰绳”。闵卫东认为,目前部分AIGC的内容无法用肉眼识别是虚拟还是现实,就应在数字技术层面加快识别AIGC内容的研究,能够作出智能判断,防范相应的风险。闵卫东还认为,元宇宙、虚拟现实、人工智能等作为一种新质生产力,也将很好赋能地方经济发展,建议部分地区应把握住未来产业的风口以实现跨越式发展。全国政协委员,知乎创始人、CEO周源:对大模型的数据采集进行监督和审查尽管我国在大模型领域取得了一定的成就,但仍面临着一些挑战,其中最显著的问题之一是高质量中文语料资源的短缺。随着大模型技术的深度发展,建议相关政府部门和监管机构针对数据合规应建立相应的监管机制,推动完善AIGC监管立法,保护和规范人工智能领域的数据合规。对大模型的数据采集来源、处理方法、合规性等进行监督和审查。此外,应加强对大模型的社会影响和风险评估,及时发现和解决可能存在的问题,同时要加强数据安全和知识产权的保护措施和加快高质量中文数据集的开发与利用。(本文转载自北京商报,如有侵权请联系删除)
2024-03-07 08:20:00 111
Stability AI与VAST推出快速将单图转3D模型

Stability AI与VAST推出快速将单图转3D模型

稳定性AI与国内3D生成模型公司VAST宣布了一项引人注目的合作,联手推出了TripoSR——一款快速的3D物体重建模型,并开源发布。TripoSR是一款受到LRM启发的人工智能模型,专注于视觉内容生成,满足娱乐、游戏、工业设计和建筑等领域不断增长的需求。该模型具备在极短时间内从单张图像生成高质量3D模型的能力,即使在无GPU的情况下也能运行。在经过英伟达A100的严格测试后,TripoSR表现出色,能够在约0.5秒内生成草稿质量的3D输出,带有纹理网格,明显领先于其他开源图像转3D模型工具,如OpenLRM。为了支持广泛的使用,Stability AI根据MIT许可提供了TripoSR模型的权重和源代码,供商业、个人和研究用途自由下载。在模型的训练过程中,Stability AI采用了多种数据渲染技术,提高了模型的泛化能力。通过精心设计更高质量的Objaverse数据集子集训练数据,TripoSR更接近复制现实世界中的图像分布,进一步提升了泛化性能。此外,模型经过通道数优化、掩模监控和更高效的裁剪渲染策略的多项技术改进,性能更为出色。TripoSR的发布是Stability AI和VAST合作的成果,为用户提供了高效、快速且质量优越的3D物体重建解决方案,将在不同领域展现广泛的应用潜力。项目地址:https://github.com/VAST-AI-Research/TripoSR技术报告:https://stability.ai/s/TripoSR_report.pdf
2024-03-07 08:10:00 80
文生图大模型Stable Diffusion 3论文发布

文生图大模型Stable Diffusion 3论文发布

稳定扩散3技术发布:Stability AI引领文本-图像生成创新在最新的技术突破中,Stability AI发布了其引领文本-图像生成领域的最新力作——稳定扩散3。本次发布的研究论文详细揭示了支持这一技术创新的底层技术细节。稳定扩散3的表现超越了同类文本到图像生成系统,例如DALL·E 3、Midjourney v6和Ideogram v1,尤其在排版和提示依从性方面,通过人类偏好评估取得了显著的优势。Stability AI采用了全新的Multimodal Diffusion Transformer(MMDiT)架构,为图像和语言表示分别使用了独立的权重集合,从而在文本理解和拼写能力方面迈出了坚实的一步。在早前宣布稳定扩散3早期预览后,如今Stability AI发布了详细的研究论文,该论文将很快在arXiv上公开,并邀请各界人士加入等待列表,参与到这一技术的早期预览中。性能卓越以稳定扩散3为基准,Stability AI通过人类评估制作了一份详细的图表,清晰地展示了该技术在视觉美学、提示遵循和排版等方面相对竞品的优势。通过与其他开源和封闭系统进行对比,稳定扩散3在“提示遵循”、“排版”和“视觉美学”等方面均取得了出色的表现。技术创新解析为了实现文本到图像的生成,Stability AI采用了MMDiT架构,该架构能够处理文本和图像的多种模态。独立的权重集合为文本和图像表示赋能,提高了整体理解和生成能力。灵活性与性能的完美融合稳定扩散3不仅在提示遵循方面取得了显著进展,使得模型能够创造关注各种主题和品质的图像,同时保持图像风格的高度灵活性。技术细节深挖通过采用修正流(RF)公式,稳定扩散3实现了数据和噪声在线性轨迹上的连接,从而创造了更为直线的推断路径,减少了采样步骤。同时,引入新的轨迹采样计划,更加注重轨迹中部分的权重,提高了模型对更具挑战性的预测任务的适应能力。未来发展的趋势通过对文本到图像合成的缩放研究,Stability AI展示了对模型规模和训练步骤的灵活适应性。验证损失的平滑下降趋势与自动图像对齐度量(GenEval)和人类偏好评分(ELO)之间呈现出强烈的相关性,预示着未来模型性能的不断提升。Stability AI的稳定扩散3技术的发布标志着文本-图像生成领域的一次创新飞跃。通过独特的技术架构和性能卓越,Stability AI展示了其在人工智能领域的引领地位。随着更多的应用场景的探索,我们有理由期待,Stability AI将在未来为人工智能技术带来更多令人振奋的突破。论文地址:https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf
2024-03-07 08:05:00 62
清华大学:宣布为2024级新生提供“AI成长助手”

清华大学:宣布为2024级新生提供“AI成长助手”

最近,清华大学召开了2024年全校教职工大会,对学校的改革发展形势及2024年的重点工作进行了通报。党委书记邱勇在会上明确表示,必须坚定不移加强党的全面领导,以高质量党建引领高质量发展。他要求学校聚焦立德树人主责主业,全面提高人才自主培养质量,着力培养拔尖创新人才,并以创新为引领,积极投身创新驱动发展战略实施,服务高水平科技自立自强。校长李路明在工作报告中着重介绍了清华大学在人工智能领域的探索与布局。他宣布学校将推动建设100门人工智能赋能教学试点课程,并为每一位2024级新生配备“AI成长助手”。李路明表示,学校高度重视新型人工智能技术的影响,将在资源、规划、标准等方面持续发力,不断促进人工智能深度融入教育教学、人才培养和管理服务等各方面工作,为加快推进我国教育现代化发挥先行先试作用。值得注意的是,清华大学的举措与其他高校的行动相呼应。南京大学在新学期工作布置会上宣布了“人工智能通识核心课程”,而北京大学则推出了“VR体育课”,结合体育科学与人工智能、数据分析和健康管理。这表明国内高校在人工智能领域正积极进行课程及教学规划,共同推动教育的现代化发展。这一系列措施不仅为学生提供了更多的学科选择,同时也为我国在人工智能领域培养了更多高素质的人才。
2024-03-07 08:00:00 87
社群
人工智能学堂 加入
扫描二维码
Glen 加入
扫描二维码