AINEWS

全球巨头发布AI技术新品

美东时间周二，全球最大的零售商沃尔玛在拉斯维加斯举行的消费电子展CES2024上发布了最新AI技术产品：该公司推出一种生成式人工智能工具，该工具可以允许购物者按特定用例搜索产品，而不是一次只查找一种产品。通过这种生成式人工智能的搜索技术，购物者可以根据一个特定的主题或想法来搜索出一系列相关类别的产品和物品。例如，用户可以就一个足球观看派对请求一些购物帮助，可能会得到关于薯条、鸡翅、饮料和宽屏电视的建议。在以大模型为代表的AI技术持续突破下，零售互联网行业加速拥抱AI。AI技术对零售领域包括零售互联网进行赋能，实现智能化、个性化、高效化的零售服务和运营，对零售行业降本增效、提升销售业绩等起到重要的作用。根据eMarketer的预测报道，生成式AI技术未来三年将在零售行业得到广泛应用。市场空间方面，麦肯锡分析显示，从行业来看，生成式AI将产生2.6万亿至4.4万亿美元的价值，产生价值最大的行业为高科技、零售及银行业。其中在零售和消费品行业，生成式AI将改变游戏规则，创造4000亿至6600亿美元的价值，价值潜力占行业总收入的1.2%-2.0%。上市公司中，天虹股份表示，2018年，公司与腾讯签订战略合作协议，并联合成立智能零售实验室，在智能识别、AI、大数据等领域逐步开展合作。合肥百货全面推进智慧零售转型，部分门店配有智慧导购机器人，公司将结合行业发展趋势、自身发展规划及业务需求等因素，积极关注人工智能等创新技术的发展应用，聚焦数字化转型，加快“数字百大”、“智慧百大”建设。

2024-01-11 11:06:38 170

人工智能有什么用

人工智能的广泛应用和进步不仅为各行各业带来了便利，也为我们提供了前所未有的机会。从日常生活中的智能家居、智能语音助手，到医疗诊断、自动驾驶汽车，再到复杂的高科技领域，人工智能已经无处不在。本文将详细探讨人工智能的五大主要应用领域，包括自动化、数据分析、机器学习、机器人技术以及增强现实。一、自动化人工智能的自动化功能使我们的生活更加便捷。在家庭中，智能家居设备可以根据我们的习惯和偏好自动调整环境，如灯光、温度和音乐。智能语音助手能够通过语音识别和自然语言处理技术，为我们提供各种信息和服务。此外，在工业生产中，人工智能也可以帮助实现生产线的自动化，提高生产效率和质量。二、数据分析人工智能在大数据分析中发挥着至关重要的作用。通过机器学习和深度学习技术，人工智能能够从海量数据中提取有价值的信息，帮助企业做出更明智的决策。在医疗领域，人工智能可以帮助医生更准确地诊断疾病，制定更有效的治疗方案。在金融领域，人工智能可以通过分析市场数据，预测市场走势，帮助投资者做出更明智的投资决策。三、机器学习机器学习是人工智能的一个重要分支，它使计算机能够像人类一样自主地学习和改进。通过训练大量的数据模型，机器学习算法可以从海量数据中发现规律和模式，从而为各种应用提供更好的性能。在教育领域，人工智能可以帮助教师更准确地评估学生的学习进度，为每个学生提供个性化的教学方案。在自动驾驶汽车领域，机器学习算法可以识别路况和障碍物，提高驾驶安全性。四、机器人技术机器人技术是人工智能的一个重要应用领域。通过模拟人类的运动和感知能力，机器人可以执行各种任务，如工业生产、医疗护理和家庭服务。随着技术的进步，机器人已经能够完成更复杂的任务，如手术、搬运重物和照顾老年人。此外，人工智能还可以帮助机器人实现更自然的人机交互，提高用户体验。五、增强现实增强现实技术是人工智能与虚拟现实技术的结合，它可以将数字信息与现实世界相结合，为用户提供更加沉浸式的体验。在教育领域，增强现实技术可以为学生提供更加生动、直观的学习方式。在娱乐产业中，增强现实技术可以为游戏玩家提供更加丰富的游戏体验。此外，人工智能还可以帮助增强现实技术实现更精确的定位和跟踪功能。

2024-01-23 10:29:38 86

人工智能的好处

摘要：随着科技的进步，人工智能已经逐渐融入我们的生活，带来了许多好处。本文将详细阐述人工智能的优点，包括提高生产效率、降低成本、提高生活质量、创造就业机会以及推动创新等方面。同时，文章还将探讨人工智能的局限性，并提出未来发展建议。一、提高生产效率人工智能在生产领域的应用，显著提高了生产效率。例如，在制造业中，机器人能够承担繁琐、重复和危险的劳动，减少人为错误，提高产品质量和产量。此外，人工智能还可以通过大数据分析和预测，优化生产流程，减少浪费，提高资源利用率。这些优势为企业节省了大量人力和物力资源，降低了生产成本。二、降低成本人工智能的应用还能有效降低企业的运营成本。通过智能化的供应链管理，人工智能可以帮助企业优化库存、物流和采购，降低库存成本和运输成本。同时，人工智能还能提供实时市场信息，帮助企业做出更明智的决策，提高市场竞争力。三、提高生活质量人工智能在医疗、教育、交通等领域的应用，显著提高了人们的生活质量。在医疗领域，人工智能可以帮助医生更准确地诊断疾病，制定个性化的治疗方案。在教育领域，智能教学系统可以根据学生的学习进度和反馈，提供更有针对性的教学，提高教育质量。在交通领域，智能交通系统可以实时监测交通状况，提供最佳的交通建议，减少交通拥堵和事故发生率。四、创造就业机会虽然人工智能的发展可能会取代一些传统的工作岗位，但它也会创造新的就业机会。例如，需要人工智能工程师、数据科学家、机器学习专家等高端技能的职业。此外，随着人工智能的应用，许多传统的工作岗位将得到优化，工作效率将大大提高，从而创造出更多的就业机会。五、推动创新人工智能的发展为各行各业带来了巨大的创新机遇。通过大数据分析和机器学习算法，企业可以发现新的市场机会，开发出更先进的产品和服务。此外，人工智能还可以帮助科研人员更快速地获取和利用数据，推动科学研究的进展。六、局限性及发展建议虽然人工智能带来了许多好处，但我们也应注意到它的局限性。例如，人工智能无法替代人类的创造力、情感和直觉等重要能力。因此，我们应关注如何将人工智能与其他人类智慧相结合，以实现更好的发展。未来，我们应加强人工智能的监管和法律制度建设，确保其发展符合社会公共利益。同时，我们应加大对人工智能教育的投入，培养更多的人工智能专业人才，为未来的发展做好准备。

2024-01-16 22:01:18 158

Sam Altman寻求筹集数十亿美元建立AI芯片工厂网络

OpenAI首席执行官Sam Altman计划利用他正力图筹集的数十亿美元，设立一家芯片企业，致力于建立一个涵盖全球的半导体工厂网络。Altman已经与多家潜在的大型投资者进行了会谈，力图筹集巨额资金以支持芯片制造工厂，通俗称为fabs。据报道，该项目将涉及与顶尖芯片制造商的合作，其fabs网络将在全球范围内展开。然而，芯片制造的成本相当昂贵，不仅需要数十亿美元的资金，还需大量的自然资源。随着技术不断进步，用于人工智能应用的芯片成本也在逐年上升。G42总部位于阿布扎比和日本的SoftBank Group（9984.T）是OpenAI首席执行官已经进行过会谈的公司之一，但目前的谈判仍处于初期阶段，尚未确定涉及的合作伙伴和资助方的完整名单。去年10月，ChatGPT的制造商与G42合作，专注于筹集80亿至100亿美元，尽管目前谈判的状态尚不明确。英特尔（INTC.O），台湾芯片制造商台湾积体电路制造公司（2330.TW）和三星电子（005930.KS）都被视为OpenAI的潜在合作伙伴。报告指出，OpenAI、SoftBank、英特尔、TSMC、G42和三星均未立即回应路透社的置评请求，而微软则拒绝置评。Altman在去年11月经历了一次意外罢免后重新回到OpenAI，这一事件曾在科技行业引起轰动。他在被暂时罢免期间一直致力于芯片项目，而在回归后，他重新振作起来。此外，他还与微软就该计划进行了沟通，而这家软件巨头对此表现出浓厚兴趣。

2024-01-22 13:58:11 123

科大讯飞将于1月30日发布星火大模型V3.5

有投资者在互动平台向科大讯飞提问：传闻星火将于1月份进行升级，是否属实？公司回答表示：基于全国产化算力底座“飞星一号”平台的讯飞星火认知大模型V3.5目前已经完成训练，相比1024发布的讯飞星火V3.0，在逻辑推理、文本生成、数学答题及小样本学习能力均实现大幅提升。我们将在1月30日下午2:00举办讯飞星火认知大模型V3.5升级发布会，欢迎关注科大讯飞视频号等平台的在线直播。

2024-01-23 08:10:18 155

TikTok：内测AI生成歌曲功能

TikTok多年来推出了许多在社交媒体上走红的歌曲，但现在它正在测试一项功能，让更多人能够发挥他们的创作才能，同时融入人工智能的帮助。AI Song通过使用大型语言模型Bloom从文本提示中生成歌曲。用户在发布时可以在文本字段中编写歌词。然后，TikTok将推荐使用AI Song为帖子添加声音，用户还可以切换歌曲的流派。TikTok发言人巴尼·胡珀在给The Verge的一封电子邮件中表示：“从技术上讲，这并不是一个纯粹的AI歌曲生成器——名称可能会更改，目前正处于测试阶段。”“使用的任何音乐都来自事先保存在业务内的目录。基本上，它将歌词与预先保存的音乐配对，流派涵盖流行、嘻哈和电子舞曲三种风格。”该功能上周首次被发现。AI Song似乎尚未对所有用户开放，但一些TikTok用户已经开始尝试。到目前为止，结果并不尽如人意。尽管有自动调音的功能，但许多歌曲仍然走调。例如，TikTok用户Jonah Manzano创作了一首歌曲，试图让“喜剧”一词的音节比实际需要的更多。另一位用户Kristi Leilani则重新演绎了一首布兰妮·斯皮尔斯的歌曲，但同样，音调严重走调。AI生成的歌曲在TikTok上并不新奇。现在臭名昭著的AI生成的德雷克和嘻哈之星的歌曲“心在我袖子上”在该平台上走红。Bad Bunny还批评了一些人在TikTok上听类似AI的声音。TikTok并不是唯一一个为用户引入生成AI功能的平台。YouTube也开始测试一项音乐创作功能，允许用户根据文本提示或哼唱的旋律创作歌曲。Dream Track允许用户以其他流行艺术家风格创作30秒的片段。为了提高透明度，TikTok推出了其他功能，帮助识别应用内的AI创建内容，并更新了规定，要求用户在其内容中坦率地使用AI。2024年1月19日更新，东部时间上午11:03：增加了TikTok发言人巴尼·胡珀的声明，确认AI Song仍处于测试阶段，名称可能会更改，并且该功能使用的音乐来自业务内的预先保存目录。

2024-01-23 09:00:00 126

Runway推出多头运动笔刷

Runway ML的Gen-2版本推出了“多动画刷”功能，通过充分发挥人工智能的威力，正在彻底改变视频创作和编辑的方式。这一创新功能不仅是对上一代的显著进步，还提供了增强功能，正在颠覆AI驱动视频生成的格局。多动画刷是RunwayML的Gen-2基础模型的一部分，引入了在视频编辑中前所未有的控制和灵活性水平。它允许用户在单个图像内为最多五个对象添加动画。这一功能显著增强了视频创作者的创作可能性，使他们能够轻松突显特定对象、创建独特效果或引起某些元素的注意。使用多动画刷非常简单且用户友好。用户只需用简单的刷画选择视频的区域应用动画。这包括为每个选定区域选择不同的移动方式、速度或方向。刷画的直观界面提供了一系列自定义选项，从选择移动方向到调整强度都可以轻松完成。甚至可以通过单击一下将所有设置重置为初始状态，提供了新的创作灵活性水平。RunwayML工具库的这一最新补充赋予用户探索新创作可能性的力量，制作出引人注目的视频。这证明了RunwayML不断改进其工具和功能，以满足用户不断变化的需求，推动在AI辅助视频制作领域所能实现的边界。多动画刷现已适用于Gen-2用户，这对那些渴望尝试先进AI工具的视频创作者来说是一个令人兴奋的时刻。总的来说，RunwayML的Gen-2版本中引入的多动画刷代表了AI视频生成的重大飞跃。它为创作者提供了强大的工具，制作动态、引人入胜和视觉效果惊人的内容，提升了AI在创意视频制作领域的能力。Gen-2多动画刷的改进：多对象动画： Gen-2最显著的改进之一是其能够在单个图像中为最多五个对象添加动画。这一功能使视频编辑更具创造性和复杂性，因为用户可以独立操控多个元素。增强创意控制：用户可以为每个选定区域应用不同的移动方式、速度或方向，提供了在创建动态视觉内容方面更高水平的精确度和灵活性。用户友好界面：多动画刷提供直观的界面，使用户能够轻松应用和微调调整，甚至可以在需要时完全重置为原始状态。与Gen-1动画刷的比较：Gen-1动画刷奠定了AI辅助视频操作的基础，但在图像内可以进行动画的范围上有所限制，主要允许单个对象的动画。Gen-2的多动画刷通过提供多对象操作进一步扩展了这一功能，打开了更复杂、微妙的视频编辑可能性。在Gen-2中同时控制视频的多个方面使其成为对于寻求在项目中实现详细和多样化动画的视频创作者来说更为强大的工具。为什么Gen-2更好：增加的灵活性：能够为多个对象添加动画在视频创作中提供了更多的灵活性。更多创意选择：这一功能提供了更多的创意选择，使用户能够以独特的方式赋予视频更多元素生命。改进的用户体验：Gen-2多动画刷的直观和用户友好界面增强了整体用户体验。现在，您可以在Gen-2中分别为5个部分添加动画：☑ 用Midjourney生成图像☑ 切换到多动画刷☑ 为5个元素添加动画这些AI工具的可能性将让您大开眼界！实质上，来自Runway ML的Gen-2“多动画刷”是AI辅助视频编辑领域的颠覆者，为创作者提供了无与伦比的控制和灵活性，使他们能够将他们的愿景变为现实。它代表了从Gen-1动画刷中迈出的重要一步，提供了满足现代视频创作者不断变化需求的先进功能。体验地址：https://runwayml.com

2024-01-23 10:00:00 123

位置感知视觉识别Vision Mamba新模型发布

华中科技大学、地平线以及智源研究院的研究人员最近在视觉领域取得了重要突破，他们提出了一项名为Vision Mamba（Vim）的创新模型。该模型已在arXiv上发布相关研究论文，详细介绍了Vision Mamba块的设计和性能。Vision Mamba集成了双向SSM，以实现对数据依赖的全局视觉上下文建模，并通过位置嵌入实现位置感知的视觉识别。在具体应用中，当将Vim应用于分辨率为1248×1248的图像进行批量推理时，与成熟的视觉Transformer模型DeiT相比，Vim表现更为卓越。其速度提升了2.8倍，同时还节省了86.8%的GPU内存。这意味着Vim在处理大规模高分辨率图像时不仅具备更高的性能，还能更高效地利用计算资源。此外，对于 ImageNet 分类任务、COCO 对象检测任务和 ADE20k 语义分割任务等多个任务，Vim在性能上均实现了显著提高。在与DeiT等成熟的视觉Transformers相比时，Vim不仅加速了任务执行，而且更加高效地利用计算和内存资源。这一结果进一步印证了Vim在视觉领域具有潜在的广泛应用前景，有望成为下一代视觉基础模型的重要候选。项目主页：https://github.com/hustvl/Vim论文地址：https://arxiv.org/pdf/2401.09417.pdf

2024-01-24 08:49:00 133

通义千问：视觉理解模型Qwen-VL升级

阿里云最新宣布了通义千问视觉理解模型Qwen-VL的升级版本——Max版本。这一版本的模型在视觉推理和中文理解能力上得到了显著的加强，将多模态技术推向了一个新的高度。Qwen-VL Max版本不仅能够根据图片识别人物，回答问题，创作和编写代码，而且在多个权威测评中也获得了令人瞩目的成绩。这些成绩使得Qwen-VL Max版本与OpenAI的GPT-4V和谷歌的Gemini Ultra媲美，标志着大型语言模型领域的新一轮竞争的到来。近来，大型语言模型领域的研究重点逐渐从LLM（大语言模型）转向了多模态，而通义千问视觉理解模型Qwen-VL Max版本正是这一趋势的最新代表。在过去的半年中，OpenAI、谷歌等巨头相继推出了多模态模型，而阿里云在2023年8月发布并开源的Qwen-VL模型则引领了这一潮流。Qwen-VL不仅具备图文理解的能力，而且在同等规模通用模型中表现卓越，远超同期竞争对手。其升级版本Max的发布，进一步巩固了在多模态领域的领先地位，成为与GPT-4V和Gemini Ultra相匹敌的重要存在。在多模态模型的评价中，Qwen-VL Max版本的整体性能与GPT-4V和Gemini Ultra不相上下。在诸如MMMU、MathVista等领域的测评中，Qwen-VL Max版本甚至超越了所有开源模型，表现出色。在文档分析（DocVQA）和中文图像相关（MM-Bench-CN）等任务上，其表现更是达到了世界领先水平。这一系列的优异成绩使得Qwen-VL Max版本成为当前多模态大模型领域的焦点，引领着该领域的发展方向。

2024-01-29 22:41:02 125

美图与三星深度合作，打造AI图像编辑新体验

三星电子于今日成功举办了Galaxy S24系列中国新品发布会，与合作伙伴美图公司深化合作，为用户提供全新的AI图像编辑体验。美图公司携手自研的AI视觉大模型MiracleVision（奇想智能），为Galaxy S24系列用户提供云端解决方案，进一步提升了手机相册的生成式编辑功能。此前，双方已经成功合作推出了多项端侧功能，如“AI图生图”、“海报拼图”和“一键大片”等，为用户带来了更多创意和便捷的图像编辑选择。美图影像研究院（MT Lab）团队依托MiracleVision的强大模型能力与丰富的AI技术经验，为Galaxy S24系列的AI图像能力注入新的活力，使用户能够享受到更高效、便捷的图像创作体验。这次深化合作进一步巩固了双方在图像处理领域的伙伴关系，为用户提供了更为卓越的手机使用体验。

2024-01-29 22:49:16 153