AINEWS

10分钟前！GPT-4-Turbo 推出了正式版

10 分钟前GPT-4 Turbo 推出了正式版OpenAI 官方发布关于正式版虽然 GPT-4-Turbo 发布已久，但一直以“预览版”的方式提供。而就在刚才，OpenAI 发布了 GPT-4-Turbo 的正式版。主要信息包括：▶ 全面开放，可通过“gpt-4-turbo”来使用此模型，最新版本为“gpt-4-turbo-2024-04-09”▶ 基础能力更新，按官方说法：Majorly improved GPT-4 Turbo model▶ 自带读图能力，无需使用 4v 接口▶ 128k 上下文▶ 训练数据截止至 2023 年 12 月这里查阅接口信息：https://platform.openai.com/docs/models/gpt-4-turbo-and-gpt-4 价格方面，和之前的 GPT-4-Turbo 保持一致，即：▶ 输入：$10.00 / 100万 tokens▶ 输出：$30.00 / 100万 tokens▶ 读图：最低 $0.00085 / 图这里查阅价格信息：https://openai.com/pricing 频率限制方面，以最高级 Tire 5 为例，官方说明中：▶ 最高并发：10,000 次/ 分钟▶ 最高处理：1,500,000 tokens / 分钟这里查阅相关限制：https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-five 我看了一下后台，还是老的限制，应该还没改完：▶ 最高并发：3,000 次/ 分钟▶ 最高处理：250,000 tokens / 分钟这里查看你的限制：https://platform.openai.com/account/limits GPT-4 还有哪些版本▶ GPT-4发布于去年的 3 月 14 日（即 0314 版），后续更新 0613 版，支持 8k 上下文，是经典版的 GPT-4。- 输入：$30.00 / 100万 tokens- 输出：$60.00 / 100万 tokens ▶ GPT-4-32k与 GPT-4 同期发布，也是有 0314 和 0613 两个子版本，支持 32k 上下文，是当时上下文最长的模型，但非常贵。- 输入：$60.00 / 100万 tokens- 输出：$120.00 / 100万 tokens另说一下，这个模型是邀请制，至今未公开提供。 ▶ GPT-4-Turbo-Preview （即 GPT-4 Turbo 预览版）发布于去年的 11 月 6 日（即 1106 版），后续更新 0125 版，支持 128k 上下文，并且大幅降价。- 输入：$10.00 / 100万 tokens- 输出：$30.00 / 100万 tokens ▶ GPT-4-Vision-Preview （即 GPT-4 Turbo 的读图版）和 GPT-4-Turbo-Preview 同一时间发布，也包括 1106 版和 0125 版，价格保持一致，但给的用量不多。- 输入：$10.00 / 100万 tokens- 输出：$30.00 / 100万 tokens读图的价格看分辨率：最低 $0.00085 / 图(本文来源赛博禅心，如有侵权请联系删除)

2024-04-11 09:48:42 56

实用至上：智能体/Agent 是什么

Agent 的起源不做词义追源，仅从大众角度，这个事儿是去年初开始的，也就是 2023 年 2-3 月。标志性事件包括：AutoGPT 等开源项目的发布，这是第一批基于自然语言的 AI 自动化实践：你告诉它一个任务，它就会通过自然语言的自我对话，将这个任务进行拆分、规划并实现。斯坦福小镇一类的项目实践：给予不同的 Bot 以不同的人格，搭配记忆窗口，让它们之间相互对话。发表于 2 月的论文《Toolformer: 大模型可以教自己使用工具》，以及 OpenAI 在 3 月底发布的插件计划：这意味着，大模型从原来的“思想家”，通过对外部工具的使用，变成了实干家。《AI 学会使用工具了》2023年2月14日，报道自赛博禅心现在的 Agent时至今日，对于 Agent 是什么，可能还没有一个标准的定义。一个常见的观点是，Agent 是一种让 AI 以类似人的工作和思考方式，来完成一系列的任务。一个 Agent 可以是一个 Bot，也可以是多个 Bot 的协同。就像是职场里，简单的工作独立完成，复杂的工作协作完成一样。对于每个 Bot 来说，可能会包括：一个大脑：判断和规划行为，这里通常用 GPT-4或同水平的 LLM；眼睛和手：确认信息和使用外部工具，一般是各种插件/action/api；工作纪要：储存已经发生的事，通常的媒介是上下文窗口，或者数据库；行为SOP：明确这个 Agent 的身份、任务、目标和机制。这个 SOP 可能是用户给的，也可能是由其它 Bot 给出的。再具象一点，这里我从 GPTs 里截了个图：对于 GPTs，通常被认为是由 OpenAI 设计的简化版的 Agent。默认情况下，只能进行单 Bot 交互：一个大脑：在 ChatGPT GPT Store 里，GPT-4 是唯一可选的 LLM；眼睛和手：可以在 Capabilities 里勾选由 OpenAI 提供的第一方能力，也可以通过Actions 来拓展更多的外部能力；工作纪要：一般来说就是对话记录，GPTs 可以回顾之前的对话；行为SOP：存放在 Description, Instructions 以及 Knowledge 里。 OpenAI 的 Agent 演进以 OpenAI 为例，我们看看 Agent 是如何一步步演进的。去年 3 月底，OpenAI 宣布了插件计划，并在 5 月上线了插件商店，这也标志了 OpenAI 揭开 Agent 战局的第一步。在当时 OpenAI 给开发者发送的指引中，给了这样的 Todo：第一步：开发接口，来定义 ChatGPT 可以调用的功能。接口可以是新开发的，也可以是改造现有的第二步：写一份文档，给 ChatGPT 来看，让它知道什么时候去调用接口。当然，这里要遵循一定的格式，然后用自然语言来写。如果你做过 OpenAI API 的开发，可能会觉得这个文档有些熟悉，这不就是 Fuction Call 吗？没错，在 2023 年 6 月 13 日，OpenAI 发布了 Function Call 模式，让大模型可以来调用外部工具，用的就是非常类似的方案。再往后，OpenAI 的相关工作人员做了一系列的 Research，关于 Agent 的最佳实践。同时的，也发布了 Custom Instruction 指令的相关功能。之后，ChatGPT 推出了 All Tools 功能。也就是回答用户问题时，不再需要用户自主的来选择工具，这可以视作是“自动版的Plugin”，覆盖了三款官方工具：Browsing, Advanced Data Analysis 和 DALL·E。时间推移，在2023 年 11 月 6 日的时候，在 OpenAI 开发者大会上，Sam Altman 宣布了 GPTs，这通常被认为是 OpenAI 推出了其第一个正式版的 AI Agent。在最初的版本中，包括以下功能允许用户创建多个 Bot，自定义它们的身份和回答风格。并且这些 Bot 可以分享Bot 可以自有使用三款官方工具：Browsing, Advanced Data Analysis 和 DALL·EBot 也可以通过 Action 的方式（类似 API 的东西），去调用任何的外部能力Bot 可以有自己的数据空间，允许用户对这些数据进行 QA。比如在《我刚弄个贼实用的GPTs》中，我上传了 OpenAI 的开发文档，帮助开发者快速生成 OpenAI 的调用代码同时，在11月06日的时候，OpenAI 也更新了几个影响深远的接口：Function Calling：更新多参数生成功能，可以让一轮对话完成多项任务JSON Mode：让 API 通过 JSON，而非文字，来做出回应Seed：设定随机值，提高一致性Assistants API & Code Interpreter：可以理解为把 ChatGPT 的 Bot，搬到了 API 里Retrieval：简易化知识库构建在最近 GPTs  体系上线了 GPT Store，有些媒体称其为 OpenAI 的 App Store 时刻，但其实并不相同。在 GPT Store 里，用户可以搜索和使用为各项任务所开发的 GPTs。紧随 GPT Store 上线的，还有 @GPTs 功能，也就是在任何的对话中，你都可以手动的让某个 GPTs 接管这个对话内容，做出更好的输出。值得一提的是，由于 GPT Store 没有开放支付入口，所以目前几乎所有的 GPTs 都是免费的。对此，OpenAI 也承诺了会给头部开发者提供激励：《GPTs 商店，要发钱了！！！》。其它 Agent 平台之前和 OpenAI 的相关负责人聊过，ChatGPT 的主要定位是“开箱即用的消费级产品”。那这里，自然给“较为复杂的生产级产品”留下了生态空间。这里，我们也来探讨下这类产品。主要的 AI 玩家都会对这方面有所涉足，也各有侧重。比如来传统大厂自字节扣子/coze，百度的灵境矩阵，也比如来自 AI 初创公司的 Dify 等等。以扣子为例，对比与 GPTs Store，主要的体感区别包括：免费，至少目前是完全免费的有数十个官方插件，对比与 GPTs 里只有3个可以用类似低代码的方式，构建Workflow，并被 Bot 调用可以将捏好的 Bot 发布到其它平台（比如飞书，公众号），同时支持 API其中后两条极为核心。我的 Agent 的实战一个设计良好的 Agent 可以提供极大的生产力，并创造极高的价值。前几天大火的 Devin，被称为“第一位由 AI 担任的软件工程师”，它可以自主的去学会如何使用不熟悉的技术，自主的生成代码、调试bug和部署应用。Agent 也可以替代现有的很多软件工具，去完成工作中繁琐的任务。举个例子，我正打算开一个专栏，叫做“乘风破浪的少年们”，去讲述和记录那些在这次 AI 浪潮中，登上世界舞台的中国人，用对话的形式。类似这种：《奥特曼专访：关于 GPT-5、Sora、Ilya、Q*、AGI、外星人等等一切》。这里对我来讲的一个很大挑战：我需要整理大量的文字稿，并且把它排版出来，这并不轻松，也很占时间。我希望有一个 Agent 来帮我做这件事情。昨天下午，我和 Owen（沉浸式翻译的作者）去参加了一个 Hackathon，现场有了灵感，并梳理出了这个 Agent 的思路：第一步：将对话音频文件，通过 AI（比如whisper）转化成文字稿第二步：将文字稿用 AI 转化成 QA 问答对，以 json/csv 的方式储存第三步：将 QA 问答对，转化成 HTML（可以导入进微信公众号）我们花了俩小时，用扣子，把这个 Agent 给搓了出来，起名《带带弟弟排版器》，希望大家带带单打独斗的弟弟。也顺道着把我上次参加 OpenAI  的红队活动的笔记，转成了 .csv 然后把这个 .csv 文件丢给了《带带弟弟排版器》就有了昨天的文章：《我参加了 OpenAI 红队的活动，并带来了一些笔记》同样的，这一篇文章《中学生能看懂：Sora 原理解读》，是用我写的另一个 Agent 完整生成的，包括排版。我相信，在 AGI 来之前，Agent 是一个很棒的替代方案。不过现在还有俩主要毛病：1.不够稳定；2.算力有点贵 (本文来源赛博禅心，如有侵权请联系删除)

2024-04-08 10:11:40 94

ChatGPT 突然放开了账户限制，面向所有人开放

大门终于打开。奥特曼 OpenAI 的旗舰产品 ChatGPT 突然宣布：将面向所有人开放，无论你有没有注册账户。从今天开始，访问 Chat.openai.com 将不再要求用户登录，用户将直接进入与 ChatGPT 的对话界面，且界面的模式与采用登录方式的用户一样，你可以与 ChatGPT 尽情聊天。如下图：目前 GPT-3.5 支持所有人使用，而 GPT-4 则只支持 ChatGPT 的付费会员使用。不过，没有 ChatGPT 账户的用户，将无法获得与拥有账户的用户相同的功能，这些功能包括：无法保存或共享聊天记录、使用自定义指令，或者其他通常需要与永久账户关联的功能。当然，ChatGPT 也仍然支持你成为注册用户，然后登录。需要注意的是：正如我前文所述，此前 ChatGPT 的增长已经基本停滞——其流量峰值，出现在了 2023 年的 5 月，此后，再也没有恢复到峰值。也就是说，ChatGPT 突然打开大门，应该是其迫于增长压力和竞争压力导致的。可以预见：很快，ChatGPT 将因此迎来一个陡峭的访问量激增，因为会有大量的人来到 Chat.openai.com 试用 ChatGPT。不过我其实认为，大型通用聊天机器人的用户界面会有天花板。因为随着如 AI 搜索引擎 Perplexity 等各种 AI 机器人的服务越来越完善，甚至包括，像微软公司通过 Windows 操作系统直接把 AI Chat（Copilot）安装在了用户电脑屏幕底部的任务栏上，甚至是直接做进了微软电脑 Surface 的键盘上，未来用户到底会使用哪家服务的竞争将会越来越激烈。(本文来源硅发布，如有侵权请联系删除)

2024-04-08 10:04:57 65

数智员工，重塑一个新未来

科技进步不断重塑人类工作的本质，在如今的生成式AI与数字化转型热潮下，数智员工悄然崛起，成为一股不可忽视的力量。IDC报告显示，中国AI数字人市场规模呈现高速增长趋势，预计到2026年将达102.4亿元人民币。数智员工的应用场景非常广泛，包括数据录入和处理、网络营销、客户服务、内部管理和数据分析等。数智员工将出现在哪些全新的生产、生活场景?应该如何更好的迎接“数智员工”新趋势？当数智员工，从一项技术创新的产物，真正成为一个产业，走向大规模的落地应用，未来将如何转化为现实生产力，如何形成完整的商业模式，如何推动下一阶段的创新？3月26日，盛景网联高级合伙人兼AIC人工智能产业孵化器负责人颜艳春，今日人才创始人、董事长兼首席执行官、夸夸菁领创始人胡伟带来了重磅解读，这也是盛景【前沿科技未来产业】系列的第120场直播。今日人才是一家创新驱动的平台型人力资源科技公司，致力于以大数据、云计算、人工智能等技术赋能人力资源行业，通过人才岗位画像、人岗智能匹配、人才智能推荐等方式，实现企业岗位与人才需求的精准适配，让职场不再错配。今日人才也是盛景嘉成投资的优秀企业。颜艳春认为，随着生成式人工智能大模型的超级智力接入每一个人，每一台机器，未来将涌现数千亿的有数基肉身或硅基肉身的机器人问世，集结为未来最庞大的AI劳动力大军。能够提供AI劳动力的公司将成为未来经济中的重要玩家，有潜力进入万亿乃至千亿美元的市值俱乐部。胡伟表示，预计在不久的将来，每个人都将拥有至少一个数智员工助理。数智员工的发展和应用将持续推动社会和经济的变革，当下数智员工行业商业化的成功难题在于对用户需求的精确把握和价值创造。至于大众普遍关心的“数智员工是否会替代人类”的问题，颜艳春和胡伟都给出了否定回答，他们认为，数智员工非但不会替代人类，反而会创造更多的岗位，开创新的工作机会。以下为分享全文，enjoy~今天分享的这篇文章，希望对你有所启发，enjoy~▼主持人： a16Z（安德森·霍洛维茨）基金是全球顶尖的投资机构之一。a16z 合伙人 Martin Casado提出了一个观点，即人类已进入了第三个计算时代。过去微芯片将计算的边际成本降到零，互联网将分发的边际成本降到了零，现在大模型将创作成本亦将降到为零；我对此很感兴趣。您曾经把人工智能大模型比喻成100多年前电力发明一样，将渗透到人类生活的每一个角落和场景，将极大地改变世界。您怎么看待这个问题？颜艳春：我十分同意Martin先生的观点。我认为人工智能之所以将来能超越互联网，因为它是供给端的革命，我们的创作和生产将进入边际成本为0的时代。随着人类不断逼近AGI通用大模型时代，我们将见证一场巨大的生产力革命，带来十倍、百倍乃至万倍的价值创造。未来100年人类创造的新GDP的总和可能超过过去人类1万年的总和，人均GDP将超过人类工业文明时期的10倍，农业文明时期的100倍。智力和价值将成为我们观察人工智能项目颠覆人类生活、文化、经济甚至军事场景的两个重大变量。人工智能创业将遵守三大新定律：Scaling Law（尺度定律）、Huang’s Law（黄式定律），以及DarkLaw（黑暗森林法则）。大力出奇迹，从chatGPT到Sora，Open AI的巨大成功很大程度源于Scaling Law（尺度定律），尺度定律在通用人工智能的重要程度将不亚于摩尔定律。 Open AI的成功验证了尺度定律，即大力出奇迹，产生了巨大的规模效应。我们预测Open AI的chatGPT用户数可能超过100亿，公司价值超过10万亿美金。未来一定将涌现出一大批AI原生、比互联网时代更伟大、像Open AI一样的标志性公司。主持人：这确实很诱人，去年年底您提出了十个大胆的AI革命的十大猜想，可否给我们分享一下？颜艳春：去年，我提出了关于人工智能革命的十个猜想，涵盖三个宏观猜想、三个中观猜想以及四个微观猜想。贫穷限制了我们的想象力，守旧限制了我们的行动力；这些猜想不是想象，只是我们投资的假定和对未来的洞察，需要时间去验证和试错，仅供大家参考。 1.在宏观层面，以未来30-50年的时间尺度，我有三个大胆的猜想：第一个宏观猜想，新文明，人类将进入智业文明时代。这是继农业文明和工业文明之后，人类将开启第三次伟大的新文明。从chatGPT的iPhone时刻到Sora的重磅发布，生成式人工智能（Gen AI）的颠覆者，硅谷初创公司Open AI可谓开天辟地，它不亚于铁器和蒸汽机的发明，结束的不是一个时代，而是一个旧的文明，它必将超越互联网，开启自人类农业文明、工业文明之后的智业文明时代，加速人类的第三次解放。 ChatGPT背后的超级智力爆发后，就像100多年前的电力一样，陆陆续续接入并赋能每一个人，每一台机器，每一个物品，每一个企业，每一个产业，每一个军队，每一个国家。 Gen AI将加速重塑各行各业，加速AI的智力平权，普惠全人类，工业文明的火炬将传递给智业文明。在人类时光的未来长河中，智业文明将如同一颗璀璨的明珠，闪耀着人类智慧的光芒。下一个 100年里，它将给我们带来了巨大的财富和深远的影响，改变了我们的生活方式，推动了人类社会的共同进步和共同富裕。智业文明不仅将给我们人类带来了更大的物质繁荣，还将深刻地改变了人类社会的结构和人们的生活方式。第二个宏观猜想是新上帝，上帝2.0诞生。圣经记载上帝7天造齐了天地万物。生成式人工智能（Gen AI）就是新上帝。生成式人工智能的第一性就是能够准确预测下一个什么东西，从下一个token、下一个时空patch到下一个分子结构、下一个驾驶动作、下一个流行元素。从技术角度来看，基于自注意力机制（self-attentionMechanism）的深度学习模型--transformer架构的各种大模型和agent智能体开发，都有可能在未来获得新的突破，实现对未来趋势的精准预测。这种能力将极大地影响我们对流行趋势、技术发展乃至时空演变的理解。例如，像Sora这样的大模型能够预测下一个流行趋势，仿佛拥有预见未来的能力。所有行业、所有产品和所有app都可能会重新发明一遍，生成式人工智能就像一个新造物主、新上帝，人货场将全部再造，造新人、造新物、造新景，开启一个100万亿美元的超级赛道，特别是零售业将迎来第四次零售革命。第三个宏观猜想，新人类，上千亿机器人军团崛起。上千亿的数字人类和人形机器人等“新人类”可能会大规模诞生，他们将渗透至人类的各个生活、消费、工作以及军事场景中，为人类提供完美的服务。下一个50年，80亿人类的碳基生命、数基生命和硅基生命等三种生命的新化身，将进化为近百亿的碳基人类和上千亿的机器人类，将组成浩浩荡荡的智业文明军团，共同服务于人类征服世界和宇宙的每一个场景。这些新人类，他们和我们人类一道将使人类的整体知识水平得到极大的提升，孕育出更加丰富多彩的文化和艺术，加速涌现新的科技、新材料和太空探索，加速人工智能的平权，普惠给每一个人，每一个，同时智业文明将开启全球化2.0时代，迎来一个更加繁荣共生的全球大航海时代。 2.在中观层面，以未来5-10年的时间尺度，我也有三个大胆的猜想：第一个中观猜想，新模型，万物皆可GPT。今天，全球和中国的头部大模型公司正在加速从单模态向多模态大模型进化的进程。一旦某一天GPT进化为最底层的AIOS人工智能操作系统，它将超越移动互联网时代的操作系统iOS或Android，无限逼近AGI通用人工智能。大模型发展的生态将出现幂次分布：一方面，AGI通用大模型将从百模大战进入春秋战国时代，必将逐渐演进为AIOS操作系统，这将加速物理世界和数字孪生世界的打通，突然涌现奥本海默时刻。另一方面，小模型时代，未来每个行业、每个领域、每个产品、每个企业以及每个个体的人类和机器人类都将拥有自己的大模型。理论上，未来5-5年的长河里，将涌现数万个垂直的行业大模型、数10万个领域大模型，数百万个产品大模型、数亿家企业大模型和上百亿拥有独特人设的个人大模型，这些大模型，都是小规模大模型，我称之为小模型时代。第二个中观猜想，新劳动力， AI人力资源公司崛起。我们期待下一波超越互联网的杀手级AI原生应用甚至超级应用将如雨后春笋般涌现，他们可能不是app，而是被大模型背后的超级智力武装起来的数10亿的数智员工和硅基机器人军团，渗透到各行各业，新的AI劳动力生态和AI人力资源产业集群将加速形成。数百亿拥有数基肉身的数智机器人（数智战士、数智员工）和拥有硅基肉身的人形机器人，将涌入人类大量的军事场景、工业场景、生活场景和消费场景甚至宇宙太空探索的新场景。拥有数基肉身的数智员工（数基机器人）和硅基肉身的硅基机器人，将构成庞大的AI劳动力大军。这预示着能够提供AI劳动力的公司将成为市值达到千亿乃至万亿美元的领头羊，机器人军团的兴起，将为人类提供庞大的高性价比的劳动力人口。这个新时代会带来人类的第三次伟大解放，我们会将机器变得更加类似人类，反过来解放真正的人类。第三个中观猜想，新超级物种，端到端AI原生超级应用涌现。随着通用人工智能（AGI）基础大模型陆续问世、免费开源和全面开放，AI算力基础设施和AGI大模型将变得更好、更快，算力、智力边际成本更低甚至接近零，上万个产业垂直大模型、10万个领域垂直中小模型和杀手级的AI应用将如雨后春笋般涌现，新的AI生态和AIGC产业集群正在形成，拥有十亿乃至百亿级用户的超级应用将诞生。 3.在微观层面，以未来3-5年的时间尺度，我也有四个新的猜想：以上是宏观、中观层面的趋势猜想，微观层面，人们将更关注能看到近期AI给我们能带来哪些实质性收益的趋势。第一个微观猜想，新研发革命，从数据飞轮到PMF飞轮到爆款飞轮。我相信AI将彻底改变研发过程，通过建立AIGC-UGC-PGC的数据飞轮，逐步找到PMF，甚至形成爆款。例如，我们盛景投资的深势科技用自己的大模型帮助宁德时代开发新材料，帮助恒瑞医药开发新药，SheIn的大模型就是一个fashionGPT，能精准预测明天的下一个流行趋势，每天推出7000多个新款，5年将产品爆款率从10%到接近50%。第二个微观猜想，新流量入口，智器时代。手机开创的移动互联网时代将逐步没落。基于手机的app和小程序将不是唯一的流量入口。将大模型的超级智力接入每一个物品后，他们将不再仅仅是一个AI硬件或AI终端，我把他们成为智器，如XR眼镜、AI手表、AI音响、AI玩具、AI冰箱、AI别针，硅基机器人。我们不再需要打开手机中的app，它们将创造出一种新型的对话式的交互革命，甚至带来沉浸式的基于3D空间计算的元宇宙体验，从而成为新的流量入口，这标志着我们将从电器时代进入到一个新的智器时代。第三个微观猜想，新商业模式，从传统的一垂直买卖转向订阅经济模式。这种模式下，企业不仅仅是一次性交易，而是通过提供持续服务来与客户建立长期关系。例如，通过订阅服务，AI技术可以创建个性化体验。比如，过去一垂直卖跑步机或跑鞋的老板，可以签约各种明星，每一用户都可以订阅AI跑友服务，每天一起跑步，只需收取每天1-3元的订阅费。最后，第四个微观猜想，新全球化，产业大航海时代来临。中国、东南亚、巴西等地区产业集群带6000多家工厂，大量的过剩产能输出到全球市场，从单打独斗发展成为全球最大的快时尚产业共同体，去年GMV突破400亿美金。这是中国企业家创造新的世界品牌的摇篮，也是升级为世界级企业家的新机遇。主持人：大模型时代，投资人看什么领域的都有，为什么您很关注数智员工这个赛道呢？颜艳春：在宏观猜想中，我认为下一个30-50年的时间长河中，在人类的大量场景中，将会涌现上千亿的数基或硅基的人形机器人，为我们工作，我认为这是一个巨大的人口爆炸。未来会出现大量的提供AI人力资源的公司，数百亿的数智员工和机器人将会陆陆续续上岗，比如AI销售、AI客服、AI招聘、AI司机、AI模特、AI主播、AI医生、AI营养师、AI孙子、AI爷爷、AI跑友、AI老师、AI伴侣、AI创业导师、AI董事等，这是一个万亿美金的AI劳动力市场。 RaaS，Robotas a Service，机器人即服务。未来很多公司的本质是人力公司，它们卖的是工作，而不是软件和硬件。例如，今日人才创始人去年开发AI劳动力公司夸夸菁领，开发的AI数智员工一开始也很笨，也需要接受入职培训，但自主学习能力很强，现在效能相当于5-10名HR部门的人力资源专员，展示了生产力的巨大提升。今日人才现在已经开始向B站、比亚迪等多家企业供应第一批AI数智员工，月薪不菲。 OpenAI的GPT store，现在应用超过300万，不要看成是Apple的app store应用市场，而应该看成一个全新的AI劳动力市场。在这个市场中，每个AI应用背后代表着一种特定能力的机器人或数字实体，它们可以执行创造性工作，减少人类的重复性劳动。盛景母基金投资的UiPath，原来只是一个RPA软件公司，通过AI赋能，不仅市值飙升，现在市值接近130亿，也开始在财务、人力资源、供应链、IT等多个后台、中台部门替代传统白领工作。亚马逊在物流部门大规模部署了75万台机器人，每个月还在增加1000台机器人，展示了AI劳动力接管蓝领工作的巨大潜力。同时，预计将有更多四足或双足机器人被部署于工业、商业以及家庭场景，进一步拓展AI的应用领域。我们认为对于每一个企业，每一个产业平台，数字员工可以给每个公司节约人力，哪怕100人的工厂节约50人，这就是一个非常大的价值创造。我们的财务、人力资源、供应链、IT部门，会有大量的工种被接管，而这种接管也不是刚刚开始，而是在加速。数智员工的本质是机器人，这将为人类社会带来前所未有的第三次解放，使人们从繁琐重复的工作中解脱出来。 2B市场需要更多“效率型”的机器人，帮助提高企业的运营效率和生产力；2C市场则需要更多“杀时间型”的机器人，主要提供陪伴、聊天、康养等服务，满足人们的情绪价值和精神陪伴。 IDC报告指出，2024年，45%的重复工作任务将通过使用由AI、机器人流程自动化（RPA）提供支持的“数智员工”实现自动化。数智员工将接管90%的人类工作，财务、人力资源、供应链、IT部门的大量员工会因为AI的加入而加速解放。主持人：现在很多人认为，数智员工和机器人将导致大面积的人类失业，您如何思考这个问题？颜艳春：这是一个新文明的结构性变迁。工业文明把人变成机器，智业文明把机器变成人。表面看起来，工业文明让99%靠农村土地吃饭的农民失业了，但他们快速地涌入到城市，在轰鸣的工业流水线上和繁忙的写字楼里，找到了更好的工作，收入是原来的10倍。这一次，智业文明也可能让99%靠工厂和办公室吃饭的工人、白领失业了，但他们每个人也将在智业文明的新流水线上重新找到自己的工作或生命的意义。虽然AI劳动力的发展可能会夺取了人类的很多工作，但它们的主要目的是提高生产力。未来，人类可以将更多的精力投入到创造性、创新性的工作中，实现更大的价值。这一切预示着，未来人类、数字人类以及更高级的人工智能将共同组成一个巨大的劳动力军团，不仅改变物质文明，也将极大丰富人类的精神文明。随着AI技术的发展和普及，未来的经济形态将是基于AI劳动力的服务和创造力，从而引领人类社会进入一个新的文明时代。数智人类和硅基人类将带来劳动力的根本性变革，人们对于未来工作的担忧，与农业文明向工业文明过渡时期农民的担忧相似。当时，许多农民转向城市工作，找到了收入远超过农业劳动的职业。这一历史转变给我们的启示是，尽管技术进步会导致某些职业的消失，但它也会创造出新的就业机会和提升生活质量。在未来，每个人可能都能通过AI创建出数十甚至数百个数字分身，这些分身可以承担各种工作，从而极大地提高个人的生产力和创造力。例如，未来明星可以训练自己的AI分身成为运动教练，陪伴粉丝跑步、聊天和唱歌，从而为粉丝提供更加个性化和丰富的体验。这种方式，个人的经济收入可能因为AI的劳动力而显著增加，使得人们只需少量工作便可获得以往难以想象的收益。比如肖战可以武装100万个AI肖战，每一个他的粉丝都可以订阅AI肖战每天一起跑步，只需收取每天1元的订阅费。随着AI技术的发展，我们将迎来智业文明时代——AI和机器人不仅将在物质生产中发挥作用，还将在精神文化领域中提供服务，从而为人类社会带来全方位的劳动力支持。可以预见，将有越来越多的公司将自身定位为“劳动力公司”，专注于提供各种形式的AI劳动力服务。未来，每个人、每个企业、每个国家、每个军队都可以低成本训练并武装一个高智商或高情商的机器人或AI劳动力团队，收获这个万亿美金的AI劳动力市场的巨大红利。主持人：我很好奇，您为什么选择了数智员工这个赛道？您在这个领域有什么隐形资产（指资源、积累等）吗？胡伟：创业初期，我主要从事人才业务，这一选择受到在华为15年工作经验的影响。华为在这15年内从一万多人发展到18万人，我深刻认识到，人才是企业发展的核心。无论是腾讯、百度、阿里，还是国有企业和顶尖民企，成功的企业都非常重视人才招聘。因此，创业前几年我致力于建立人才平台，服务不同公司的招聘需求，深入理解人才市场。随着美国GPT大模型的发布，计算机获得了类似人脑的思维能力，这标志着AI技术的一个重大突破。突然之间，AI拥有了以往不具备的能力，这让我意识到，我们应该尝试利用这一技术，创建“数智员工”。过去的AI技术水平相当于5到6岁儿童的智商，不足以完成工作任务；但如今，AI的能力已经大大提高。我认为，作为一家创业公司，我们应该迅速行动，抓住这一新兴市场的机会。幸运的是，我们遇到了愿意与我们进行协同创新的客户，他们提供了场景、时间、数据和业务支持。一年的努力让我们更加确信，投身数智员工领域是正确的选择，是进入一个全新时代的大门。我们坚信，数智员工将像智能手机一样普及，成为人人必备的数字助理，每家公司都会拥有在不同岗位工作的数智员工。通过半年到一年的不懈努力，我们已经取得了一些市场进展，坚定不移地选择了数智员工作为我们的战略方向。主持人：我看到您的客户都是很知名的，比如新能源巨头比亚迪，您是如何发现比亚迪的需求、如何满足这些需求的呢？胡伟：在过去几年的创业过程中，比亚迪成为了我们的一个重要战略客户，特别是在人才招聘方面。比亚迪对基层人员的需求量巨大，这意味着有大量的、重复性的招聘工作需要完成。了解到这一点后，我们开始与比亚迪进行合作，定制和开发‘’数智招聘助理”，以提高招聘效率。我们对比亚迪招聘人员的工作习惯和行为进行了深入研究，并将这些拆解成可操作的SOP流程，让数智员工来辅助人类员工，使他们能够更高效地工作。早期的试点成功后，我们收到了积极的用户反馈，并根据用户的具体需求和特征进行了持续的优化和迭代。数智员工的特点包括能够长时间在线、具有学习和记忆能力，以及得益于背后的大模型，具备更高的智能。这些特点使得数智员工在质量和效率上能够超越传统的人类员工，为客户提供更优的解决方案，实现降本增效。此外，随着数字化招聘的发展，我们能够在校招领域通过AI技术，识别并挖掘那些可能被忽略的优秀学生，无论他们来自何种背景或学校。这不仅扩大了企业的人才筛选范围，也为那些来自非顶尖学校的优秀学生提供了机会，体现了数智员工在招聘过程中的独特价值和重要性。主持人：在这个接触和实施过程中，有没有什么是和您想象的不一样的？胡伟：在华为多年的经验教会我们，以客户为中心，深入了解客户的具体诉求是公司的核心特征。我们会在项目的早期阶段就派遣需求分析师和解决方案经理入驻企业，与客户共享我们的认知，并深度参与到他们的业务流程中去，以确保我们充分理解他们的需求。比如，在与比亚迪的合作中，我们最初认为找简历可能是他们的痛点。然而，实际情况是，比亚迪每天收到成千上万份简历，他们的真正挑战在于无法有效处理这些海量的简历信息。我们的数智员工不仅能够帮助他们审查当前投递的简历，还能激活和利用之前积累的、未得到充分利用的简历资源。这种深入客户业务流程的做法，让我们能够定制出真正符合客户期待的解决方案，在大模型时代，甚至多次超出客户的预期。我们坚信，通过深入理解并解决客户的实际需求，我们能够提供更加高效和精准的服务，实现客户价值的最大化。主持人：在比亚迪，您的服务有什么可量化的成果可以和大家分享？胡伟：数智员工作为招聘专员的效率显著高于自然人，平均产出是自然人的三到五倍。这种高效的产出主要体现在处理简历和与候选人沟通的数量上。例如，一个自然人每天最多可能只能查看100份简历和联系30个人，而数智员工则可以达到这个数字的三到五倍，能够发起更多的沟通交流，并约请候选人参加面试。在阅读简历方面，数智员工的效率更是远超人类，能够在一分钟内阅读上千份简历，并且生成匹配度报告，这是人类所无法比拟的。这种从端到端的流程优化，大大提高了招聘的效能和效率。最终衡量的不仅仅是这些过程指标，而是为客户创造的实际价值。以招聘成功的人数计算，数智员工至少能为客户带来三到五倍的结果，这在最终的招聘成果上体现了其显著的价值和效率。主持人：我看到您的客户中还有95后、00后们最爱的Bilibili，我很好奇，B站和比亚迪在数智员工方面有什么需求差异么？胡伟： B站，作为一个深受年轻人喜爱的平台，以其开放创新的态度，成为我们合作讨论数智员工事宜的首选。 B站作为视频内容的领头羊，面临大量视频审核需求，迫切需要机器与人的协同审核。因此，我们联合开发了一些能够代替真人进行视频审核的数智员工。与比亚迪相比，B站的需求非常明确和精准，主要集中在视频审核岗位，这让我们能够快速针对性地开发和优化。与B站的顺利合作得益于其对创新的开放态度和提供的合作场景，使我们的团队能够深入了解并迅速适应B站的具体需求。这种合作不仅加速了迭代过程，也让我们的数智员工能够有效地融入B站的运营，特别是在视频审核这一关键领域。主持人：那么，在B站，有什么可以分享的、可量化的成果吗？胡伟：视频审核工作由于其辛苦性质，要求审核员长时间盯着屏幕，不仅工作强度大，而且对视力影响巨大，导致工作流动性高。因此，B站内部会定期调岗，让员工转做客服或其他工种以减轻眼睛疲劳。由于这个岗位的特殊性，招聘需求量大。我们的数智员工一上线，就以传统人工效能的三倍开始，这已经超出了B站初期的预期。而且，由于这些岗位的需求非常明确，数智员工的效率最终可以达到五到八倍，大幅提高了审核效率。在今天大模型的时代，传统人工的方式相比之下，转速有限。一个大模型的计算能力和速度，可以远超一百个人的工作产出，主要是计算机后台的算力能力所决定的。这种能力的提升，真正意义上提高了工作的效能。我常开玩笑说，我们的数智员工都具有顶尖院校的研究生水平。但是，这样高水平的员工在企业中必须有明确的岗位指派，否则即便是拥有清华、北大背景的人才，若岗位不明确，也不知道应该做什么。在企业中，那些可量化、可规范、可流程化的工作，尤其适合让数智员工来承担，这无疑会大幅提升企业的效率和效能。在当前的经济环境下，所有公司都面临降本问题，提高效率实际上等同于降低成本。另一个重要的方面是，数智员工在工作时不会偷懒，总是一丝不苟。比如在阅读简历、与人交流的任务中，如果要求与1000人打招呼，它们就会毫不遗漏地完成这1000次的交流，不会像人类可能出现的看了800份就声称看完了1000份的情况。从本质上讲，数智员工在效能和效率上具有天然的优势。主持人：数智员工行业，您觉得从技术上主要难度是什么？（比如大模型选择、模型微调、数据收集/训练等等）胡伟：大模型时代的真正挑战在于业务场景的深入洞察和应用侧的有效发力。尽管大模型拥有强大的能力，但如果无法精准应用，其潜力便难以充分发挥。核心问题在于对业务场景的深入理解和对应用层面分析的精确把握。例如，基于对人才招聘深度了解，我们开发出第一个招聘专员数智员工，以及针对企业知识传递和流通不畅的问题，创建数智博士来优化知识管理和分享流程，实现了对业务场景的精准把握和应用的有效实施。其次，技术层面如何使大模型与客户应用场景紧密衔接，是另一个关键点。这涉及到技术细节的梳理、书写约束等，是数智员工在企业中顺利运行的重要技术基础。大模型的选择和定制化调整也非常关键，合作与微调基于其持续训练至关重要，决定了数智员工的智能水平和实用价值。大模型战的背景下，选择合作的大模型和对其进行长期训练成为确保数智员工高效运作的必要条件。总之，大模型时代对业务场景的深刻理解和技术的精准应用是实现其潜力的关键，而在技术选择和调整上的精细操作则是确保实用性和效率的基础。主持人：从您服务比亚迪、B站等诸多客户的经验看，您认为商业化角度面临的难点是什么呢？胡伟：面对新事物的认知和客户付费习惯需要时间去培养，尤其是在大多数客户的预算中未曾设立购买数智员工的一项。这一认知转变需时，同时，商业的本质在于为用户创造价值，能够解决用户的实际问题和痛点。例如，数智员工近期学会编写PPT，满足了广泛的企业和个人需求，这就是直击用户痛点的服务。商业化的成功依赖于对用户需求的精确把握和价值创造。数智员工作为一种新兴服务，其商业化过程中的定价可以与传统员工的产出和成本进行比较，以此作为定价基准。数智员工的优势在于效率高且无需额外的福利成本，从而为企业提供高性价比的服务。商业化新生事物需企业、用户和同行的共同努力推动，正如知识付费和视频订阅服务逐渐被市场接受一样。只要服务能创造价值，就能找到其商业化的道路。对于数智员工而言，它们通过提高工作效率、节省成本等方式为企业创造价值，自然会有其商业化的可能性和空间。整个行业和市场的共同参与和推进，将有助于新业态的定义和商业化过程。主持人：对于一个企业来讲，人工快速的离职调整，是非常可怕的一件事，不仅是招聘成本，招聘时间的问题。更在于好不容易他把一个东西给掌握了，又得换一个人，再来一个新人又好几个月去熟悉，成本巨大。我觉得数智员工在方面可能也是非常重要的，他不会离职，永远跟你在一起。您怎么看？胡伟：我觉得这才是企业最大的浪费。面对人才流失所导致的“隐形浪费”，数智员工的稳定性和忠诚度提供了一种创新解决方案。与传统员工相比，数智员工作为具有突破性的创新劳动力，不仅能快速适应工作需求，还能长期为企业服务，避免了人才培养后流失所造成的资源浪费。正如华为在2010年预见到智能手机将成为未来趋势一样，当前大模型技术的发展正推动着数智员工概念的普及。如同智能手机重塑了人们的生活方式，数智员工有望在工作和日常生活中发挥重要作用，成为个人和企业不可或缺的助手。预计在不久的将来，每个人都将拥有至少一个数智员工助理，这些助理将在多个方面提供帮助，包括但不限于行程安排、营销策划、甚至家庭教育等。这些数智员工将能够适应用户的个性化需求，提供定制化服务。这种趋势的到来将极大地提高工作效率和生活质量，同时，也意味着对于企业和个人来说，理解并运用这项技术将成为必备的能力。未来，数智员工将成为人类生活中不可或缺的一部分，它们的发展和应用将持续推动社会和经济的变革。主持人：您觉得数智员工在哪些方面可以替代于员工？在哪些方面可能还是需要跟人进行一个紧密的合作的？胡伟：首先，我想强调一个概念：数智员工与人类员工之间不是替代关系。我们公司近期总结了一句话，我认为非常精辟：“每上线一个数智员工，就会创造一个新的工作岗位。”这句话可能会让人觉得抽象，有人可能会问：数智员工不是用来替代人类的吗？实际上，数智员工并不会替代人类。回想2000年，我第一次接触电脑时，那时候对电脑的敬畏如同对待一种神秘的存在。那时有声音称，电脑的强大存储和计算能力会替代许多人的工作。然而，随着时间的推移，我们看到电脑并没有替代人类，反而每多一台电脑，就多了一个工作岗位。我们团队认为，每上线一个数智员工，实际上是为人类工作者提升效能和效率，把人类从标准和重复的工作中解放出来，继而专注于更重要的思考和创造性、创意性和情感性的工作。因为人类是需求的创造者，我们需要通过科技的进步提高效率。例如，以前老师用笔写字，一天能写的字数有限，但现在使用计算机打字，一天能打出的字数远超以往。这并不意味着技术的进步会替代人类的工作，而是提高了我们的沟通效率，使我们能够探讨更多的事情，推动更多的创新。此外，我想强调，“被AI替代的不是人类工作，而是那些不愿意学习和使用AI的人。”人类是需求的创造者，我们应当拥抱技术进步，让它帮助我们工作得更高效。就像过去电脑和手机的普及一样，数智员工的广泛应用也不会替代人类，而是开创新的工作机会，提升工作效率。主持人：数智员工部署起来麻烦吗？胡伟：部署数智员工非常简便，只需开通一个账号，你便可以开始与其交流和工作。明确你的需求和要求，数智员工能够与你进行多轮交流，并在每轮交流后反问三个问题以确保更准确地理解和补充你的需求。对于大多数企业和场景而言，数智员工旨在替代简单重复的工作，因此部署过程并不复杂。对于有特别数据保密和安全要求的巨型企业和政府机构，则需要考虑私有化部署。但总体来说，数智员工的价值在于简化和高效化工作流程，而非处理极端复杂的任务。简而言之，数智员工的部署和使用过程旨在为用户提供便捷性，使他们能够快速投入使用，提升工作效率。主持人：如果让您专门给致力于做数智员工的创业者一些分享，您会给他们怎么样的建议呢？胡伟：第一，抓住数智员工浪潮，成为创业领域的先锋，是一次千载难逢的机会。在过去的移动互联网和互联网时代，许多人可能错过了把握机遇的时刻。但现在，面对数智员工这一新兴领域，每个创业者都应当珍惜这一波浪潮。第二，选择一个具有广阔前景的赛道并专注于一个小切口深耕，做到足够扎实，而非贪多嚼不烂，是建立伟大公司的关键。 (本文来源盛景新经济，如有侵权请联系删除)

2024-04-08 10:02:39 42

揭秘吴恩达的4种 AI Agent 设计模式

上周，吴恩达教授在美国红杉 AI 活动上关于 Agent 的最新趋势与洞察，提出了目前有 4 种主要的 Agent 设计模式，分别是：Reflection：让 Agent 审视和修正自己生成的输出；Tool Use：LLM 生成代码、调用 API 等进行实际操作；Planning：让 Agent 分解复杂任务并按计划执行；Multiagent Collaboration：多个 Agent 扮演不同角色合作完成任务；在扣子（coze.cn）/Coze （coze.com）上，可以将上述四种模式快捷落地，本文将以汽车行业调研助手、高质量旅行规划助手等实际案例来为大家分享落地思路。1 Reflection模式含义：让 Agent 审视和修正自己生成的输出。背景：大模型的生成有时候会犯懒，可能只会部分执行Prompt导致效果有限。Reflection模式适用于让LLM自行审视和修正自己生成的输出，对生成内容进行多次自我调优，进而生成更加优质的内容。场景：让 AI 或 LLM 说，写一个行业短评。开始写第一稿，自己阅读生成第一稿，思考哪些部分需要修改，然后，LLM进一步优化生成，可以一遍又一遍地进行。因此，这个工作流程是可迭代的，你可能让模型进行一些思考，然后修改文章，再思考，并通过多次迭代来完成这个过程。流程图： Workflow实现简单“行业短评”效果工作流拆解：第一步：Start节点，用于接收用户的输入。第二步：大模型节点，行业短评Prompt：使用真实数据、案例、SWOT模型，并言简意赅表达。第三步：基于其生成结果第二步中的大模型的生成结果，复制其Prompt，并进一步提示生成短评，达到审视和修正自己生成输出的效果，提高短评生成质量。第四步：输出结果。示意图参考：效果：汽车行业调研短评第一次：大模型对于提示，仅生成比较概括性的短评，使用了真实数据。第二次：大模型对生成结果进行迭代，生成了详细短评，不仅优化了表达内容，还增加了SWOT分析和案例分析。2 Tool Use 模式扣子/ Coze 本身就支持非常丰富的工具调用，欢迎使用！3 Planning 模式含义：Planning：让 Agent 分解复杂任务并按计划执行；背景：大模型的生成依赖于训练数据的实效性，并且有时候会产生幻觉，导致生成的内容效果质量有限。Planning模式适用于让LLM基于计划好的任务步骤，对生成内容进行多次自我调优和加工处理，进而生成更加优质的内容。场景：我们期望Agent具备类似人的行为的智能体，比如在调研报告场景，他会先使用搜索工具进行检索，筛选质量较高的内容，再进行一些思考，再进行重要信息的总结和整理，最后输出一个质量比较高的报告。流程图： Workflow实现Plannning模式的“行业短评”效果工作流拆解：第一步：Start节点，用于接收用户的输入。第二步：通过“浏览器插件”，把用户的输入作为关键字进行搜索，返回相关的10个网站链接。第三步：通过“头条搜索”访问这10个网站的详情内容，并返回。第四步：使用大模型对这10个网站的内容进行打分，3分以上推荐引用。第五步：通知用户：目前Agent已经完成阅读，正在整理并总结报告。第六步：大模型对高分内容进行理解，使用真实数据、案例、SWOT模型等，并言简意赅表达。第七步：输出报告。示意图参考：效果：奶茶行业调研短评第一步： Agent完成网站访问和内容抽取后，告知了完成阅读。第二步：参考了他访问的一些网站内容，整理并总结了报告，最后打印报告输出。4 Multiagent Collaboration 模式使用coze的Multi-agent功能实现高质量旅行规划第一步：定义3个用于旅行规划场景的专家Agents目的地推荐专家：调用搜索等能力，基于用户的需求推荐目的地。机票酒店专家：调用机票、酒店的查询工具，根据用户的背景信息和诉求，推荐合适的机票酒店。行程规划专家：根据用户的信息和其他专家产出的结果，帮助用户制定完整的行程规划，并将内容输出到PDF中。第二步：将3个专家Agents排列到画布中，并为他们设置任务交接的条件。第三步：开始对话三种模式的对比： (本文来源字节跳动技术团队，如有侵权请联系删除)

2024-04-08 09:59:12 41

AI 面试的“酷刑”，只有中高级管理层和 CEO 能幸免

作者 | 褚杏娟、赵钰莹  知乎上有人详细分享了自己参与 AI 面试的经历：“点开链接，在手机上是用小程序，电脑是浏览器。一开始有个预录，检查手机摄像头、麦克风以及自己的语音声音大小。开始做答之后有 5 个题目。每个题目 6 分钟，包括构思和录制视频。点击录制视频有 5s 的准备时间，5s 之后手机自动录像，你开始答题，视频录制不超过 5 分钟。录制完之后，返回答题页面，可以回放。5 分钟答题时间到，它会提醒提交，然后点击提交。就进入下一题。”“我觉得 AI 面的公司压根就没打算招人”，这是 AI 面试刚出来时人们通常会给的评价。但现在，大家对 AI 面试的接受度已经很高，AI 面试的争议更多是出现在一两年前，现在网上几乎都是 AI 面试的建议、题库等。“和传统面试比起来，我更倾向于用 AI。AI 对于你的输入、表情、动作都会关注，更加全面考核，至少是对所有候选人是公平的，不会出现面试官主观的偏见偏差、个人因素等问题，当然也得要求 AI 面试要足够智能。”广州大学嵌入式应用专业的一名本科学生说道。根据《2024 牛客智能制造业校园招聘白皮书》，53.5% 的对智能制造感兴趣的学生有参与过 AI 面试，而参与过 AI 面试的学生中高达 77.7% 的人表示满意。这次，传统行业走在了前头面试可以用 AI 进行，也说明了面试本身在一定程度上是可规则化的。有做人力资源管理的网友分析称，抛掉“人间冷暖”不谈，面试的本质是按图索骥，一场高效的面试依赖以下几个方面：人才画像 ——AI 可以结构化提问 ——AI 可以关键词评估 ——AI 可以情绪稳定度 ——AI 应该可以（可能不精确）与公司文化 / 直接上级的默契度 ——AI 也许可以（双向测试后可以提升匹配度）如果一家公司坚持不懈地做 AI 面试，积累匹配组织发展的人才大数据，那么招聘的人才至少 80% 左右是完全靠谱的，再加上终面 BOSS 感受一下，精准度应该可以达到 90% 以上，这比有 3-5 年工作经验的 HR 靠谱多了。当然，AI 面试最终会让类似的人都聚集在一起，很有可能导致组织僵化。在组织需要变革、寻找一些鲶鱼进入组织时，人才画像将完全不一样，AI 的底层面试逻辑就要随之重构。“我曾经只是作为辅助面试人员参与了公司里的终面过程，一整个上午也就搞了六七个人的面试，到中午吃饭的时候，主面试官基本上就快累趴下了。但是在我看来，很多面试官工作内容并不复杂，甚至到后面有一些机械。不管面试者说啥，面试官都是在固定重复问几个问题。”弗兰克扬在知乎上分享称，“我也不觉得这会有什么大问题，因为最关键的信息其实就那么一两个，剩下的就是看你还想从聊天中聊点什么了，不管你聊什么，大部分都不会影响最终的决定。”“弗兰克扬”表示，十多年前，一些大企业会把前几轮的招聘流程给外包公司，这些外包公司先筛选简历、再进行电话面试，问的问题都是雇主公司规定好的，全程录音，然后再根据面试情况做筛选，最终把报告发给雇主做最终决定。“现在 AI 的水平，我感觉跟当年外包干的工作都差不多。”牛客联创兼技术负责人杨之贤介绍称，AI 面试特别适合招聘规模较大、考核能力相对标准的岗位，如校招管培生、普通蓝领、销售岗位、客服群体、小语种岗位等。以互联网为例，IT 基础岗位初筛、产品运营岗位、销售岗位、客服岗招聘人数超 10 人以上均有可能使用 AI 面试。消费行业是最早尝试使用 AI 面试的行业之一，而且外企的接受度更高，比如雅诗兰黛、宝洁等。今年，随着大模型的兴起，越来越多的行业对 AI 面试表现出了兴趣，互联网、国企央企、银行、教育、电信、汽车、快消、制造业等行业都引入了 AI 面试。比如 2023 年，光储行业里的龙头企业阳光电源决定将所有管培生岗位的英语面试全部使用牛客 AI 面试代替以往的英语外包面试。当年，阳光电源 AI 面试的管培生超 500 人次。杨之贤表示，目前国内大约有万级别的企业在面试流程中加入了 AI 面试，而且这一数字还在不断增长。据《牛客 2023 秋季校园招聘白皮书》的调研数据指出，已有 23.2% 的先锋企业应用 AI 助力校招，其中使用 AI 助力笔面试环节的企业占比达 97.9%。被放大的细节AI 面试的优势是不会受到情绪、偏见或其他主观因素的影响，它会根据事先设定的评分标准进行客观评价。AI 面试会重点会考察面试者以下三个能力：胜任力测评，包括学习能力和抗压能力，这些通常是衡量一个人是否适合工作的重要指标。专业能力，即面试者在特定领域的知识和技能。这是根据不同岗位的要求来考察的，以确保面试者具备所需的专业素质。语言能力，比如英语、越南语等，良好的语言能力对于与外企的国际团队合作和沟通至关重要，还有的工作也需要一定外语能力。结合面试者的简历和回答，AI 面试系统会进行提问和追问，并利用大模型的自然语言理解能力和逻辑推理能力，给出面试者对应能力项的得分。“智能判分是基于岗位专业素质、通用能力素质和语言能力素质的综合科学判定。我们会综合考虑面试者回答内容的专业性、相关性和逻辑性等因素，并结合回答状态进行综合判定。”杨之贤说道。AI 面试成绩单AI 面试评判更加标准化，这就要求应试者当下就要快速反应，回答得清晰、有逻辑，覆盖题目中所有的问题。“回答得是否高大上不重要，重要的是你的回答是否具有逻辑。”网友“肉丝 er”也分享道。“肉丝 er”也还特别提到，眼神千万不要飘忽不定，有的 AI 能够根据面试者的眼神分辨其是否在读稿，一旦被判定为读稿，那么不管面试者说得多好都会被 pass 掉。这是因为有的 AI 面试系统有眼神追踪功能，四处乱瞟会被视为作弊。“通过分析面试者的微表情，可以更准确地判断其是否在面试过程中存在作弊行为。”杨之贤表示，“这是为了保证面试的公平性和诚信性。”因此，除了专业能力，面试中的语速、情绪、肢体语言等都可能影响 AI 系统对面试者的评分。要知道，虽然 HR 可以查看面试视频，但大多数时候是根据 AI 的评分做初步筛选的。另外，还有一些服务行业的公司会用 AI 进行性格测试。Paradox.ai 的性格测试在 Reddit 上多次疯传，联邦快递、麦当劳等公司都使用 Paradox.ai 公司的 AI 面试系统，通过“漫长而奇怪的性格测验”来招聘客户和食品服务工作人员，并附有“蓝色外星人”形象，目标是发现候选人在“亲和性”和“情绪稳定性”方面的排名。AI 选不了 CEO而对于研发这样的 AI 面试系统，最重要的数据训练。据杨之贤介绍，牛客采用了大模型和小模型的结合方式，自研了 AI-NowGPT 模型。为了保证“AI 考官”的公平和专业，牛客内部邀请了大量资深面试官对相同数据做人工标注，以确保 AI 考官在评分和评价方面与人类面试官保持一定程度的同步。有的公司也会邀请客户企业参与标注，这样 AI 考官的评分标准会更加符合客户的需求。客户的参与可以帮助企业微调模型，使其更加符合特定岗位的要求。人类考官也可以对一部分或全部的面试结果进行复核，确保 AI 考官的判分结果的准确性和公正性。像牛客这样还拥有笔面试 SaaS 产品的招聘网站，拥有专门的内容出题团队，借助海量的题库资源，还可以实时定制出题。不过，杨之贤也表示，目前的 AI 面试还只是主要用在初步的大规模快速筛选上，对于后续的面试轮次，不同面试官关注的能力和业务知识可能存在差异，这是 AI 面试目前无法帮助解决的。“AI 选不了中高级管理层，也选不了 CEO。”理想的情况是 AI 系统能够根据面试官的要求自动生成面试方案：面试官口述想要考核的能力，AI 快速提炼出相关考核点，并生成相应的面试问题和评估标准。这样，面试官就能更加专注在候选人的表现上，不需要花费过多精力在准备面试方案上。但凭现在 AI 的能力，在快速提炼考核内容方面还存在比较多困难。此外，AI 面试系统还可以在面试过程中提供一些辅助功能，比如邀约和谈薪资：AI 可以自动发送邀约邮件或短信，并根据候选人的反馈和面试结果，提供薪资谈判的建议。杨之贤表示，未来除面试外，AI-NowGPT 还将增加简历的点评、优化功能，同时提供准确的人岗匹配度评估，帮助企业找到岗位最合适的候选人。然而，人类面试官的亲和力和人际交往能力在面试过程中仍然非常重要。虽然 AI 可以提供面试方案和辅助功能，但在与候选人的互动和评估中，人类面试官的角色仍然不可或缺。他们可以通过面试过程中的非语言交流和深入提问，更好地了解候选人的能力和适应性。此外，电子前沿基金会社区组织副主任 Rory Mir 也指出，当前人工智能浪潮使用的是概率模型算法，这意味着它们只是依赖过去的数据模式做出预测。“问题是，过去数据的模式包括系统性偏见产生的模式。”用 AI 打败 AI当然，除了招人企业用 AI，面试者也会“用 AI 打败 AI”。Interview Dog 是一款专门的 AI 面试辅助软件，可以通过实时语音识别问题来帮助面试者回答考官的问题，支持科技、金融、工程、商业、法律等行业。Interview Dog 主打“按需使用”，五分钟的免费试用之外，每分钟付费 0.45 美元。为此，Interview Dog 在网上也得到了很多好评：“在我大脑短路时，Interview Dog 让我想起了一切”“有了它，谁还需要运气啊！”但直接念答案也是有风险的，遇到自己不回的问题，“假装”思考后对答如流是会被 HR 怀疑的。“我之前面了一个小女孩，答的太完美了。于是我钓鱼了几个问题，她说的和 GPT 的结果八成相似，给她上了点压力后，一个问题都答不出来了。”网友 momo 分享道。对此，有的人认为这种做法并无不妥：“工作不就是借助各种工具完成任务吗？既然面试是模拟工作场景，那用不用 GPT 取决于面试者，只要结果出来就完事了。”但国内大多数企业是不太接受这种说法的，至少像算法思路这种应该是自己能回答的，否则就变成了纯粹的“工具人”。小红书的一个博主发起了“面试应该允许使用 GPT 吗”的小调查，参与的 1207 个人里，47% 的人投给了可以，剩下的人还是认为不应该，“面试不能用 GPT 就跟考 GRE 不能查字典是一个道理。”除了这种直接用来应对面试的工具，还有之前普遍被认为“水深”的简历优化。在猎聘等招聘网站上，一对一的简历优化收费达到了 398 元，但有网友给出的评价是：花钱改简历≈抽奖，而且中奖几率极低！猎聘网简历优化收费套餐现在，有的应聘者会用 ChatGPT、文心一言等优化简历，还有人开发了基于 ChatGPT 的简历工具，用户可以直接使用 ChatGPT 自动修改。这种用法，基本不会有什么争议了。未来，面试者和招聘者手里的魔法谁会被打败，似乎也是一个有趣的问题，毕竟 AI 不会站队。(本文来源InfoQ，如有侵权请联系删除)

2024-04-08 09:52:51 48

腾讯：发布自研游戏AI引擎GiiNEX

腾讯在2024年全球游戏开发者大会（GDC）上正式揭晓了其自研的GiiNEX游戏AI引擎，这一里程碑式的创新举措，标志着游戏开发领域迈向了一个全新的智能时代。GiiNEX的发布，不仅彰显了腾讯在游戏AI技术领域的深厚积淀，更预示着游戏产业与人工智能技术的深度融合将带来前所未有的变革。GiiNEX游戏AI引擎的核心在于其强大的生成式AI和决策AI技术。通过这两项技术的结合，GiiNEX为游戏开发者提供了前所未有的AIGC（人工智能生成内容）能力。在内容生成方面，GiiNEX支持从AI NPC、场景制作到剧情、对话、关卡和音乐的全方位内容生成，极大地提升了游戏内容的丰富性和多样性。特别值得一提的是，GiiNEX在游戏3D城市生成方面的创新应用。通过其城市布局工具，开发者能够在极短的时间内构建出庞大而逼真的城市环境。相较于传统方法，GiiNEX的效率提升了百倍之多，使得游戏开发者能够更加专注于游戏设计和玩法创新，而非耗费大量时间在繁琐的场景制作上。除了内容生成，GiiNEX在决策AI技术上也取得了显著进展。通过实时对局分析、人机指令交互等功能，GiiNEX能够为玩家提供精准的操作指南和战术建议。这一技术的应用，不仅有助于提升玩家的游戏体验，更能够推动游戏玩法和策略的深化，使得游戏更具挑战性和趣味性。GiiNEX的成功发布，得益于腾讯在游戏AI领域的持续投入和深入研究。该引擎集成了前沿算法模型、高效训练平台和在线推理引擎三大核心，确保了其在游戏开发全生命周期中的高效运行和稳定支持。同时，基于强化学习、自然语言处理等AI基础研究能力，GiiNEX构建了统一算法底层模型，使得其能够支持多种游戏类型，满足不同玩家的需求。展望未来，随着GiiNEX的持续拓展游戏AI解决方案，我们有理由相信，游戏与人工智能的融合将会进一步加深。这一融合将不仅局限于内容生成和决策支持，更将渗透到游戏设计、玩家互动、运营管理等各个环节。在GiiNEX的引领下，游戏世界将会变得更加真实、生动和富有想象力，为玩家带来前所未有的沉浸式体验。同时，GiiNEX的成功也将推动整个游戏行业的创新和发展。它将激发更多游戏开发者探索新的游戏玩法和设计理念，推动游戏产业的持续进步。而对于玩家来说，GiiNEX将带来更加丰富、多样化和个性化的游戏体验，使得游戏不仅是一种娱乐方式，更成为一种文化和生活方式。腾讯自研的GiiNEX游戏AI引擎的发布是游戏开发领域的一次重大突破和创新。它不仅为游戏开发者提供了强大的技术支持和内容生成能力，更将推动整个游戏行业的进步和发展。我们有理由期待，在GiiNEX的引领下，游戏世界将会迎来更加美好的未来。

2024-03-25 08:15:00 41

32K上下文，Mistral 7B v0.2 基模型开源了

刚刚，Mistral AI 的模型又更新了。这次开源一如既往地「突然」，是在一个叫做 Cerebral Valley 的黑客松活动上公布的。PPT 一翻页，全场都举起了手机拍照：这次开源的 Mistral 7B v0.2 Base Model ，是 Mistral-7B-Instruct-v0.2 背后的原始预训练模型，后者属于该公司的「Mistral Tiny」系列。此次更新主要包括三个方面：将 8K 上下文提到了 32K；Rope Theta = 1e6；取消滑动窗口。下载链接：https://models.mistralcdn.com/mistral-7b-v0-2/mistral-7B-v0.2.tar更新之后的性能对比是这样的：场外观众迅速跟进。有人评价说：「Mistral 7B 已经是同尺寸级别中最好的模型，这次改进是一个巨大的进步。我将尽快在这个模型上重新训练当前的许多微调。」Mistral AI 的第一个 7B 模型发布于 2023 年 9 月，在多个基准测试中实现了优于 Llama 2 13B 的好成绩，让 Mistral AI 一下子就打出了知名度。这也导致目前很多开源大模型都已不再对标 Llama 2，而是将 Mistral AI 旗下的各系列模型作为直接竞争对手。而 Mistral 7B v0.2 Base Model 对应的指令调优版本 Mistral-7B-Instruct-v0.2 在 2023 年 12 月就已开放测试，据官方博客介绍，该模型仅适用于英语，在 MT-Bench 上能够获得 7.6 分的成绩，逊于 GPT-3.5。此次开放基础模型之后，开发者们就可以根据自己的需求对这个「当前最好的 7B 模型」进行微调了。不过，7B 模型只能算是 Mistral AI 众多惊艳成果中的一项。这家公司的长远目标是对标 OpenAI。上个月底，Mistral AI 正式发布了「旗舰级」大模型 Mistral Large。与此前的一系列模型不同，这一版本性能更强，体量更大，直接对标 OpenAI 的 GPT-4。随着 Mistral Large 上线，Mistral AI 推出了名为 Le Chat 的聊天助手，也实现了对标 ChatGPT。而新模型的发布，也伴随着公司大方向的一次转型。人们发现， Mistral Large 并不是一个开源大模型 —— 有跑分、 API 和应用，就是不像往常一样有 GitHub 或是下载链接。与 Mistral Large 发布同时发生的，是 Mistral AI 与微软达成了长期合作的协议，不仅会将 Mistral Large 引入 Azure，还收获了微软 1600 万美元的投资。Mistral AI 对路透社表示，作为交易的一部分，微软将持有该公司少数股权，但未透露细节。未来，二者的合作主要集中在三个核心领域：超算基础设施：微软将通过 Azure AI 超级计算基础设施支持 Mistral AI ，为 Mistral AI 旗舰模型的 AI 训练和推理工作负载提供一流的性能和规模；市场推广：微软和 Mistral AI 将通过 Azure AI Studio 和 Azure 机器学习模型目录中的模型即服务（MaaS）向客户提供 Mistral AI 的高级模型。除 OpenAI 模型外，模型目录还提供了多种开源和商业模型。人工智能研发：微软和 Mistral AI 将探索为特定客户训练特定目的模型的合作。当被问及公司是否正在改变其开源商业模式时，Mistral AI 联合创始人 Arthur Mensch 在采访中表示：「我们从开源模式开始，任何人都可以免费部署，因为这是广泛分发它们并创造需求的一种方式。但从一开始，我们就提供了一种具有优化模型的商业模式，这让使该公司能够为模型开发所需的昂贵研究提供资金。」(本文来源公众号：机器之心，如有侵权请联系删除)

2024-03-25 08:08:00 84

猎聘发布：女性AIGC岗位投递人次同比增长190.49%

根据猎聘发布的《2024女性人才数据洞察报告》，AIGC（人工智能生成内容）领域近一年来呈现女性人才蓬勃发展的势头。数据显示，女性在该领域的求职人次同比增长了190.49%。进一步分析发现，在AIGC领域三级职能中，产品经理的求职人次遥遥领先，市场、品牌、内容、设计、运营和算法工程师依次紧随其后。值得关注的是，简历中注明具备AIGC技能的女性同比增长了129.74%，其中产品经理更是以9.05%的比例高居榜首，显示出女性在AIGC领域逐渐掌握并展示出色的专业技能。与此同时，算法工程师和产品运营分别位列第二和第三，突显了AIGC领域技术性和运营性岗位的双重受欢迎。从整体趋势来看，女性人才对AIGC领域的认知逐渐加深，更多女性通过学习和实践掌握AIGC技能。她们愈发自信地选择投递自己擅长的岗位，也敢于挑战技术门槛较高的岗位。这一趋势不仅为AIGC领域注入了新的活力，同时也为促进性别平等在科技领域的实现迈出了坚实的一步。

2024-03-08 08:50:00 57

谷歌：将打击AI生成的垃圾内容

每天，全球各地的用户都依赖谷歌搜索来获取网络上最优质的信息。作为应对垃圾信息的领军者，谷歌一直制定着严格的政策和采用先进的自动系统，以打击那些试图通过低质量内容操纵搜索结果的行为。谷歌持续更新这些政策和系统，以及时应对新兴的策略，确保能够持续提供有用的内容，并将用户引导至高质量的网站。今天，谷歌宣布了一系列关键性的变化，旨在提升搜索结果的质量和实用性：提升质量排名：谷歌正在对其核心排名系统进行算法优化，以确保搜索结果中呈现出网络上最有帮助的信息，并同时降低非原创内容的显示。新的和改进的垃圾信息政策：谷歌正在更新垃圾信息政策，以确保搜索结果中排除最低质量的内容，包括那些由新所有者将过期网站重新用作垃圾信息库和讣告垃圾信息。减少低质量、非原创的搜索结果：从2022年开始，谷歌便开始调整其排名系统，以减少在搜索结果中出现的不实用、非原创的内容。这项工作的经验将在2024年3月的核心更新中得以体现。更新政策以打击垃圾信息：谷歌正在多方面更新垃圾信息政策，以更好地应对导致非原创、低质量内容显示在搜索结果中的滥用行为。规模化内容滥用：长期以来，谷歌一直反对使用自动化生成大规模低质量或非原创内容的行为，以操纵搜索排名。为了更好地应对这些技术，谷歌正在强化政策，着重打击那些通过大规模生成内容来提高搜索排名的滥用行为。滥用站点声誉：有时，一些网站可能托管第三方提供的低质量内容，以谋取托管站点的良好声誉。谷歌现在将考虑将那些由第三方提供的极低价值、主要用于排名目的、并且缺乏网站所有者密切监督的内容视为垃圾信息。过期域名滥用：有时，已过期的域名被重新购买，用于提升搜索排名。这种行为可能误导用户，使其认为新内容是旧站点的一部分。谷歌现在将已过期域名的这种行为视为垃圾信息。作为全球最大的搜索引擎之一，谷歌每天都在努力提供有帮助的搜索结果。这些变化的目标是进一步减少搜索结果中的低质量和垃圾信息，确保用户能够更轻松地找到高质量、有用的信息。

2024-03-08 08:15:00 89