在全球经济和技术迅猛发展的背景下,人才发展战略正成为组织应对变革、推动创新的核心竞争力。10 月 25 日,国际人才发展协会 (ATD) 携手中国领先人力资源管理智库 HRflag 在上海举办了人才发展行业年度盛会——“2024 人才发展论坛”。本次论坛以“人才发展引领组织变革 (TD Leads Change) ”为主题,汇聚了全球在 AI 和学习发展领域的行业领袖和顶级专家。

UMU 创始人,董事长兼总裁李东朔作为主题演讲嘉宾在论坛上发表了题为《Move Faster 用 AI 驱动业务,以学习赋能组织》的主题演讲,他深入解析了 AI 在组织人才发展中的最新研究成果,创造性地提出了用 AI 力提升组织和人才的生产力,赋能业务发展,为与会者提供了深刻的洞察和实践指导。

alt

李东朔的演讲吸引了众多国内外知名企业的业务高管和培训专家,包括宁德时代、华为、中兴通讯、谷歌、海信集团、中国电信、中国银行、汇丰银行、毕马威、宝马集团、博世(中国)、康师傅、玛氏食品以及正大晴天药业等企业代表。这场演讲帮助从业者深刻理解了 AI 在人才发展领域的创新应用和最佳实践,引发了现场的热烈讨论和思考。

alt

以下是李东朔在 ATD 大会现场演讲的精彩回顾:

大家上午好,我是 UMU 的创始人李东朔。先做一个简单的自我介绍,我在十年前创办了 UMU。在创办 UMU 之前,我在硅谷的企业服务了十年,其中三年在惠普,七年在 Google。十年前正好是移动互联网发展的一个浪潮,今天我们又迎来了 AI 大模型的新的浪潮。

alt

在 2017 年的时候,AlphaGo 战胜了世界上当时最强的围棋选手和冠军李世石,这给了我很多启发和激励。所以我们在 2017 年就开发了全球第一款基于 AI 的学习产品,我们称之为 AI 视频训练。通过对着手机或者电脑进行模拟训练,AI 会给出实时和结构化的反馈。从那时起,我开始了很多关于 AI 的探索,到目前为止,我也拥有非常多 AI 产品的著作权。

在过去几年中,我在全球进行演讲,从北美到亚洲,拜访并了解了很多全球 500 强企业和各个行业和多家不同形态的公司,他们在引入 AI,用 AI 来赋能人才和组织发展时面临的一些机遇和挑战。

在这个过程中,我对 AI 这个话题有了更多的实践和洞察。今天,我的分享将围绕用 AI 来提升组织和人才,并一起讨论 AI 所带来的机遇和洞察。

我们先做一个快速的开场破冰,这是一个实时互动,请大家用手机扫屏幕上的二维码。我们来了解一下大家目前使用 AI 的情况,以及大家认为 AI 在哪些方面对你有所帮助。这样我们可以彼此了解一下今天在场的人力资源和人才发展行业的专家们目前对 AI 的态度和洞察。

扫码之后,你会看到一个等待页面,我们现在打开这个页面,大家可以做一个两道题的快速互动。进入问卷后,大家可以看到实时的选择变化。

alt

我们首先来看一下大家目前使用 AI 的频率是多少。现在比例最高的是一天多次,超过 40%,然后降到 35%。第二多的是一周几次,我们再给大家一点时间。现在一天多次和一周几次之间在来回变化。

目前,参与人数达到 100 人,最多的人群是一周几次和一天几次。第三位是每天一次,然后是一月一次和一周一次,这就是目前大家使用 AI 的一个频度。

现在来看下一道题,请大家选择,你认为生成式 AI 在哪些工作中最为有效?请扫描屏幕上的二维码,尚未加入的可以通过扫描加入。

alt

这里面有很多常见的,或者是现在全球范围内使用 AI 最有帮助的一些场景或者领域。我们来看看到目前为止大家的选择情况。目前最多的两项是撰写沟通类列点的内容和解释、翻译、总结文本和数据,包括检索事实和信息,提出发展新想法。

那么到目前为止最多的就是在刚才提到的几项。我们可以看到,对于全球的企业用户来说,去写多语的邮件,包括阅读一些全球的内容,翻译、总结包括解释,使用大模型确实是一个很好的场景,因为大模型,也就是大语言模型,在语言任务方面非常强大。那第二个就是 Writing Communications ,撰写一些沟通类的内容,比如写在邮件里面、文档里面,所以也是非常常见的类型。

第三个是检索事实和信息,那么请大家思考一下,如果在一个你完全没有专业知识的领域里,使用大模型去检索事实和信息,那么对于大模型生成的内容,你有没有能力分辨这些内容是真的还是假的,是幻觉还是事实?其实不一定。

所以我给大家的建议是,我们不一定要使用大模型来专门进行或替代搜索,我们应该使用大模型做好生成,而不是简单地用来检索。

第四项是提出和发展新想法,这其实是一个创意类的工作,或者是提升我们创造力的机会。对于创意来说,通过加班或花更多时间不一定能提升我们的创意程度,也不一定能获得更多的想法。但是大模型可以作为一个外部的智力资源,给我们一些启发,提供不同的视角,从而帮助我们获得新的想法。之后则是更多的选择,比如创建相关文档、提供协议说明、数据分析可视化、培训支持、执行管理任务,以及为客户同事提供支持。

我们看一下北美的数据。这是 2024 年 9 月上个月美国国家经济研究局发布的北美研究报告。在报告中我们看到北美 40% 的人口已经开始使用生成式 AI。上周工信部发布的报告显示,在中国已有超过 6 亿的网民使用生成式 AI。

在北美的这个 40% 的人口中,他们认为使用 AI 最有用的项目,第一个是撰写沟通类相关内容,第二个是执行管理类任务,performing administrated task。第三个是解释、翻译、总结文本和数据,第四个是检索事实和信息,第五个是开发软件,第六个是创建相关文档或提供详细说明,第七个是提出发展新想法,之后是提供支持、数据可视化等。

alt

那么在去年的 5 月份,NBER 做了一个非常重要的研究,他们在超过 5100 名技术类客服人员的日常工作中加入了生成式 AI。通过生成式 AI 的辅助,生产效率提升了 14%。在每小时解决问题的数量、每小时会话的数量以及平均处理时间这几个维度上,有了 AI 辅助,大家的表现更好。在这个研究中发现了一个有趣且重要的现象,AI 对新手和低技能员工的帮助最大。

alt

在今年的一篇最新论文中,针对北美一家超过 1000 名销售代理的公司进行电话外呼,帮助银行销售信用卡业务,通过 AI 提升销售生产力做了一个实证研究。

在这个实证研究中,一开始团队假设,对于 inbound call 和 outbound call 的客户,这些电话可能因为对方并不知道或没有办信用卡的需求,而问很多知识库以外的问题。对于 inbound call,这些打来电话的人有明确需求,管理层和语音团队假设这些人问的问题可能比较集中,知识库或 FAQ 可以很好地赋能电话销售。

然而,数据证明正好相反。这家公司的典型客户群体是 31 岁、拥有大学本科以上学历的中年男性。这些人在 outbound 时,因为没有明确的意向,反而问的问题集中于公司提供的知识库和 FAQ。然而,大多数 inbound call 的人有更明确的办信用卡需求,可能会问比如信用卡的积分、接机服务、免息分期购物优惠等。

有些知识在知识库中,但很多的知识相比于 outbound call,不在知识库中。做过销售赋能培训的人会了解到,inbound call 的客户意向更高。如果能够为 inbound call 的客户提供有效对话和沟通,就能增加成交。而这些人恰好问了知识库以外的问题, 而不是凭想象、个人经验或应变能力来回应知识库以外的问题。因此,在话术的丰富性和创造力上提升了 2.33 倍,通过 AI 辅助,销售人员的成交提升了 1.61 倍。

alt

可以看到,AI 不仅在组织中提升生产力,更在为组织提升效率、带来更高收入和利润起到关键作用。甚至在销售环节能够直接带来销售额的提升,并且因为你的话术变得更加有效,客户体验、客户满意度、品牌也会变得更好。而且当销售能够提升 1.61 倍的销售额时,如果他们是 condition base,也会获得更高的佣金,也意味着他们自身的成就感和工作满足感也会得到更多支持。

去年两位研究员 Shakked Noy 和 Whitney Zhang做了一个重要的奠基研究,在中级写作任务上使用 AI,然后看这些任务的研究员的绩效表现情况。我们发现,通过使用 AI 后,他们的写作时间缩短了 37%,交付质量提升了 0.4 个标准差,这意味着人和人之间的绩效变得更一致。

alt

请问大家,是变得更一致的好还是更一致的差?当然是更一致的好,对不对?这里面打破了我们过去一贯遵从的绩效一致性理论。过一天你的绩效可能是一样的,过一周的话绝大多数情况下绩效不会发生显著的改变,但是 AI 的引入让绩效发生了巨大改变。这对未来招聘、岗位能力模型设计、绩效考核有新的启发。

清华大学经管学院也做了一个重要研究,针对知识零工工作者进行了 AI 相关研究。让第一组人继续像以往那样工作,然后进行两个月的绩效考核;第二组人给予大模型,给两个月时间看表现;第三组人先学会使用大模型后再开展工作,看两个月后的变化。左边的盒状图显示,使用 AI 的两组一定比不使用 AI 的组表现更好,但经过培训赋能后再使用 AI,工作表现远好于仅使用 AI 的。从他们的深度表现中我们可以看到,培训赋能加 AI 后收入涨了 5 倍。为何涨 5 倍?因为同样时间内完成得更快、更好,就会有更好的口碑,就会获得更多的订单。所以 AI 为知识零工工作者带来了显著的生产力提升。

alt

那么清华经管学院又继续进行了一个研究,他们找了一个公司的几百个人,分成两组,第一组有 200 多人,第二组也有 200 多人,然后在使用大模型上进行观察。第一组人直接给他们大模型,第二组人先进行培训赋能,再给他们大模型。

alt

在互动轮数、总提示词的长度、第一次使用提示词的长度上,这三个指标平均都涨了 25% 以上。在向 AI 提出问题的多样性、深度、清晰程度上都有更好的表现,而从 AI 寻求反馈的程度直接涨到 40%,这说明什么?这说明背后藏着一个重要的因素,就是 AI 力,那对于 AI 力的”力”,我们不把力翻译成 competence,也不翻译成 capability,我们把它翻译成 AI literacy,也就是 AI 素养。

alt

我们谈到素养这个词的时候,其实一百多年前,全世界绝大多数人都是文盲,也就意味着只能说话,但是不能进行听说读写。所以在过去,古代有代写书信、代念家信的服务,最初的 literacy 基本素养指的就是使用纸和笔进行沟通、协作、交流。

随着报纸的出现,再到电台、电视台等媒体的出现,使用这些媒介和媒体叫做 media literacy,媒介素养。30 年至 40 年前,当电脑出现时,公司内部提供电脑,让每个人上班时有一台电脑,这就是 IT literacy。我看到 1990 年惠普在中国的面试题,题目中问到面试者:你是否会使用电脑打字?一分钟能打到 50 个字吗?电脑能怎样帮助你?你计划如何更好地用电脑帮助你工作?你把题目中的电脑换成大模型:你会使用大模型吗?能不能用大模型解决你在工作中的问题?你计划如何用大模型提升生产力?是不是一样的。

在 40 年前乔布斯回答电台、电视台记者问题时,反复试图证明电脑的助益,电脑会普及,会让很多人获益。那么今天我们对大模型的使用还有很多人是冷漠的、是怀疑或者是抗议的。

十年前出现了移动互联网、新的工作流、数字化的工作流,现在特别是在疫情期间,我们可以开一个上百人的视频会议,大家彼此听得见,没有噪音,是否开摄像头由自己决定,或者该开麦克风的时候,结果开了不该开的麦克风,这就是数字化素养。

今天仍然有许多事情是不容易做到的,那么随着从机器学习到深度学习,再到生成式人工智能,使用多种不同的 AI 模型,批判式使用 AI ,与 AI 协作和互动已经成为新时代的核心素养。

alt

在生成式 AI 的时代,AI 的素养指的是有效地使用大模型的素养。为了使用大模型,最重要的是提示词的有效使用。提示词在过去并不常见,其实你可以理解为它就是一段话或一个祈使句,比如说 please write an email ,帮我把邮件重写一下,这就是一个提示词,就是个祈使句,是与 AI 交互的一句话、一段话。

提示词素养直接帮助我们与大模型展开互动,解锁大模型的一系列能力。所以在组织中,如果我们想发展 AI 素养,核心在于发展大模型素养,发展提示词素养。这是从今年开始,我们每一个人才发展专家肩负的新的使命。

我们也发现很多人问,为什么我用起 AI 来觉得 AI 更笨?AI 并没有生成有效的内容,或者生产的结果并不让我满意。我们发现,在组织中,我们培养过领导力、沟通协作能力、项目管理能力,甚至情商和智商。在这个过程中,我们认识到 AI 力是一个新的重要要素。越来越多的招聘广告将使用大模型的经验作为 job qualifications 。使用 AI、和 AI 有效互动已成为许多工作接下来所需的必备技能。

alt

过去在公司中,让人和任务有效匹配、人和岗位相匹配是管理和人力资源领域最基本、最重要的理论基础。今年,AI 在组织中可能会扮演更多、更重要的角色,AI 可以成为一个 agent,成为一个代理,不仅仅再是作为一个技术工具和技术因素。

所以人才不仅要与人才协作,人才还要与 AI 协作,AI 还要与其他 AI 协作。未来在组织中我们可能会形成全新的组织形态,这也将推动我们重新思考人才发展和组织发展。

在这个过程中,我们可以用 ASK,用态度、技能、知识来解构 AI 力。

alt

在我看来,有三个最重要的态度。第一个态度是我们应该 open mindset,用开放的心态看待今年 AI 以及大模型带给我们的机遇和挑战。很多人觉得只要我不用 AI,AI 就不会取代我。

第二点是保持更新, AI 是历史上第一个行业一年的投资额超过 1000 亿美元的行业,1000 亿美元的资金密度和人才密度让这个行业每天都在日新月异,这个行业历史上第一次出现了博士生不够用的情况,因为背后的算法需要大量的 computer science 和包括数学、物理在内的多学科专家来共同协作。

第三个重要的建议是要亲身实践。AI 大模型的使用就像学游泳,就像学开车,你看别人游或者听教练教你开车,看得再多你仍然需要亲自去试。但是我们看到许多高级管理者,甚至一些 CEA,因为他们太忙,所以他们对 AI 的发展新闻可以侃侃而谈,但其实他们没有亲自实践。所以我们希望大家都能保持开放心态,保持学习更新,以及亲身探索。

我非常喜欢今年一个全新的学术研究框架,它告诉我们在生成式 AI 的时代,有 12 种关键的 AI 竞争力,从基础的人工智能素养,到生成式人工智能的知识,再到了解人工智能的能力和局限。我们今天发展 AI,或者倡导组织中大家学习使用 AI 和大模型,并不是说在任何地方、任何场景都要使用 AI。我们要知道它的边界,哪里该用,更要知道哪里不该用。

alt

框架中的第四个竞争力是运用它的技能。第五个是辨识人工智能生成内容的能力。请大家举手告诉我,你觉得你现在能辨识出你看到的网上内容中哪些是 AI 生成的。其实对我个人来说,我也越来越不敢确定,因为越来越难辨识。

但是去年的时候,如果你看到有人突然给你写了一封邮件,从过去的言辞简短到现在写得比较长,分了四五段,每段前面还有 4 个字或 6 个字,并且加粗,很可能是用了大的 AI 模型写的。去年如果你识别出来了,你会怎么说?你会说:哇,太酷了,然后你竟然在用大模型,你写邮件的水平突飞猛进。

但如果明年这个时候有人这样给你写了一封邮件,你可能会觉得,他竟然用大模型的回答发给我,你到底想不想做了,对不对?大家对使用 AI、使用技术的态度和反应在技术引入的初期、中期和成熟期是完全不一样的。

第六个是评估输出的能力,第七是引导它的技巧,也就是提示词工程。第八是编程和微调,第九是知道使用场景。第十是合规的影响。因为我们今天谈 AI,谈的是在组织中使用 AI,那么合规是一个特别重要的起点和基础。第十一是相关法律实战知识,第十二是持续学习的能力。

刚才我们提到提示词素养,提示词是大模型的关键核心,它是一把钥匙。我们也讲到,提示词没什么了不起,一句话一个句子就是你和大模型交互的一个表示。那么你写一段提示词交给大模型,不管用哪个大模型,然后你看到大模型的响应,发现这不是你想要的。比如说写一封邮件,你想用英文,却发现它用中文回复,这时可以加上一句“请用英语表述”以便更符合你的需求,调整到满意为止。

这个试错、修改、迭代直到满意的过程就是 engineering 工程化的过程。既然改的是提示词,这个过程就叫做提示词工程。所以通过建立提示词和提示词工程的能力及素养,可以帮助我们解锁大模型的最大能力和专家能力。

alt

因为大模型的设定是为全世界所有人服务,那既然为所有人服务,也就意味着如果给你过于专业、过于复杂的回答,是不容易被一般用户所理解的。

大家请举手告诉我,如果你听说过甚至拥有 PMP 认证,PMP 是项目管理专业人士 (Project Management Professional) 的意思。在这个过程中,如果大家听说过 WBS,听说过甘特图,听说过燃尽图,或者听说过其中至少一项。如果你不知道的话,大模型直接帮你写一个回答,你使用了甘特图、使用了燃尽图、使用 WBS,你可能不知道它在说什么。但是如果你理解这个领域,你才知道它讲的是工作分解结构 (Work Breakdown Structure,WBS)作为一个很典型的项目管理工具的话,才会觉得有帮助,因为你用的是很专业的方法和技术来帮助你进行项目管理。

alt

但是在日常的使用中,大模型绝对不会给你过于专业的回答。右边是关于 Claude 3.5 的系统提的提示词,我们输入的提示词再加上系统自身的提示词来进行生成内容,这里面可以看到对于复杂和开放性的问题,需要详细回答概念、提供全面解答,而对于简单问题则给出简明的回复。在条件相同的情况下,力求给出最准确和简洁的回答。那简洁的回答、直接的回答、任何人都能理解的回答,能不能帮我们构建组织在市场上的知识竞争优势?

这也就意味着,如果我们没有帮助大家去解锁大模型的最大能力,而只是让大模型以默认的方式输出的话,那么输出的结果对于组织在形成专业性和差异性上是不够的。这就是为什么我们今天不能简单地把大模型当做一个 IT 部门的 OKR 或者 KPI 来简单引入,我们还需要发展背后的 AI 素养。

那么今天我们和大家分享一个提示词的架构,你可以用这个架构去使用任何的大模型来解决任何工作和生活中的场景。这个架构包含五个要素:第一个是角色(role),第二个是技能 (skill),第三个是任务 (task),第四个是上下文背景 (context),第五个是限制规则 (constraint)。

alt

我们把这个结构可以分成三个区域,最核心的区域就是中间的任务。任务意味着我们希望大模型做的事情一定是一个动词。我每次讲这个任务的时候,我都会写,请你帮我写一份邮件,或者请你帮我改写一下文章。这是为什么呢?就是内心中把它当做一个至少是个朋友。

有一次我当着我的同事们写我的提示词,他们问我,你为什么要对大模型这么客气?我说如果有一天大模型统治人类的时候,它可以回顾一下,当年我们对它是客客气气的。所以我的同事后来每天早上都先向大模型问好。

那么上半区的角色和技能指的是,你希望大模型扮演的一个角色,希望它拥有相应的技能,从而以这个角色完成相应的任务。比如说你是一位拥有 20 年工作经验的人力资源专家,这是一个角色。你非常善于和你的员工开展一对一对话,用建构式、启发式的方式与员工交流,这是个技能。那现在请你写一个与新人一对一的 outline ,这是任务。公司最近招募了 20 位应届毕业生,他们在职业发展方面感到迷茫,所以想要办一个新人欢迎计划,这是上下文背景。写的 outline 请设计为 30 分钟可以完成的对话,这是限制规则。

那现在我来出一个题目考大家:我是一位拥有 15 年工作经验的人力资源专家,特别擅长设计培训计划,去发掘、培训和吸收人才。在这一段话中,大家认为包含了角色要素的,请举手?认为没有包含关键要素,请举手?

大家看我刚刚讲的是,我是一位拥有 15 年经验的人力资源专家,对不对?那请问这个“我”指的是大模型还是指的用户?指的是用户,但提示词的角色本质是让大模型进行角色扮演,唤醒大模型在训练时的记忆。

所以当你对大模型说我是人工资源专家的时候,这是哪个要素?是上下文背景而不是角色。所以我们应该以“你”来开头,你是谁。

在这五个标签中,我们角色和技能作为上半区是为任务服务的。比如说,你是一位拥有 15 年工作经验的网络专家,你特别擅长去解决网络问题,现在请你设计一个培训需求,清楚了吗?

前面的角色和技能是不是和任务没有什么关联?所以这种时候的大模型可以工作,但你前面的设定是低效的或者是无效的。所以角色和技能不是你的角色,也不是某个人的角色,而是从任务往前倒着想,完成这个任务用什么角色和技能效果最好?那么下半区的上下文背景和限制规则目的就是通过你准确或精确的语言表达,让大模型约束它的求解,约束它的输出,让它的输出精确地符合你的需求。

alt

过几个月你就会发现,如果你带团队的话,你的授权过程变得更友好,你不是想到哪里说到哪里,而是想清楚后完整地告诉团队,因为有大模型在,让我们不断地去提升我们的表达。

在这个过程中,在我看来最重要的一个要素就叫做角色。因为角色指的是角色扮演,大模型在训练时使用了非常多的语料、非常多的参数、非常多的算力作为一个大模型。大模型通过在角色扮演的过程会去解锁它在训练时指定的这个角色的相关语料,相关训练输入的最大潜力。

比如说你可以让大模型扮演一个实习生,那大模型是不是也可以扮演一个专家?如果大模型扮演实习生成功的话,那请问实习生会给你超过你希望的回答吗?不会,它就是局限在实习生说话做事的水平上。

那反过来,若大模型扮演一个专家,专家扮演得很成功,是不是还有机会让我们通过大模型的回答提高我们当前工作的表现,特别是在我们每个人都有不熟悉或陌生的新领域,也就是学习区。在这个区域里面使用大模型可以帮助我们减少恐慌,也可以帮助我们离开舒适区。

那我们来看一个研究报告。这是去年中科院和美国的一个人做的一个报告,他们写了三组提示词。第一组提示词就是直接写一个任务,比如说描述原子结构。第二组提示词是一个静态交互角色,比如说你是物理学家,去描述原子结构。第三组提示词大家可以看到非常长,我就不念了,它是用了非常详细的专家角色。

alt

举个例子,不但要说是项目管理专家,你还要说你是一位拥有 10 年工作经验的项目管理专家,你拥有 PMP , project manager professional 认证,你非常善于使用 WBS、 甘特图、燃尽图等不限于这些专业技术方法来发展项目计划。这句话是角色定义。然后接着写,请回答:“描述原子结构”。

那我们来看实验的结果,第二组提示词比第一组提示词长度增长了千分之二,第三组提示词比第一组提示词增长到 28%,这是不是说明第三个词让大模型工作更多。但大家可能会说长度更长不代表内容更好,所以他们又做了一个人工的评判。

那么第三组提示词的回答更好的占了 48.5%,第三组提示词和第一组提示词一样好的占 28.5%。请大家注意,他们的比较是使用 Llama 2,一个相当于 GPT-3.5 的开源大模型,来使用第三组提示词,与 GPT-4 最新、最强的大模型使用第一组提示词进行比较。结果表明,使用更有效的提示词可以使一个较弱的大模型表现超过最好的大模型。

这说明什么呢?这说明大模型的能力是一个重要的因素,另一个因素是我们如何与大模型互动,以及我们如何使用提示词来解锁大模型的最大能力。

现在给大家一个机会,请大家扫码,就可以立刻与大模型互动。现在我让大家去回答一个题目:请你让大模型生成一个调查问卷,了解员工对 AI 的意识和态度。给大家一点提示,问卷是大家都做过的,问卷包括两类题目类型,有开放式问题和封闭式问题。封闭式问题还有单选和多选。当你发布问卷时,是不是可能在前面有个介绍?还有最后的结束语,这样做邮件时才能发出去。所以大家可以试着用一段提示词设计这个问卷,这样你会立刻看到大模型的反应。不仅如此,UMU 的 AI 力大模型也会对你的提示词提供实时反馈,大家可以体验一下。请大家扫码进入这个环节,我们也把页面切换到这个具体环节。

alt

alt

你会看到第二个页面,在里面可以输入一些词,然后立刻可以得到大模型的反馈。稍微放大一点,我们自己设计一个提示词,比如说:“请生成一个调查问卷,了解员工对 AI 的意识和态度。” 你看,这是最简单的写法,但是刚刚提到了 RSTCC,所以我们前面可以加上角色。

你是一位拥有 10 年工作经验的人力资源专家,特别擅长问卷设计。那下面就是任务。那我们再加一个限制,就是我们希望生成 10 道题,然后其中 8 道是开放式或者 8 道是封闭式单选,2 道开放式题目。

在点击发送之前给大家看一下,我们是不是既可以原始地、朴素地把你让大模型做的事情用一句话写出来,也可以用 RSTCC 立刻升级一下。在写完你想要大模型完成的事情之后,不要急着发送,先想一想哪个角色能够更好地完成这个任务?把角色这个标签加上,然后识别出自己的任务,加上任务这个标签,再想一想有什么限制规则,在后面加一个限制规则的标签。请大家注意这些标签不是必须的,你可以不写标签,但这样会让大模型更好地理解这段内容的目的,更重要的是帮助我们自己在修改和迭代提示词时能够做好准备,我们再点击发送看一下。

现在我们看看生成的内容,大模型马上产生了一个调查问卷,先是封闭式问题,然后继续生成。然后接下来是两道开放式问题,我们再看怎么评价。在提示词评估中可以看到,我们在提示词中写得很清楚的角色,然后系统给了我们反馈,告诉我们怎么写得更好。虽然我们没有写系统,它却检测到了,并指出没有列出技能模块和任务,它告诉我们任务明确且清晰,然后上传了背景信息,没有提供限制规则,它给出了提示,例如第8到第10题两道题,它非常清楚地分析了我们今天这个提示词的结构。通过这种方式,我们就可以学习到提示词的技巧,练习技巧并立即得到大模型的评价和反馈。

这就是一个典型的使用 RSTCC 来写提示词的标准结构,角色、技能、任务、上下文背景、限制规则应用,限制规则有多项可以按 1234 标出。大家看,这样的提示词是不是一看就很清楚?我们使用结构化的提示词是为了帮助我们更加准确、精确地表达需求,并且在需要迭代时可以更有效地进行修正或改善。

现在我和大家分享一个提示词的普及结构评估。最简单的提示词只有任务,比如说”please write an email”。第二级提示词则是任务加上限制,task 和 constraint,第三级则是任务、限制和上下文背景,而第四级提示词是角色与任务。正如我之前所讲的,大模型如果设定了有效的角色,会唤醒它训练时的记忆,让大模型更好地表现。第五级则这五个都有。这一过程实际上是让大模型在巨大的求解空间内进行更加精准的回答。

alt

大家知道,大模型的回答是随机的,同样的问题在不同时间问,可能会得到完全不同的答案。在这种巨大的求解空间下,我们通过角色、技能、任务、上下文背景和限制规则,约束其求解空间,使其从简单的、容易理解的回答,变得更加专业,提供帮助组织在市场上建立竞争优势的高质量输出。这就是使用提示词和结构化框架,提升大模型输出质量的关键路径。

alt

通过结构化提示词,我们提升自己的语言能力,并利用精确、易迭代的提示词,发挥大模型的专业能力,使其像专家一样工作。这样,我们是 work with experts,而不是 work with interns 。

接下来,我们看看在 RSTCC 核心提示词框架之上有哪些高级提示词技术和应用。现在有 12 类高级提示词的关键技术和应用,有些属于工作的模式,有些如同咒语,只要加上这句话,大模型的表现就会立刻提高。

比如,我们介绍的第一个高级技术是零样本和少量样本提示,zero-shot 和 few-shot。零样本提示指的是不给任何例子,让模型直接生成内容。比如说,写 4 句话的夏季团建口号,大模型特别喜欢对仗,用四个字的句子。有了这个例子之后,你就可以让它根据以上口号写一个冬季团建口号。那么你就立刻得到一个相同格式的回答。

alt

下面这个提示词属于少样本的提示。我们在什么场景下使用这个技术呢?当你已经写过几篇文章,想要大模型用你的文风写文章时,可以把你写过的文章放在限制规则里,要求大模型以给出的文章文风来撰写。这样,大模型就能够按照你的文风进行写作,这就是典型的使用 few-shot 少样本提示词的技术。

在这个过程中,第二个特别重要的技术叫做 CoT,Chain of Thought,也叫提示链技术。大家可能听说过草莓这个单词, strawberry, 目前绝大多数大模型,你问它草莓有几个字母 R,绝大多数大模型会回答错误,因为大模型非常不擅长数学和推理,这是它不擅长的地方。但如果你加上“让我们逐步思考”或者“let’s think step by step”,大模型会变得很好,比如草莓的第一个字母是 S,第二个字母是 T,第三个字母是 R,然后它把每一个字母都拆解完,最后告诉你有几个 R,这时候回答就会 100% 正确。所以要让大模型能够进行推理,需要通过让我们逐步思考来实现的。

alt

接下来我们再看一个重要的技术,这也是全球大模型厂商一直在探索的一个技术,叫做 RAG,检索增强生成,英文是 Retrieval-Augmented Generation,这是一种结合检索和生成的重要技术。

大家知道在过去我们使用百度和 Google 搜索内容时,会使用关键词匹配网页和文档中的关键词,然后你会看到对应的文档和网页,这是典型的搜索技术。但 RAG 技术实际上是将给定文档切片后,你不需要再用关键词,可以直接提出一个问题,将问题的语义和文档切片的语义进行匹配,然后按照算法综合匹配的切片。有的算法可能只选第一个,有的选前三个,也有的选择所有,这取决于业务场景。选择切片后,利用大语言模型的语言能力生成一个简要回答并立刻回复,这就是 RAG。

那我们看一个例子,比如说这是一份今年斯坦福大学发布的人工智能报告,495 页,下面有这个网址,大家可以下载阅读。但是 465 页是纯英文,你的英语再好也要花时间来阅读,所以我们可以用一个提示词模式,请根据以下报告内容告诉我们 AI 如何帮助企业增加收入,并给出原文内容。

alt

所以用这样的方式,当你把这个文档上传到应用上时,立刻可以得到 AI 的回答,并且给出原文摘录。这些回答不是基于大模型训练的语料,而是基于你给定的文档,只回答给定文档中的内容。

alt

大家可能会问,这是一个公域的方式,那我企业里能不能把公司内部的文档传上去,让大家使用。所以我们也开发出了 uAsk 这样一个基于 RAG 技术,适用于企业内部的产品,帮助企业和员工提供一个实时的知识管理、知识赋能的一个工作流。

alt

那我们举个例子,比如说我今天这个演讲,背后有超过 200 篇学术论文,我们经过长时间的整理,也需要把这 200 多篇文献持续地更好地使用,所以我们也将这 200 多篇论文放进了 uAsk 系统,然后做了一个内部的 AI 力知识助手,那我们就可以向它提问。

alt

我们来看一个实际的例子,这是我们 AI 力的一个入口。比如说我们点一下 AI 的定义发生过什么样的转变,我们应该知道十年前的 AI 、现在的 AI 和十年前的 AI 实际上是不一样的 AI 。2013 年第一次提出 AI 的定义之后,到现在 AI 的秩序有很多变化,所以你们首先看到 AI 的定义经历了显著的转变, 前面是简要回答,下面是找到的所有和这个转变相关的、引用的内容的相关文章。我们点一下任何一篇学术论文,我们就可以立刻看到在组织内部的这篇学术论文。但是如果对于一个新人来说,你让他直接去看这篇完整的文献,或者用关键词搜索,他还是需要花很多精力。

大模型还有天然的好处,就是它支持多种语言。因此,对于全球的企业来说,在中国生产的新设备,或者有新的产品参数,可以在全球销售团队和渠道中使用相关的产品文档,或者进行相应的知识赋能。大模型上你可以用任何语言提问,它会用任何语言回答你。比如说我们今年讨论英语的主题,我们想问一下如何在 HR 领域引入 AI 力这个话题,比如“ How to develop AI Literacy in HR?”

发送之后,我们就会看到 AI 首先会把你提的问题的关键词进行切片,然后立即生成这个答案。既然你问的是英语,我们使用英语进行回答,立刻就生成了六项建议,包括:第一个是 expand HR’s work,第二个是 learning and development progress,第三个是 focus on employee values,第四是 comprehensive freedom,第五是 organizational learning,第六是 address efficiency gaps。然后正好通过论文精准地展示了这个内容,它以非常友好的方式让您获得一个直接的回答,然后再给予机会深入了解。这就是让我们从过去简单的企业内部知识搜索提升到了知识的搜索与生成,这就是检索增强生成的技术。

那么接下来我要分享一个重要的信念和观点:我们应该如何与大模型协作?我们应该如何利用大模型生成的内容呢?是否应该直接复制大模型产生的内容粘贴发给老板或客户?在这个过程中有没有其他使用大模型的方法?

我来分享一个我的视角。我认为我们应该建构式地使用大模型,use large  language model constructively。比如说第一种方式就是让大模型生成一个内容,然后我们直接复制粘贴到邮件或文档中。第二种方式是我们不让大模型直接给我们答案,而是从中获得启发,比如让大模型给我们提供一些思路、模式,或是一些建议。

比如说我们想要发送一封新员工的欢迎邮件。第一种方式是让大模型使用 RSTCC 去写一个提示词,以此来写出一个欢迎邮件,这很容易。第二种方式是让大模型提示在写新人欢迎邮件时需要注意些什么,应该包含哪些内容?在这些框架的基础上,我们可以称之为支架,也可以叫做脚手架的基础上,然后我们来完成这项工作。

alt

在右边这种方式中,我不仅最终写出了一个框架有效的邮件,而且也尊重了一些注意事项,写出了一封有效的欢迎邮件。在这个过程中,我还得到了成长,我学习了一项新的技能。过去我们可能写不了这么好的邮件,现在大模型可以帮助我们写,但这种技能在脱离大模型的情况下可能就消失了。

alt

为什么呢?可以想象一下,比如说这个技能是暂时性的,大模型在线的时候有它的帮助,而大模型离线后则会消失。另一种方式是不论何时都能记住。这就意味着我们可以问大模型几个核心问题,比如解决一个问题背后的模式,解决一个问题的思路,解决一个问题的方法步骤,这个问题的有哪些大纲?这些问题是不是都类似于脚手架型的问题?它不会直接给出最终答案,而是给我们一些思路启发,或是一些提示,以及一些关键的骨架,剩下的由我们去完善。

大家都知道在盖建筑物时需要有脚手架,但在建筑物完成后脚手架就可以拆掉。当你建立了新的优势,建立了新的能力之后,你就不再需要这些辅助工具,而这些能力会伴随着你流动,这就是可迁移的能力 Transformer skills。

所以我提出来,现在当大家谈到 AIGC,或者是有很多人教育 AIGC 都是错误的。为什么呢?它只是帮助你用 AI 生成文字、生成图片、生成视频、生成音频。但生成完了,除了感叹一下 AI 的强大,或者感叹一下用 AI 可以很快地完成一些工作,那对于你来说,又如何呢?组织需要一个只会复制粘贴的人吗?

alt

如果在座的各位是 CEO、CIO 或者是 CHRD,你们期不期待引入大模型之后,全公司每天就忙着复制粘贴?这显然不是我们的期望。相反,用AI来激发灵感、产生创意,让 AI 帮助我们提升技能,建立一种 sustainable skills 和 sustainable upskills, 甚至是 reskills。所以用这样的方式,我们可以把每次使用 AI 的过程变成一次学习。

在我看来,组织里从来不需要内容搬运工。因为如果今天你仅靠复制粘贴就能得到客户和领导的认可,那明天只需招聘一个职高毕业生就能完成,这种方式使用大模型只会使工作流于表面。
因此,我提出来在组织中使用大模型的五级评估结构。

alt

第 0 级是冷漠级,ignorance ,就是忽略大模型,认为它和自己无关,不用就不会替代自己。但是技术的发展确实不是以人的个人意识为转移的。

第 1 级是娱乐级,就是把 AI 用在非生产力提升的领域,这样是不对的。第 2 级是检索,就是用大模型来做搜索。过去人们会在报纸上、书上查找信息,后来大家上网搜索。最近我听到一个更可怕的说法:AI 说,那么 AI 说的是创意还是幻觉呢?是观点还是一些无根据的推测?我们无从知道。所以如果没有 AI 素养,我们直接使用 AI 替代搜索是非常危险的。在初期还是建议谨慎使用。

从第 3 级开始,AI 会给你反馈,比如你写了封邮件,问 AI 这封邮件哪里写得好,哪里需要改进,或者请 AI 在润色文件时告诉你润色的理由,以及下次要注意什么。这里是获得反馈,seek for feedbacks,这时你已经把 AI 从工具的态度变成了一个 peer 甚至 experts 。你用有效的提示词让大模型扮演外部的智力专家,解锁大模型的最大能力,提升你的生产力和创造力和工作体验。

第 4 级,建构级,就是不从 AI 那里获得任何直接的回答,也不是直接的复制粘贴。只要你直接复制粘贴,就不是第四级。第四级是向 AI 询问脚手架,让 AI 帮你搭建支架,帮助你进行构建。

第 5 级,我把它叫做智合,collaboration,也就意味着在这一级你会不断修正和迭代你常用的 RSTCC 提示词框架。当涉及到学术论文翻译时,你可以用这个提示词;涉及到商业邮件写作时,用这个提示词。不同的提示词能立即帮助你提升在该领域的工作水平,降低你的心智消耗,甚至降低情绪消耗。所以第五级是为我们自己和组织打造一系列的 AI 分身。

基于刚才的分享,最后我想给大家带来一个最新的思考,那就是关于提示词的时间和空间复杂度。刚才我们提到的 RSTCC 五级提示词,最初是任务,接着是任务加限制,再到角色加任务,最终到 RSTCC 五级提示词。所以这个五级的提示词框架指的就是空间复杂度,写的内容越长,空间越大。

另一种方式是时间上的复杂度,比如说我每个月都会在上海、广州及很多城市举办免费的 AI 力 workshop,也欢迎大家来参加我的 workshop,那我想写一个邀请的文案。那么我既可以让 AI 直接写 10 个不同的文案,我从中挑选一个。也可以用 5 到 6 个步骤来进行。比如说,这个例子中,首先写出 10 个文案,接着第二步是用某种评分规则让 AI 评分 1 到 10 分,第三步是将 7 分以下的文案修改到 7 分以上,尊重打分者的标准。第四步,选择三个最好的文案。最后一步,将这三个文案整合成一个。

alt

请大家举手告诉我,你觉得前者只用一个提示词写得比较复杂效果好,还是现在这种五步使用五次提示词好,选前者的请举手,选后者的请举手,谢谢。

后者这种方式我认为大概率会好于前者,因为它包含了很多步的推理、迭代、整合、创意,包括更新,所以这种方式就属于时间上复杂。因为你要用 5 次,每次都要花一些时间。

我们把刚才这两个轴放在一起,是不是纵轴就是提示词的空间复杂度,横轴就是提示词的时间复杂度,那么你的提示词是不是既可以是刚才那样子最简单的串行?一个提示词的结尾表示第二个提示词的输入也可以是并行的,甚至也可以是网状的。所以这样的一个提示词结构的工作流就是一个复杂工作流,就是一个串行加并行的复杂工作流。

alt

那这里面我们可以试着把它分成一个 2x2 象限来看,复杂提示词对应的是复杂的时间维度,简单的时间维度对应简单的空间维度。对于简单的时间复杂度,我们可以分成四个象限,如果你只会用简单提示词、简单工作流,这就属于 AIGC 的浅层使用,但是你解锁不了 AI 的专家能力,不能在职场中使用。左上角就是高复杂提示词、简单工作流,就是我们讲到的 AI Literacy,可以帮助我们解锁 AI 的最大能力。右下角就是在现有组织内的工作流中加入一点 AI 的要素,比如说帮我写邮件标题,生成一封带有配图的邮件,或者生成一个页面,这属于典型的 AI Automation。右上角就是最复杂的提示词加最复杂的工作流,这就是 AI Agent。

alt

我们可以看到,在组织中引入大模型,这个图可能是个很有帮助的策略。左下角是入门体验,让大家都可以随时尝试一下使用大模型,用就比不用强,用就会有新的启发。左上角就是在组织内正式有效地引入 AI Literacy 的计划,提升组织当前的 AI Literacy。右下角让我们组织内的工作流加上大模型的翅膀,实现转变和升级。右上角完全是基于大模型的关键能力所建立的原生应用。

alt

传统的工作流是标准函数,大模型为基础的工作流是概率函数。概率函数的意思是标准的输入有可能得到期望输出,但也有小概率得不到期望输出。所以当你理解了这样的机制,你就真正建立了AI 素养,可以使用、评估和开发不同的 AI Agent。

对员工来说,我们既是实践者,也是领导者。对于我们来说,刚才给大家体验的一个现场,使用 AI 大模型并且得到 AI 反馈的机制,就是我们推出的 AI 力在线学习项目的机制。通过这种在线学习和在线练习,立即反馈给大家,提供一个全新的学习体验。但是这里面的工作流简单,提示词非常复杂,所以位于左上角。

alt

右下角我们未来会向大家开放大模型的能力,在 UMU 课程小节中,你可以在 UMU 课程小节直接向大模型写一段提示词,让学习者的练习直接用你的提示词进行评估和反馈,是不是让你的课程变得更加大模型化?右上角就是真正属于 AI 大模型的原生应用,比如说我们最新发展的一问一答模式,FAQ Chatbot。

既然我们已经一起学习和讨论了 AI Literacy 的话题,那我们也来看看使用 AI Chatbot 怎么做好销售的赋能和经理的赋能。UMU Chatbot 专注于常见问题回答 (FAQ) 的场景,创新性地扮演了”客户”的角色,主动向销售人员提问,为销售人员提供沉浸式的对话环境,帮助他们反复练习回答客户的常见问题,不再需要任何脚本,也不需等待很长时间,对话会非常精准,因为我们充分解锁了大模型能力。我们来看一下。

FAQ Chatbot:
“你好,我对你们的 AI 力产品充满了兴趣,特别是它在提升员工对大模型应用知识和提示词工程能力方面的潜力引起了我的关注。我还有一些具体问题想和你们咨询下。”

李东朔:以前我遇到过这样的开场白,比如说,“好,你问。”,当然我知道做销售不能那样说,应该先认可一下对方。“谢谢你对 AI 力产品的关注,那我们 UMU 的 AI 产品确实非常有影响力,也很领先。今天很高兴有机会进行一个面对面的交流。你有什么问题吗?”

当我提交之后,首先大模型会分析我们现在的这个回答。

FAQ Chatbot:“ AI 力产品具体是指什么?能否详细介绍一下它的定义和核心功能?”

李东朔:我们可以看到它的回复非常快,这背后其实有很复杂的技术,大模型既有生成能力,还需要有推理能力,同时还有评估能力,并且要以秒级为单位来响应。他既然问我 AI 力产品指的是什么,那我就介绍一下它的定义和核心功能,之后就立刻会获得他的这个反馈。

“谢谢您对 UMU AI 力产品的关注,AI 力指的是一组能力,也指的是 AI 素养,通过有效地使用大模型,通过批判的和建构式的使用大模型产品,帮助自己解锁大模型的最大能力,从而提升工作的生产力、创造力和工作体验。”

FAQ Chatbot:“感谢您的解释,不过我还想了解得更清晰一些,能否补充一下关于 AI 素养这个概念,以及它如何具体提升个人的生产力、创造力和工作体验的部分内容?”

alt

李东朔:大家可以看出来他对我的回答不完全满意,他追问了。所以我们这个设计的流程是这样的:如果你的回答符合你公司写的 FAQ 文档,他就让你回答下一个问题,如果没有回答全面,他就扮演客户再追问一下,但他追问三次之后就不再追问,以免销售感到枯燥,然后就会问下一个问题。我们由于时间关系,就再往下一步,看一下他之前给出的改进建议。

改进建议中提到了AI 力和 AI 素养的关系,然后也展示了对 AI 的基本理解,强调 AI 力在提升生产力、创造力和工作体验方面的作用,并给出了提升的建议。关键是最后给了你一个基于我刚才说的话的润色,而不是简单枯燥的话术,这对于销售来说非常宜人,也非常实用,并且是建构式的。

通过这种方式,不知不觉中你就练习了 5 到 10 分钟,而且对话是完全开放的,不需要大家限定脚本,让 AI 的体验不像上一代的机器学习或深度语言处理那样固定。

对我来说,AI 可以在三个领域显著改变我们的工作:第一个是自动化,第二个是技能提升,第三个是帮助我们有更好的创意。我们可以将一些重复的工作交给 AI,减少情绪和时间上的消耗,比如翻译,AI 现在翻译得很好,没必要手动翻译,不需要手动逐字翻译文档。

第二个是用 AI 实现技能的 level up,实现 upskill,交付更好的结果,自我效率提升。但我刚才特别提到,这个过程中不要用简单的方式来提升技能,而是要以建构式的方法使用 AI,实现长久的技能提升。

第三点,在提升创造力方面,AI 能为我们带来更多思路和启发,而不是通过加班或无效工作的方式延长工作时长,而是带来真正的外部智力资源,解锁大模型的最大能力。

alt

因此,最后我想和大家分享一个重要的信念,对我和 UMU 来说,我的使命是在全球范围内倡导用 AI 增强人,而不是替代人。每一次技术的更新和迭代都会带来便利,同时也可能对一些技能或体力劳动者造成冲击。

一百年前,几十年前,当公共汽车出现在全世界的马路上的时候,人力三轮车集体抵制,因为对于他们来说意味着大批次失业。在我看来,AI 作为一种技术,应该有一个发展路径,这个路径是先用 AI 增强人,然后再用 AI 做那些自动化的工具,处理那些人不愿意做的事情。

过去没有洗衣机的时候,星期天大家需要花一天的时间来洗衣服。有了洗衣机之后,你可以把节省下来的时间用于做更多的事情。所以我们希望在场的各位能够加入我们的行业,一起用 AI 来解锁它的最大潜力,在组织中帮助每一个人都有机会解锁 AI 的专业能力,提升个人的生产力、创造力和工作体验。我的演讲就到这里,谢谢大家。

alt

上一篇:: 「秋日清华,AI 领航」| UMU 与清华大学联合举办《发展大模型时代的 AI 力》高管研讨会
下一篇:: 用 AI 赋能组织发展 | UMU 全国第 5 期《发展大模型时代的 AI 力》工作坊