AI Agent:营销大模型落地营销场景的关键桥梁
2023-09-22
AI Agent是目前技术圈当之无愧的“话题王”。OpenAI 的联合创始人Andrej Karpathy 曾表示,OpenAI 内部目前更关注 Agent 领域的变化,每当有新的 AI Agents 论文出来的时候,内部都会很兴奋并且认真地讨论。
这股从硅谷吹出的技术风,将大模型的叙事带入了新的阶段,“超级助手”时代或将到来。社会各界对于AI agent的讨论也愈加热烈,也提出了诸多疑惑:AI Agent的风口为什么紧随大模型之后?它和大模型如何互相作用?企业如何使用好AI agent并赋能于业务?
为了探寻AI Agent的价值点,明略科技集团CTO郝杰邀请多位资深媒体伙伴,从大模型发展历程、明略营销AI Agent效果解读、营销数据赋能品牌的增长路径这三大方向入手,拆解AI Agent和大模型的底层逻辑,探寻AI agent如何提升企业和个人生产力。
本篇内容聚焦AI技术背景和大模型的发展历程,探究明略科技营销AI Agent的主要特征。
人工智能可以提高人类的学习效率,让我们能够更有效地获取知识。比如,当你与一个装有大模型的电脑进行交流时,你可以通过与它的对话来学习很多知识。你可以通过问问题、回答问题与它进行互动,从它的大模型中复制并获取知识。例如,通过与GPT-4的互动,你可以在法律方面获得像法学硕士甚至博士那样的知识,或者通过与GPT的互动,你可以成为数学专业的专家。实际上,你已经与一个智慧非凡的人坐在一起,就像与爱因斯坦坐在一起一样。
以前有很多人认为GPT-4使人类成为了不同领域的专家。虽然我们可能不了解某个领域,假如我学市场营销,或者我学法律,我可以通过问答、举例子来理解GPT-4所说的内容。它使人类获取知识的难度显著降低了。我们可以问它任何问题,尽管它的回答可能不完全准确,有时可能是幻想的。它并不是直接激活我们的脑细胞或提高我们的智商,而是通过方便地提供信息和知识的反馈来帮助我们。我们可以比以前更快地获取信息。无论我们问什么,它都会回答,这提高了我们获取信息的效率,也提高了我们头脑思考的效率,我们的思维变得更加灵活。
在前年和去年这个阶段,技术处在AI 1.0的末期,主要特征是已经有了预训练的模型。从技术角度来看,AI 1.0的末期可以追溯到2017年Transformer模型的发明,并进一步升级到了BERT、GPT等模型。我个人将这个阶段称为模型预训练时代。现在,特别是从去年11月底ChatGPT问世以来,我们正式步入了AI 2.0时代,也就是大模型时代。首先想要先跟各位介绍一下明略科技为什么把赛道锚定在了营销领域。
从背景来说。2006年,明略科技科技旗下子品牌秒针系统成立,为广告主提供准确的互联网用户行为数据,发展至今,秒针所监测的范围几乎深度覆盖市面上所有主流媒体和广告形式,成为国内第一家申请MRC认证并唯一通过移动应用内曝光监测审计的第三方监测机构。2019年,明略科技成为国家“营销智能”领域新一代人工智能开放创新平台。
从大环境来说。在营销领域,每个人对于营销都有不同的理解,营销是一个非常广泛的领域,不仅包括市场营销,还包括销售、售前售后服务、客户成功以及客服、用户增长的CDP和DMP等等,体系非常多面且复杂,且直接面对消费者。另一方面,自从GPT问世以来,它对各行各业都产生了影响,但我个人认为营销行业是最受影响的。例如,在美国,已经有自动生成营销文章的工具如Jasper、Copy.ai,甚至以前专注于消费者市场的产品,如Notion,现在也投入到了面向企业的营销文章生成领域,与更多竞品竞争。
我们把话题聚焦回AI Agent。大模型的出现几乎可以颠覆所有行业,但是它也有一定的问题所在,不能一步到位,自动化地完成任务,需要大量人类参与干预review,所以AI Agent非常关键,没有它我们就无法扩展大模型的应用边界,人工智能如果仅止于现在看到的内容生成等几项应用,就还是单薄的。能不能把价值传递到更多的场景,核心就看AI Agent,所以我们说AI Agent是大模型与场景间价值传递的桥梁。
我将去年11月30日视为AI 1.0和2.0之间的分界线。在AI 1.0时代,我们已经做了很多工作。明略科技会话智能业务线就是成长于1.0时代。我们会话智能的底层技术是NLP技术,它是一款业务增长引擎,以SaaS交付方式帮助企业营销、销售部门实现销售过程数字化和销售业绩归因分析。可以说在AI 1.0时代的末期,明略科技的AI模型参数规模已经非常大了,大约在亿级别。当时,我们使用的模型更多是基于BERT的路线,包括BERT和一些变种,如Albert等模型。我们曾经使用Albert模型赢得了一些重要比赛的冠军,这意味着在这个不太大的非生成式大模型上,我们有过成功的经验。但成功之下也有教训,就是人力投入的比例很高,因为非生成式的AI需要人工标注来做监督训练。
现在我们正在进行大模型的开发,并且我们已经转向使用生成式大模型,采用了GPT模型。我们从0开始进行了明略科技营销行业的大模型预训练,这一点非常重要。从0开始意味着我们不是在微调已有模型,尽管我们有能力进行微调和对齐。我们已经找到了一条自己预训练的道路。
在第一阶段的预训练过程中,我们没有直接使用第三方开源大模型已经训练好的模型,而是精心准备了第一个token。我们的参数在看到第一个token之前,是一个随机数,从看到我们精心准备的第一篇文章、第一个token开始,它才开始进行调整,经过几个月的调整达到现在的状态:一个有70亿参数的明略营销行业大模型,它具备了思维链COT能力,能够按照要求分步达成任务,相比没有思维链的情况下,它所给出的答案质量更高,覆盖美妆、汽车、3C、大健康和食品饮料行业这五大重点行业,具备进行文本生成、文本扩写和问答等能力。
现在,我们正在进行二次预训练的工作。这次预训练是在巨人的肩膀上开始,利用成熟的开源模型,如LLAMA2、百川2和BLOOM等。以LLAMA2为例,它已经阅读了成千上万本书籍,看过上万亿个token,在它们的基础上,我们将混合通用语料和营销相关的数据,让模型看到一些它之前没有机会看到的文章、书籍,以及我们在社交媒体平台上清洗的高质量帖子,还有我们交付给客户的优质报告、PPT等文档,以及营销领域的大师级著作。这个过程实际上也省去了上千万美元的训练成本,且是可商用的。所以我们用开源模型作为二次预训练的参数初始化,我们的二次预训练模型将至少具备百亿参数。
毫无疑问,AI Agent的落地需要优质的基础模型,其能力会直接关系到AI Agent的质量,此外,应用和体验层面也将影响能效。在这个全新的领域,数据的价值进一步提升,也对服务商提出了更高的要求:丰富便捷的功能、与商业用户对接的强度、更多的商业选择等等。
信息填写