大模型迎来爆发期,应用落地之路该怎么走?
2023-05-09
随着以ChatGPT为首的应用工具一夜爆火,人工智能似乎找到了应用层面的合适出口,让大众、用户和产业,看到了大模型人工智能所具备的应用潜力。
大模型能为企业和开发者带来什么?
企业如何借力和追赶大模型创造出实际价值?ChatGPT 所卷起的 AI 大模型热潮将如何影响开发者和企业?
ChatGPT 背后的伦理挑战和风险问题又该如何应对?
……
在InfoQ《极客有约》直播间,明略科技集团CTO郝杰针对以上问题表达了自己的观点和洞察。
以ChatGPT为代表的大模型,是一种不太显式的,区别于知识库和知识图谱一样的新型知识表示方式,它是一个巨大的隐式知识库,包含了地球上的各种知识,类似一个包罗万象的百科全书,用户可以使用这个模型,通过平台并与它交互,以聊天、对话或多轮问答形式展开。
在面对大型模型和通用人工智能的冲击时,行业之间的差异应该是相对平等的。在科学领域中,大型模型原生应用的场景也包括各种科学领域,例如超导材料、生命科学、医学和生物医疗等领域,这些领域很可能是大型模型大显身手的场景。很多公司都在做着很了不起的事情,要将地球上所有的知识都装入一个模型中,要将其效果惠及全人类。未来,它的发展方向应该是惠及所有行业,让设计师、厨师和化妆师等从业人员更强大,更轻松地修炼到大师级别。
而针对打造国内的中文大模型,有以下几种路径。第一种是依靠大型企业或国内顶尖大学,他们拥有强大的算力和资源,可以在他们的肩膀上训练行业大模型。第二种是垂直领域的AI独角兽企业,例如明略科技,从垂直领域入手去打造专属的行业大模型。第三条路径是通过突破工程难题,利用摩尔定律来降低大型模型的训练成本。虽然这是一个挑战,但是已经有一些公司正在致力于解决这个问题,相信随着时间的推移,训练成本会逐渐降低。
ChatGPT在四个方面具有强大的通用性:产品方面,它是个chatbot、是个聊天方式的人机交互,几乎所有人类都可与其交互,用户使用它没有任何门槛,是一款很通用的ToC产品;模型方面,它是个通用的大模型,包含了地球上所有的知识,几乎无所不知,所以具备知识领域的通用性;任务方面,它具有很强的泛化性,具备跨任务的通用性;还有与人类对齐方面的通用性,通过RLHF算法可以对齐到人类的各种价值观、伦理、偏好等,而不是仅仅对齐到少数算法工程师设定的准则。这四大通用性,以往的AI是不具备的,这是ChatGPT的价值所在,它是开创性的,所以一出世就吸引了这么多的关注,因为它方方面面的通用性太强大了。
在选择和评估方面,我提一个“四大一小”的评估标准。“四大”指的就是上面说的四个方面的通用性,它的通用性是否足够大。“一小”是指运用辩证法,追求参数少的模型。如果在“四大”的维度上,大模型的表现都差不多、展现出相似的召准率、精准度等等,反而可以选择参数较小的模型,因为这意味着部署成本更低,维护和迭代也更容易。在学术界中,将其称之为“参数效率”。参数效率是评价大型语言模型的一个重要原则。清华大学孙茂松老师团队刚发表的重要论文的标题里就有这个参数效率、Parameter efficient。参数效率,类似汽车发动机的单位升功率,不是排量越大越好,那意味着太费油,或者费电费卡费数据。
在大模型涌现后,企业希望使用这类工具来提升自身效率和服务质量,但同时也表达了一些担忧。例如,输出质量是否稳定,在自身垂直领域中引入这样的技术后,可能会导致出现偏激或误导性质的内容,面对这样的情况要如何处理?此外,因为目前有些大模型尚不能私有化部署,企业自己的知识上传到大模型平台上,是否会降低他们原有的门槛?
这正是在AI应用技术落地的冲击下,明略科技能够帮助客户提升竞争力的地方。明略科技作为客户和大模型之间的桥梁,既要确保这条道路安全可靠,又要符合客户的实际需求。借鉴通用大模型训练的优秀算法,以17年来沉淀的大量行业数据为基础,从客户实际需求出发,定制垂直领域大模型,满足多样化的任务和场景需求。
通用大模型的出现,固然让企业无差别地享受到了便利,但是便利之下的真实需求是如何用好大模型,真正能够“杀出重围”的则是企业和行业自身的数据,每个企业都有自己特色的知识沉淀,可能是一个数据库、一个标签库或一个知识图谱,而在行业端,明略科技凭借17年来的行业探索累积了大量的知识图谱丰富经验,特别是在消费类行业,如美妆、3C、汽车、大健康等领域,知识图谱的知识表达形式更加高级,具有实体和连接,并且可以进行逻辑推理。图谱中的实体和关系决定了基于图谱生成的文章或图片的真实性、专业性和逻辑性。明略科技可以帮助客户将私有知识与大模型进行互搏,类似微软的普罗米修斯架构,从而使客户的数据飞轮更好地运转。对于营销类短文的生成,明略科技离不开知识图谱,它能够保证文章的真实性、可解释性、专业性。在生成之后也会使用大模型进行润色,以满足客户的多重需求,包括风格修改和客户特殊要求等。这种方法不仅兼顾了多个维度的需求,让客户放心使用。
与其说ChatGPT正带动新一轮人工智能的爆发,更应该说是自然语言大模型方面带来了量变到质变的转化。明略科技作为深耕数据智能17年的企业,充分挖掘数据价值,为不同的领域制作行业大模型,并不断更新和维护领域知识库从而提供更精准、智能的技术和服务,能以明显更高的精度完成自然语言处理的任务。
在当前生态环境下,完全依靠神经网络、深度学习解决所有问题是很困难的。例如,由于敏感信息是动态变化的,每天都会有新的敏感词出现,因此可以将这个模块集成到搜索引擎或者客户的数据平台中,采用规则和词表进行处理,而不必依赖于完全连接主义的大型模型。问题可能是多边形的,需要因地制宜地选择解决方案。
关于大语言模型和垂直领域模型的结合,有多种方法进行耦合或配合。其中一种方法是利用两个核心算法(指令微调和RLHF)进行有监督的微调,但可能需要更多数据。另一种方法是将客户的知识库嵌入到大模型中,因为大模型可以处理各种不同类型的知识,只要它们被嵌入到相同的连续向量空间中。我们还可以嵌入多模态、跨领域和跨语言的知识,只要它们被约定嵌入到相同的语义空间中即可。
国内的许多行业都要求把大型模型、营销、销售和服务系统等都进行私有化部署,这是由于它们行业自身的特性所决定的。但大模型资源消耗量大,会导致这种项目利润率非常低,因此对于这类客户,明略科技提供的策略是一个灵活的、自适应的模型训练服务,以帮助他们充分利用自身积累的数据,训练适合他们的模型。
除了将大型模型应用于传统的业务产品之外,也会出现一些基于大型模型的 native 应用产品和服务。目前,我们已经看到了像AIGC以Midjourney为代表的一类图像生成应用产品的兴起,未来还将出现一些视觉视频生成的应用产品。ChatGPT的出现也带动了许多文本生成公司的涌现,这些公司可能以前根本不存在,而现在它们的业务完全围绕着大型模型展开。这些公司的共同特点是它们能够生成内容,这可能包括生成、创意甚至心理咨询等方面的内容。
以ChatGPT为首的大模型工具让人类对于通用人工智能重燃信心,但在不同领域的应用落地之路仍需探索。明略科技将发挥自身优势,让客户的行业知识和数据与大模型互相助力,真正利用好大模型,提升营销智能和营运智能Copilot产品的效果。
信息填写