第四范式发布“式说”大模型以生成式AI重构企业软件（AIGS）

标签：局域网的理解 2023-06-14　次

　　4月26日，第四范式宣布推出其GPT大模型产品“式说3.0”，并首次提出AIGS战略（AI-Generated Software），即生成式 AI 重构企业软件。“式说”将定位为基于多模态大模型的新型开发平台，提升企业软件的体验和开发效率，实现AIGS。

　　“C端产品已经逼近用户体验的上限，而B端的企业级软件往往是个十分复杂的执行系统，堆砌十几层菜单和成千上万功能也不算多。” 第四范式创始人兼CEO戴文渊表示，“目前这些B端软件极为复杂的交互体验，以及复杂性带来的极低开发效率，恰恰为生成式AI留下足够大的重构和改造空间。”

　　戴文渊介绍称，“过去很难通过人类语言（自然语言）的方式去调用企业软件的功能，现在当我们有更强的语义理解和生成能力，再加上GPT任务翻译、任务分发和推理的能力，就可以通过更好的‘对话框式’交互方式实现功能的调用，不再需要找到某个位于十几级的菜单目录之下的功能。”

　　据悉，“式说3.0”能够处理视频、图像、语音、文本等形式的查询及任务，把这些信息转化成用户软件能读得懂的指令，软件输出响应后，能将结果展示出来。

　　为了表达“式说3.0”不是线上调用ChatGPT，戴文渊在现场让团队切断公网、访问内网集群。随后，他展示了“式说3.0”大模型的图片理解、多轮对话、写小说、迅速画图等能力，以及通过推理能力完成更加复杂的“装箱”操作、现场编写代码的能力。比如问“五一要去硅谷旅游，有什么推荐的地方”会反馈谷歌、斯坦福大学等景点信息。

　　在戴文渊看来，要做到AIGS，大模型未必需要是知识广博、十项全能冠军的通才，更重要的在于模型具备Copilot（副驾舱），和思维链CoT（chain of thoughts，多步推理）的能力。

　　在现场，第四范式同时透露了“式说”的迭代过程——“式说1.0”为在ChatGPT爆红之后推出的第一代产品，有生成语言的能力，并且解决GPT技术应用时内容可信、数据安全和成本的三大问题；“式说2.0”则在语言能力基础上，加入了文本、语音、图像、表格、视频等多模态输入及输出能力，并增加了企业级Copilot能力。以与企业内部应用库、企业私有数据等进行联网，对信息和数据进行分析，回答员工的问询或执行相关任务，从知识助手成为业务助手；“式说3.0”则在生成式和语言能力的基础之上，发力Copilot和思维链COT（多步推理、复杂任务拆分、形成数据飞轮），改造传统B端企

　　“要去改造企业软件，大模型不能只有语言能力。式说2.0就加入了多模态和Copilot，因为很多企业软件里的数据是多模态的，而Copilot能把人的指令翻译成要调用后台的哪个API。”此前发布的式说2.0的Demo中，门店员工通过语音、文本等交互方式向式说发起指令，式说理解后，联网门店监控软件调出后厨未戴口罩的图片，并直接将图片以对话框的形式输出给员工。

　　大模型去调用软件内置的一个个功能、数据来“对话框式”完成任务，已经能产生巨大价值。但员工用企业软件时也会面临复杂任务，需要人按照顺序执行一个个功能。

　　因此，式说3.0强调的是Copilot加上思维链CoT，具有更强的推理能力，在学习大量数据和“攻略”后，能形成中间的逻辑推理步骤，从而做到拆分并执行复杂工作。

　　公开资料显示，第四范式成立于2014年，主要为企业端服务，聚焦于决策型 AI 领域，提供以平台为中心的 AI 解决方案，目前该公司解决方案已应用于金融、零售、制造、能源电力、电信及医疗等行业。最新招股书显示，2022年，第四范式营收达30.83亿元，同比增长52.7%。

　　“在BERT出来的时候，范式研究院就开始关注并投入在这个技术领域，GPT3出来以后更加明确了要朝这个方向。不过相比今年的投入，过去几年肯定还是有差距的。ChatGPT对我们最大的帮助，就是整个市场的信心一下从0调满了，确定性的投入更大了，再往后就是变成产品、变成商业化的路线往市场去推。”戴文渊透露称。

　　在与国内大模型“同行”的对比上，第四范式认为，中国会有更多的大模型。大模型是新的生产力，大家都得有大模型作为底座，所以入局的门槛确实是变高了。但是在达到这个门槛之后，重点在于如何选择方向。

　　第四范式认为比较大的机会在于改造整个的企业软件行业，也就是AIGS这个方向。发力的大模型技术方向是Copilot可控（执行可控、知错能改），和思维链COT（chain of thoughts，多步推理、复杂任务拆分）的能力，形成数据飞轮（比如将某垂直领域的数据和流程投入大模型，很快可以形成模型在该领域的思维链）。

　　第四范式将AIGS的路径总结为三个阶段：第一阶段，Copilot调动不同的信息、数据、应用，作为助手完成用户的指令。相当于在所有企业级软件系统里，配备一个指挥官。指挥官听用户的指挥，比如“把照片亮度调亮20%”。

　　第二阶段，Copilot+基于企业规则的“知识库”，AI能够参照规则做复杂工作，进一步丰富了“对话框”的能力。比如AI查询了“人像美化”知识库后，能执行把照片修好看的步骤。

　　第三阶段，Copilot+CoT（思维链）。软件系统的使用行为最终会被大模型学会，形成AI针对这个领域的思维链，意味着“把照片处理得更好看”这种复杂指令，AI能自动地按照步骤完成。

　　第四范式的AIGS战略，就是指基于式说大模型背后的Copilot+COT能力，把企业软件改造成新型的交互范式，并在新型交互上不断地学习软件的使用过程，形成领域软件的“思维链”。

　　在式说3.0发布现场，来自航空制造、金融、医疗等行业的客户代表出席并做产品的live demo演示。在我国航空制造代表企业的实际场景演示中，其与第四范式基于Copilot技术，联手改造了某工业设计软件。现场某医疗行业的实际场景演示中，式说的“思维链”能够清晰指出将药品销售出去的具体步骤。

　　第四范式方面表示，最终，由于新的交互形式的出现，企业软件的开发效率变得更高。以前是功能和执行逻辑被编排在软件界面，每次一个功能升级，都要周而复始的经历原型图、设计、开发等，至少是月级别的开发时间。而现在由于“对话框式”的界面是固定的，功能和逻辑被改写在数据、API和内容层面，变成了天级别的开发效率。

　　值得一提的是，据第四范式透露，在短短两个月内，众多企业与合作伙伴已经与第四范式在生成式AI方面开展了深度合作。

　　4月26日，第四范式宣布推出其GPT大模型产品“式说3.0”，并首次提出AIGS战略（AI-Generated Software），即生成式 AI 重构企业软件。

局域网的理解