电话

15169028800

对话金山办公 CEO 章庆元:依托大模型重写 WPS 的使命

标签: 软件开发需要学什么 2023-05-09 

  一家 SaaS 软件公司,正处在大模型范式革命的前沿,包括它在内的软件公司最终都有被大模型替代的可能。而它抬头一看,自己追赶了数十年的对手微软,正猛然成为大模型时代的最大「赢家」。后者用 100 亿美元投资了 OpenAI,并用大模型技术重塑了软件和云。接下来该怎么办?这就是金山办公要面临的现实。

  作为一家 35 年历史的办公软件公司,金山办公走过个人电脑时代、PC 和移动互联网时代、云和协作时代。其旗下 WPS 是国内最接近微软 Office 的产品,至今仍每个月服务近 6 亿用户设备。而面对刚刚涌现的大模型时代,它的转身依旧迅捷、果断。今年初,金山办公决定彻底调转公司船头,转型 AI,凡是跟 AI 无关的业务都要砍掉。

  它也率先拿到了成果。4 月,它推出「WPS AI」,这是国内协同办公赛道首个类 ChatGPT 式应用。

  我对这家公司的处境与思考非常好奇,作为一家 SaaS 软件公司,它如何看待自己在大模型时代的命运?如何看待自己跟微软三十几年胶着的竞争?以及作为一家资历如此久的公司、它如何在组织上能这么快地完成 AI 转型?不久前,我跟金山办公 CEO 章庆元有了一次访谈。

  章庆元 2000 年加入金山软件,或许正是程序员出身,他更敏锐地意识到了这次技术革命会带来的深远影响、并迫切想抓住它。「当我看到 AI 自己能写程序的时候,我知道这个世界完全变了。」他说。而更重要的是,过去金山办公紧跟每波技术浪潮的基因,才让它有这么久的生命力、这么快的反应动作。

  有趣的是,当行业都在用「军备竞赛」的姿态去做大模型,金山办公却避开了这种「热闹」。它选择跟大模型公司合作,先专注自身业务、做好应用层。

  而关于 SaaS 软件的命运,章庆元说,大模型将彻底颠覆其用户交互,简而言之,软件不再「难用」;关于竞争,他说大模型有望「统御」所有软件公司,大家的出路是更好地理解大模型、提供更好的产品、并为 AI 提供更好的接口;关于组织力,他说在大模型时代,哪家公司能率先改变自己的组织架构和思维方式,谁就能先活下来、甚至胜出。

  金山办公的故事,无论是对 SaaS 软件行业、还是对于想拥抱大模型时代的创业公司来说,都是有启发的。

  35 年过去,技术浪潮更迭、时代斗转星移,金山办公依旧面对着强大的微软、依旧希望跻身下一个热气腾腾的时代。

  张鹏:感觉金山办公这次面对 AI 浪潮响应的速度非常快,这么迅速推出 WPS AI,你们内部的决策过程是怎样的?

  章庆元:金山办公过去几年一直在做 AI,只不过是用传统的小模型在做。我们几年前就定下了五个词的产品战略,「多屏、云、内容、AI 和协作」。不过去年接近年底的时候,我们得出一个结论,AI 的路已经走到尽头了,没啥好搞的。因为技术也就这样子,AI 一点也不「聪明」。

  然后,特别戏剧化的事情发生了。我们刚做完这个总结,GPT3.5 出现了。我们才知道它的能力有多么强大。当一个 AI 自己能写程序的时候,这个世界完全变了,一个新的时代已经到来。我们感觉,这将比金山办公历史上经历的所有技术变革都更猛烈、更有颠覆性。作为软件公司,我们必须积极拥抱,否则一定会被淘汰掉。

  章庆元:首先,它会给用户交互带来革命性、颠覆性的变化。过去,软件行业常说「二八理论」,80% 的人只用了 20% 的功能。因为办公软件很复杂,用户需要努力学习才能使用它。

  但今天,大模型有思维链 CoT(Chain-of-Throught,用于逻辑思考) 的能力、Codex(编程语言预训练模型,可以帮程序员生成代码)的能力。它可以把用户的一句话,直接变成代码的调用、再满足需求。这导致用户交互完全变了。

  章庆元:对,比如当你要分析华南区某一个商品的销售排名情况,你不用再去学习数据透视表,而是直接跟机器说需求,它就会自动帮你调用工具、展示结果。未来,UI(User Interface,用户交互)这个词甚至就没有了。

  我们不再需要研究界面怎么布置、某些点线怎么摆放。我们只需要管好产品的底层功能、并将这些功能的 API(应用程序编程接口)做好,让 AI 能通过 API 调用它们、就能满足用户的各种需求。包括我们公司过去做文档扫描、图像识别,一直都是用传统的 AI 方法来在做,很辛苦。但今天你会发现,这个技术可以用多模态(指文本、图像、视频、音频等不同模态数据融合的技术,是大模型的核心技术之一)重写一遍。

  章庆元:比如未来,我觉得 Photoshop(Adobe 旗下的图像处理软件)理论上可以切入「美图秀秀」这类工具的市场。

  今天,Photoshop 的功能虽然比 C 端那些美图工具强大得多,但它输在用户交互上,很多用户不会用。但到了 AI 时代,当用户交互的成本降为 0,Photoshop 的强大功能就会成为绝对优势,毕竟它能处理比美图秀秀复杂得多得多的场景,这对原有的产业格局当然就有可能产生影响。

  章庆元:对,我们之前就说过,办公软件不是给正常人用的,太难用了。用户应该尽可能少地去学习功能,这是我们一直在做的努力。不过之前的技术不 ready,这次我们终于可以做到了。

  我们马上会上一个(WPS)新版本,第一件事就是在用户界面上尽量地做减法。过去的按钮实在是太多、太复杂了,我们要把它简化简化再简化。人要被完全地解放出来了。这些新的范式很令人兴奋,我打个比方,今天有点像十年前移动互联网刚开始的时候,大家都在做汤姆猫这种简单应用的时代。

  但其实,它(这波 AI 浪潮)对软件行业的改变,不仅是文字内容的生成和改写、或者加个 Copilot(个人助理)这么简单。未来,它会颠覆软件行业的方方面面。在这个前提下,我们自己也是越想越兴奋,过去做的很多事情都太无聊了。

  张鹏:刚才说到用户交互的变化,我好奇这会在文档这个产品上有什么表现?过去我们写文章总是开一个空白的文档,但往往脑子也是一片空白,就盯着那一个光标开始写,其实挺痛苦的。

  章庆元:我也是这样。我们总感觉办公很痛苦、不是什么愉快的事,都想早点把办公软件关掉。相当于每个人我给你一张白纸,纸很好、笔很好,但是不是每个人都写得出好字、写得出好文章。

  张鹏:所以未来用户创作文档的方式有没有发生变化?比如通过更智能的模板,甚至上来就给我一个写作引导,一步步帮我展开思路,而不是在一片白纸上创作?

  章庆元:这个我们已经在做了,比如我们有稻壳这款产品。因为天下文章,很多格式都固定的。用户应该关注表达自己的内容,而不用去想着格式怎么弄、或者从一片空白开始写。

  但之前那种模板是「死」的,你总觉得那些东西差点意思。我们现在发布的这玩意(WPS AI),它生成的模版是「活」的。比如你要写 OKR,它会自动帮你生成一个,你一看还是稍微能用。

  章庆元:换句话说,在我们感到陌生的领域,AI 至少能够成为「比较合格的乡村启蒙老师」。它什么都略懂、又什么都不精,但它至少能给你提供一些最基本的框架、思路。你可以在这个基础上做修改和提升。

  章庆元:我认为这些 AI 生成的东西,只能帮助初级水平的人。但如果一个人天天完全使用 AI 生成的内容,他一定会被淘汰。每一篇真正的文档,应该有一个独特的思想在里面,想法要足够有价值。

  但写这种高价值文档的难点是,你不知道要写什么东西、脑子里还没有涌现出创意和思想。这个核心就是要解决灵感素材的问题。以我自己为例,每年在金山董事会上的报告基本都是我自己写的。写之前,我会花一晚上时间去看各种数据,可以试想以后让 AI 更快速准确地调出相关数据,当我看完这些数据可能就有灵感了,后面就好写了。

  章庆元:对,我们的使命就叫「简单创作、轻松表达、实现价值的连接」,还有一句口号是「绽放智慧的力量」。核心就是希望帮助用户把自己的思想表达出来。

  章庆元:这才是真正的知识库,以前的知识库都是假的。以前我本来想做知识库,最后没做。因为当时我问产品经理这个东西有什么用?他说就是云文档加个目录,没啥区别,还是靠关键词搜索。

  但今天,大模型靠的是向量搜索。比如你输入「手机」,它不是把「手机」相关的关键词展示给你,而是可以回答你关于「手机」的问题。只有你能问文档问题、它能反馈结果,这才是真正有价值的知识库。

  章庆元:这的确是非常有想象空间的事情。本身企业的数据分两种,一种是结构化数据,一种是非结构化数据。结构化数据是已经被处理过的数据,主要在财务系统、业务系统里面。而非结构化数据主要在文档里,过去它很难被理解,所以可能需要找人帮我梳理。但现在,我直接找 AI 就可以。

  张鹏:你觉得文档是一个独立的东西,还是必然要融入到整个企业管理的工作流里?文档会不会往工作流走?

  章庆元:其实,企业文档这么多年来一直是企业内部工作流的一部分。传统的 OA(Office Automation,协同办公系统)也一直支持 WPS 做内部流转的产品,但我们没做 OA,未来也不会做。因为这里面有很多 Know how(认知积累),我觉得我们做不了这个事情。包括微软这么多年跟我们的想法也是一样的。

  张鹏:所有人都知道「AI 个人助理」是大模型时代「皇冠上的明珠」,但没有人知道这个助理会在哪里出现。但今天来看,如果文档可以涌现出思想,那它有可能会涌现出真正的「AI 个人助理」吗?

  章庆元:今天我是一家公司的 CEO,我可以聚焦在我自己想表达的观点上,很多执行的活儿有团队配合。比如财务团队帮我提供数据(灵感)、文案团队帮我写作、UI 团队帮我美化。但未来,普通用户可能只用花一点钱,也能拥有一个同样强大的团队。

  设想一下未来,你有一个 AI 助理,它既可以帮你调数据、给你创作灵感,甚至还可以帮你写作——因为他看过你所有的文章,知道你的写作风格是什么。可能你语音跟他说下要表达的观点,它就能帮你组织文字、输出属于你的文章。最后他也能帮你美化 PPT。关键是他 24 小时待命,可靠又安全。这种体验完全是颠覆性的。

  章庆元:我认为文档是不会消失的,因为它是人类思想和创意的载体。除非人类的思想和创意没有价值了,所有东西都是机器创造,文档才会消失。但那时候人类可能已经灭亡了。

  章庆元:因为你的思想和创意最终是给人看的,所以它必须是人类能理解的形式,是文字而不是向量。除非你是向机器汇报,那一天人类就麻烦了。

  但是还有一种情况,文档将会消失,就是大家都接了脑机接口。那时候人类就不用看文档了,思想和创意直接变成了向量的传输。那一天可能就是真正的 MATRIX(源自电影《黑客帝国》,指的是一个控制了现实世界的计算机人工智能系统),人类也不用努力工作了,给你一个虚拟房子,你的大脑就能获得快感。

  章庆元:所谓用户交互革命,就是用户不用去学习各种复杂的功能了、用户的数据含义都能被理解了。只有这两个都做到了,它才是真正的 Copilot。

  章庆元:我觉得微软这波太牛了。它跟 OpenAI 的这个交易(注:微软向 OpenAI 投资了 100 亿美元),应该是这两个世纪里面最成功的商业交易,没有之一。它 100 亿美元过去了以后,OpenAI 不仅给它提供额外的服务,然后又返到了 Azure(微软的云服务)上来。这个生意太好了。

  未来没有 AI 能力的云就卖不动了,只卖 CDN(内容分发网络)、卖带宽,这个是没有价值的云。而目前,只有微软的云嫁接了 OpenAI 的能力。可以说,微软加 OpenAI,是未来商业世界的新一代「灯塔」。

  章庆元:软件短期内还存在的,长期内就另当别论了。特别是 ChatGPT 有了 Plugin(插件)能力之后,就好比它不擅长算数学题,但它会用 Plugin 去调计算器来算。说白了,我们未来软件公司干的就是计算器的活。我们最终的价值,可能就是给大模型提供 action(解决方案)。比如说外卖公司,它最有价值的部分可能是给 AI 提供派送能力。

  未来我们这些公司可能会变成一个个节点。比如开一个商业发布会,它可能先调 WPS 生成一个文档,然后把文档发给酒店,接着自己预定好酒店……大模型变成了真正的 MATRIX,把所有软件公司都连接了起来。

  章庆元:我猜,它的 Copilot 也不会完全用 OpenAI,因为成本太高了,它应该也扛不住。在中国的话,它的 Copilot 能力的后端可能需要在国内落地才可行。

  章庆元:总的来说每家的思路都不一样。比如企业微信卖的是微信的价值、飞书卖的是字节的管理、钉钉卖的是一个巨大无比的 SaaS 平台,而金山办公一直卖的是解决方案。我们会帮客户做一个属于它自己的「飞书」,这对它来说信息是可控的。

  我们一直是服务思维,你想要什么,我帮你。哪天你不想用金山办公,你的数据直接 control+A、control+C、control+V 就可以弄走了。大家的客户群重叠度也没有那么高。钉钉可能卖给中小企业多一点,飞书卖给大型的民企多一点,我们主要卖给央国企、政府。

  章庆元:这是有可能的。因为原来 SaaS 公司之所以这么多,就是因为客户需求的多样性,需要定制化开发来满足。举个例子,WPS 以前有个功能「删除文字空白段」,但这种功能不用再开发了,ChatGPT 可以解决。所以当大模型能解决原来 SaaS 定制化的问题,SaaS 公司就会慢慢变得同质化。

  章庆元:我觉得它们的竞争力主要还是,它们对大模型的理解,它们的产品底层是否健壮、性能是否足够好,它们的 API 是否足够开放、是否能为大模型做一些优化。我觉得最主要是去理解用户的需求,把工作流设计出来,AI 是不会去做这件事情的。

  以 BI(商业智能)系统为例,再过一年这些 SaaS 公司主打的卖点应该就是,谁家的 AI 能力最强。比如当用户讲出需求之后,它可以帮用户分析各种数据,直接给出答案。这才是真正的 BI,没有 AI 的都是假 BI。

  我比较幸运的是,因为这么多年的竞争对手一直是微软,所以我们一直在跟微软看齐。微软做所有的产品都是先做 API、再做 UI,所以它的 API 非常强大。WPS 之前提出的对微软的「三大兼容」,除了 UI 兼容、文件格式兼容,更重要的就是 API 兼容。我们的 API 接口跟微软一模一样,非常强大。这也变成我们的重要优势。最近,我也把稳定金山办公的 API 架构定为公司的核心战略。因为只有 API 的架构稳定了,我们合作公司的大模型才能够调用它、用来满足用户的具体需求。

  章庆元:包括这次发年报,我出去路演讲了 38 场,大家都在问我关于 AI 的问题。核心是两点。一是金山怎么跟微软竞争,二是怎么看国内在线文档在 AI 加持后的竞争格局。我的回答是,我们的竞争实力很强,因为我们的 API 能力和云都已经很成熟了。

  张鹏:某种程度上有一个超级强大的对手对你们来说也是一种好事,亦敌亦友亦师。

  章庆元:我是 2000 年来金山的,那时候微软也正是巅峰期。当时我们金山整个模式全部是学微软的,看《微软的秘密》那些书、也挖了很多微软的人,从微软身上学到了很多。只是后来在互联网时代,我们显得稍微落后一点,产品看着也不那么性感。但今天这个 AI 时代,可能又让我们有了新的机会,继续跟微软看齐、产品也可以变得性感起来。

  章庆元:大概是春节后。金山文档是我们整个公司的「先遣队」,我把很多团队的人都分配到那里去学习。我们测了国内外所有的大模型,包括第一批拿到了谷歌大模型的内测。我们看着这些大模型的能力,细思极恐、越想越可怕,太强大了。所以赶紧投入了研发。

  章庆元:第一,在线文档做起来快、更新也快,相对传统的 Office 更简单,所以我们先拿出来做。第二,我们那支团队是的 AI 忠实的「信徒」,他们一伙人扎进去,越扎越深。他们会不停地告诉我,我们可以这样做,可以那样做。

  章庆元:今天我自己做大模型纯粹浪费时间。因为未来在中国,BATB(百度、阿里、腾讯、字节)这四个通用的大模型一定是最好的。而且现在去做也会限制我自身核心业务的发展。

  我的核心竞争力还在 Office 本身。所以我一定要跟进最好的大模型,谁好我就用谁。我就做大模型的应用者。

  章庆元:现在只有两种大模型,一个叫 ChatGPT,一个叫其他。因为大模型最重要的是 COT 的能力、Codex 能力,除了 ChatGPT 之外,其他家这块的表现差距比较大。我对中国的大模型有信心,因为我们对新技术的开放程度其实是更高的。

  张鹏:今天的创业者有两种思路,一种像你一样就做大模型的应用,另一种是也必须要干大模型,不想把命握在巨头的手里。从你的角度,你很快就明确了是前者。

  章庆元:首先,我是要做大模型的应用。但其次,我未来也一定要解决大模型自主可控的问题。因为如果想用单一的大模型解决所有问题,成本会很高。而且我们有自己的定制化需求,所以我们必须得有自己的优化模型。

  但今天,我自己做的成本会非常高,还不如别人帮我们做。所以我们就找国内大模型创业公司这样的合作伙伴,满足我们定制化的需求。

  章庆元:对,现在成本太贵了。用户的一句 prompt(提示词),看起来就 10 个 token(字节),但为了让大模型回答更准确,我们还要加一大堆的 prompt 进去,就变成了 100 个 token。一个月得多少钱?现在根本不想算。但我相信很快,这个成本一定会降下来。

  章庆元:我们 AI 团队现在主要在干两件事情。第一,积极学习各大模型。第二,自己做个「分诊台」小模型,比如根据用户的场景、需求,给它匹配最适合的大模型,从而实现分流。这个还算简单,基本上有七八十亿参数、刚刚开始「涌现」的模型就够了。

  他们的使命就是,提供外面封装好的模型、提供基础设施,让公司其他团队基于 API 的开发变得更容易。

  章庆元:一开始是我逼着其他的团队转(AI),OKR 全部都要改。在内部来说,新版的所有的产品就是 AI Native(AI 驱动),如果不是 AI Native 的产品,应该一年内我准备都把它关了,没什么价值,不投入了。

  后来发现其实团队对于这次大模型的出现都是异常兴奋的,整个产研团队很久没有这么兴奋,都带着极高热情自我驱动地学习和投入。

  章庆元:我们 OKR 原本是去年底定的,但今年一季度全部改了。核心就是怎么把 AI 应用到各个团队的业务里。我们最近成立了一个产品小组,以后内部做什么产品都要先审核,不要再做一些传统的(产品)了,那就是浪费钱。多想想 AI 怎么做。

  张鹏:创始人或者 CEO往往方向感很强,但传导到整个公司需要时间、过程也很痛苦。这可能是未来整个 AI 时代创业公司最大的挑战。

  章庆元:在 AI Native 时代,谁率先改变了公司的架构和公司思维的方式,谁就能活下来、谁就能胜出。

  我自己是程序员出身的。我很多年前就认为,如果有一天程序自己会写程序,那我们这些程序员都完蛋了。结果今天真的发生了,这件事对我的冲击非常大。我觉得都不用看它(AI)的其他能力,光这点,就能改变世界了。

  章庆元:比如我们的程序员应届生,在进项目组之前,都有半年脱产训练和相关考试。现在,我们出的每道题都会用 ChatGPT 写一遍答案,那就是条及格线。包括现有的程序员,也要学会用 ChatGPT 来辅助写代码。

  对于程序员来说,他们要重新考虑自己的技术栈。首先是去理解和学习 AI,其次要想着怎么运用它。这是最重要的。

  章庆元:一方面是海外版,就是要积极跟进全球最先进的技术,对手有的东西我都要有,什么 Copilot、ChatPDF、ChatDOC、ChatExcel 全做一遍。另一方面国内版,可能要慢一些,要等国内合作伙伴的大模型上线。我相信在做的过程中,肯定会积累出一些经验,然后更多的思考、想法就会涌现出来。

  我们碰到什么浪潮都是先干了再说。因为金山办公曾经在这方面吃过亏,从 DOS 操作系统到 Windows 操作系统就反应慢了,公司差点挂了。所以后来移动互联网起来的时候,我们也没想明白,就先干了再说。到后来云、协作、AI 那一波浪潮,我们也干了。以前那些年,有时候在新产品发布会上,我自己有时会有种「为创新而创新」的感觉。但这次 AI 浪潮,我觉得我们是真的在创新。其实 AI 的很多能力我们还没有完全释放出来,我自己都觉得未来会是蛮让人期待的。

  为什么备孕前的女性一定要做一次全面的口腔检查?来听听北大口腔医学博士南哲是如何说的。