电话

15169028800

科大讯飞详解认知大模型建设:围绕自主可控展开 避免在发展中被卡脖子

标签: 技术开发是什么 2023-04-23 

  平台的诸多项目,与华为、寒武纪、曙光等企业建立深度合作的同时,在踏踏实实地建设自己的算力。目前公司的训练、推理在国产平台上的方案已跑通成型;未来讯飞在认知大模型相关的算力上,会继续围绕自主可控

  4月20日,科大讯飞披露一季报,一季度营收28.88亿元,同比下滑17.64%;净亏损5789.5万元,由盈转亏,去年同期为盈利1.11亿元;扣非后归母净亏损3.38亿元,去年同期为盈利1.46亿元。

  科大讯飞表示,公司虽然在一季度业绩下滑,但基于在国产替代和业务开拓上的进展,预计从二季度开始将会实现收入和毛利正向增长。

  问:去年包括今年Q1受到社会特殊环境的影响,对业务造成压力,公司对根据地业务全年的展望怎样?

  答:尽管去年此起彼伏的特殊的社会经济环境影响了多个大项目进程,但公司基本面未受影响。公司根据地业务2022年增长了23%,在整个业务结构中的占比亦提升到58%。根据地业务无论从数据上,还是从客户对于应用价值的反馈都保持良性增长态势,我们对2023年根据地业务的目标完成有信心。

  答:公司通过业务的规模化,把独特的优势做强,把根据地的可持续流水型业务做透。公司今年对于G、B端的项目提出了明确的利润考核,随着大模型通用化语义理解的深度能力提升,前端的销售成本、定制交付成本、项目利润率因管理效能的大幅度提升,有望进一步改善。

  答:2022年底、2023年初极其特殊的社会经济客观环境及春节假期导致部分大项目在Q1的签单、交付、验收等出现延迟,影响了收入的实现进度。智慧的其他根据地业务依然保持稳健增长:考试业务2022年新增12个地市的中考,新增两个省市的高考;个性化学习手册2022年已在1400所学校商业化运营,实现营收同比增长12%,2023年一季度营收同比增长超过40%;AI学习机2022年营收同比增长53%,NPS净推荐值持续保持行业第一,线多家门店,带来学习机销量快速增长,2023年一季度营收同比增长超过20%;课后服务在2023年Q1末已覆盖超300区县,持续保持行业占有率第一。

  答:第一,做认知大模型这样的前沿核心技术研发不是靠堆人,而是靠一定规模的高手之间互相信任、高水平的协同。OpenAI最核心团队人员不超过100人,讯飞研究院最核心的研究团队有200多人,且其中有两位是《麻省理工科技评论》“35岁以下科技创新35人”榜单中顶尖的年轻科学家,其他团队成员不少是多年来和讯飞一起成长的博士;

  第二,科大讯飞核心研究团队建制完整而且团结没有内耗,这是科大讯飞最大的优势。在认知大模型的研发上,未来一段时间公司并不需要太多额外的人力投入;

  第三,科大讯飞一直长期坚守在领域,在人工智能相关核心算法上,多年来一直踏踏实实的潜心投入:公司1999年创业的目标就是为让机器像人一样能听会说;2014年发布讯飞超脑时,宣布的目标就是逐步突破机器阅读理解、逻辑推理、分析归纳、知识表达等技术难点,实现机器从能听会说到能理解会思考;2017年,公司获批承建认知智能国家重点实验室。讯飞多年来在Transformer深度神经网络算法方面拥有丰富经验,核心技术保持国际领先水平,并在整个研究推进的过程中不断进行算法创新。讯飞在认知大模型上能实现快速突破,和长期扎实积累是密不可分的。

  问:关于大模型数据的问题,中文互联网语料相比英文互联网语料的环境整体水平还相对落后。讯飞在语料数据上有哪些积累和比较优势?

  答:第一,中文文本数据积累方面,科大讯飞拥有语音及语言信息处理国家工程研究中心多年研究过程形成的积累,在中文语音市场占有率遥遥领先;讯飞人工智能开放平台作为首批国家新一代人工智能开放创新平台,日使用量超过50亿人次。在严格尊重用户隐私和遵守适用法律法规前提下,多年来为大模型提供了海量文本语料和用户反馈数据。

  第二,数据质量上,认知大模型特别需要多轮对话和逻辑推理,行业上的深度应用过程才意味着高质量的数据。以医疗领域为例,科大讯飞在业内是全国唯一通过国家执业医师资格考试的人工智能系统,超过了96.3%的医学考生,已累计为基层医生提供了超过5.8亿次、日均超过70多万人次的人工智能辅诊;科大讯飞在领域的应用规模比医疗更大。这些真正有刚需、适合认知智能大模型训练的行业数据,才能更好地满足专业领域需求,推动大模型在具体行业上做得更透。

  第三,科大讯飞多语种翻译技术全球领先,能够学习全球各种语种的知识。未来在数理化教育和医疗等跨文化的领域,科大讯飞还将发挥多语种的优势走出去,在海外市场获得智慧涌现的切入点和立足点。

  答:第一,在人工智能核心技术的投入上,公司的态度一直是对于应该投入的重点方向饱和投入、绝不手软。科大讯飞在总部自建有业界一流的数据中心,目前已建成4城7中心深度学习计算平台,为大模型训练平台建设奠定了很好的硬件基石;

  第二,科大讯飞过去几年牵头承担了国家自主可控人工智能平台的诸多项目,与华为、寒武纪、曙光等企业建立深度合作的同时,在踏踏实实地建设自己的算力。目前公司的训练、推理在国产平台上的方案已跑通成型;

  第三,未来讯飞在认知大模型相关的算力上,会继续围绕自主可控人工智能算力平台展开建设,避免在发展中被卡脖子,可以一步一个脚印稳步往前走。

  此外,科大讯飞在工程技术方面实现了百亿参数大模型推理效率的近千倍加速,为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

  问:我是讯飞AI+办公的各种产品的深度受益者,讯飞耳机、办公本、鼠标我们都在使用。请问大模型对公司AI+办公产品及其他C端硬件产品会带来怎样的变化?

  答:大模型本身对C端硬件的重要价值就是后端理解能力的提升,每一个智能终端的人机交互会更便捷、更自然、更有深度。各种智能硬件、智能家居设备,前端的能听会说到后端的能理解会思考融为一体后,将给用户人机交互体验带来极大提升。另外,5月6日的发布会大家可以看到讯飞录音笔、办公本、讯飞听见等在产品效果上的大幅提升,以前只是转写成原汁原味的文字,运用大模型后,将能够对会议记录自动校对、自动润色、自动按需生成摘要或办公文档,显著提升用户的工作效率。

  星火大模型是讯飞超脑2030中在2023年到2024年特别重要的阶段,但讯飞超脑2030计划是科大讯飞更大的登月计划,要让能够端茶送水、亲情陪伴的机器人进入每个家庭,认知大模型具备的多维感知、多模表达、深度理解、情感贯穿将的实用价值形成巨大的提升。

  问:讯飞过去训练了非常多的专业模型来解决各个场景的问题,通过今天的产品体验我看到了星火大模型的能力,还是很让人感到惊喜的。在现在以及未来讯飞星火大模型1+N的持续迭代过程当中,专业模型将如何发挥作用?讯飞技术研发会围绕哪些方面展开?

  答:今天大家体验的是大模型1+N任务攻关的阶段性进展,讯飞星火大模型在5月6日正式发布时,还会有三轮的迭代。科大讯飞有信心在中文领域的通用认知大模型实现智慧涌现,同时在教育、办公、医疗等领域做到业界领先。

  专业模型和通用大模型的关系是:大模型的基础能力,对专业模型的语言表达、包括上下文在内的复杂语义理解、逻辑推理等方面会带来巨大提升;大量积累的专业领域语料和实际场景应用反过来也会促进大模型的通用智慧涌现;已经取得成效的专业模型再通过知识衔接在大模型中统一训练,会形成通用领域的智慧涌现和逻辑推理能力的整体提升,两者相辅相成。讯飞现在的模型参数、训练数据仍有很大的潜力,大模型的进步对教育、医疗等专业领域会有很大的推动作用,专业领域同时可以反哺大模型进步。我们有信心在国内认知大模型研发竞争中处于前列。

  问:科大讯飞兼具大模型和垂类数据的优势,公司未来大模型的商业模式是侧重API变现,还是侧重保持垂直领域落地的优势,预计什么时候开始进入收获期?

  答:讯飞在很多年前就一直在提“平台+赛道”,“平台+赛道”正是过去多年科大讯飞良性发展、双轮驱动的重要模式,是由不同团队、不同事业部、不同机制在推动。“平台”意味着讯飞开放平台上的开发团队通过API调用等方式获得星火大模型的各项能力,与平台之间按调用量付费、应用合作分成、流量分成及订阅付费等多种方式进行价值分享。“赛道”意味着大模型要赋能教育、医疗、办公、车载等行业,在这些领

  域形成专用模型技术领先和大规模商业应用互相促进的格局。讯飞认知大模型“1+N”的技术红利未来会通过上述“平台+赛道”的商业逻辑逐步兑现。

  问:大模型将重塑互联网产业格局,讯飞在赋能开发者通过大模型开发核心应用有什么思考和布局?如何展望To B的商业模式?

  答:认知大模型带来的人工智能革命对每一个行业都会产生重大突破或重塑,比如在人机交互方式和信息产生方式上,甚至在移动互联网和数字经济的转型发展中,每个人都能通过认知大模型的编程能力,成为创新产品和创意应用的发动者,带来全新变革。

  讯飞人工智能开放平台作为首批国家新一代人工智能开放创新平台,致力于向开发者提供业界领先的人工智能核心技术,围绕开发者群体持续构建生态。在认知大模型阶段,生态赋能既是商业价值变现,也是产业使命实现的重要路径。讯飞的相关技术将以API和生态赋能的方式,提供给行业开发伙伴,在各个领域成功应用。讯飞开放平台上的开发团队通过API调用等方式获得星火大模型的各项能力,与平台之间按调用量付费、应用合作分成、流量分成及订阅付费等多种方式进行价值分享。在商业模式上,To B端的基本逻辑是通过赋能开发者合作共赢,让开发者实现商业价值的良性循环,再分享成功后的增量部分,具体的商业模式还在不断摸索中。

  问:近期较多互联网厂商也进行了大量的官宣和产业的生态合作,请问公司在产业合作的对接会不会失去一个先发优势?

  答:我们完全不担心部分厂商早前发布,认知大模型核心是满足社会刚需,首先,从能力上,讯飞多轮对话的理解能力、编程能力的方法论都已完全具备,

  数理能力的讯飞优势会进一步扩大,不仅是对中文知识的搜索,而且在全世界可以跨文化衡量的多轮对话、语义理解、逻辑推理能力上要有更强之处;其次,生成式AI绝不是简单的生成多风格文本,而是真正的智慧涌现,应该成为每个企业和每个人的AI助手,必须要达到刚需的要求,才会真正规模化推广。