云峰会上正式发布京东言犀大模型,同时发布言犀AI开发计算平台。会上透露,该平台已经启动预约注册,预计8月正式上线。
在峰会现场,京东展示了金融领域AI营销运营平台。可以看到,使用者通过简单的对话和操作,就能生成营销活动,覆盖从运营策略制定、快速搭建活动页面、批量生成营销文案和素材,到数字化投放等方面。
过去这套流程需要产品、研发、算法、设计、分析师五类职能人员,如今减少到一人;过去2000次人机交互次数也减少到少于50次。在大模型能力的加持下,营销方案的生产效率有了百倍提高。
京东探索研究院院长何晓冬介绍,言犀大模型支持语言、语音、视觉、多模态等,70%通用域数据,结合30%的行业数据,实现基座模型+垂直领域模型的精调,可服务于零售、金融、教育、政务等领域。何晓冬透露,计划在2024年上半年全面开放大模型能力,向产业输出定制化模型。此外,京东也在探索从语言大模型走向多模态数字人交互,而具身智能也将是京东探索研究院未来重点探索方向。
京东集团CEO许冉在京东云峰会上表示,大模型在京东内部已经取得明确的实践效果。京东在内部大量的业务场景都在深入探索大模型的应用,包括智能客服的水平提升、通过大模型优化产品搜索和推荐效果等。
通用还是行业,在大模型竞争进入白热化阶段,内部也开始出现路线分歧。何晓冬曾将通用大模型比作“高中生”,产业大模型比作“本科生”。
京东健康京医千询大模型就是一个典型的例子。与通用领域相比,医疗领域的大模型可谓是“貌合神离”。基于医疗场景的特殊性,容错率极低,这对语言大模型提出了更高的要求。
此外,目前已经发布的医疗大模型大都聚焦于文本数据。但是医疗数据中有超过90%的数据是来自于医学影像,因此,只有融合医学影像、文本、语音、视频等多模态信息的大模型才能契合实际需求。
京医千询大模型建立在言犀通用大模型基础上,通过超过亿级的高质量医患对话数据和大规模医学知识图谱构建。最大的特点是有共情和交互能力,可以理解复杂模态,包括图片、影像的医疗数据来做自主推理决策。
在大会现场,京东演示了将通用大模型转化为健康产业大模型的操作。通常来说,从数据准备、模型训练到模型部署,客户完成这套流程需要10余名科学家花费一周时间,而利用言犀AI开发计算平台,只需要1-2名算法人员在数分钟就能完成;通过平台模型加速工具的优化,还能节省90%的推理成本。
创造产业价值是大模型的目标。许冉展示了京东评价大模型价值的公式:大模型的价值=算法×算力×数据×产业厚度的平方。除了追求技术的先进性,京东还格外关注产业厚度——看重技术能在多少产业场景中切实应用,为社会真正创造价值。
京东自身的发展就来自产业场景,自身拥有包括零售、物流、科技、健康、工业、产发等多个领域的产业实践,为京东积攒起每年数百亿条的优势交互数据。训练京东言犀大模型的数据库,就由70%通用数据与30%数智供应链原生数据组成。这些产业数据和行业know-how。
在这轮技术热潮中,未来大语言模型技术下一步的关键走进现实。“还有多模态,如果想达到深层的涌现智能,必须进行深层次融合,真正做到多模态的通用人工智能,才能够说通用实现了。”京东探索研究院科学家,大模型训练与推理系统负责人薛超提到:大模型最终会从数字世界走入实体世界。他认为,物理实体世界拥有很大的创新空间,包括工业制造、机械臂、自动驾驶车,以及像波士顿动力的机械狗,这样在现实物理世界就变成了一个大的训练、培养环境,实现了机械智能,给物理实体世界带来更多自动化和潜在价值。