以百融云创为例,百融云创基于深度学习Transformer框架,结合NLP、智能语音等技术,打造了场景驱动的产业大模型——BR-LLM。百融云创自主搭建了大模型底层框架,通过深度微调能支持百亿级参数的训练。
与普通模型相比,大模型具有更加复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模,并不等于更强模型能力。垂直领域大模型考验的是算力+行业knowhow+模型精调的综合能力。其中行业knowhow尤为关键,这是专家经验、行业数据、组织能力、工程能力的综合体,而这也恰恰是垂直企业的竞争优势所在。
比如,在银行运营环节,由于模型都是黑盒模式,由模型制定出的营销策略,很难让一线执行的客户经理完全信服,当模型制定的策略置于现实情况产生了偏差,此时该如何协调客户经理与AI之间的关系?或者由于外部环境发生变化, 如疫情对居民收入带来了影响,金融机构原有的信贷模型与现实情况就会产生偏差,此时要如何优化原有的参数?如果仅有大模型而没有足够深入的产业knowhow,是远远不够的。
比如,在某中小银行的服务中,百融云创要从数字化转型总体规划入手,逐步深入到,产品和业务等多个层面。有时要协同科技部门、业务部门等多个部门,并搭配非常深厚的产业视野,才能真正深入场景,直抵产业的核心。