破冰产业金融核心环节 大模型再探能力“边界”
时间:2024-04-17 07:21 阅读量 209
供应链金融尤其是无担保的下游业务,运营管理复杂、风控难度高,导致成本高企,是行业公认的业务“硬骨头”。《中国经营报》记者注意到,今年以来,一些供应链金融市场参与者正在尝试将大模型技术用于供应链金融业务的核心环节,以期解决这一难题。
在金融业务中,尤其是风险控制方面,以大语言模型为基础的通用人工智能虽然具有一定价值,实际的应用效果和价值仍有待验证。这些技术突破是否能够真正解决产业链中的问题?面对巨大的算力投入,如何平衡成本和效率?
网商银行信息科技部副总经理方珂在接受《中国经营报》记者采访时表示,目前在业务中,虽然大模型已经可以为金融风控进行一些重要辅助,但风控系统仍然是大模型的“守门员”。客户量、数据与风控能力沉淀,对某一类客群认知的积累,才是构成用大模型探索更深层次金融应用的基础。
大模型试水风控“辅助”
随着人工智能(AI)在生产、库存、运输等产业链各个环节的全面渗透,IDC预测,到2026年,五成全球2000强企业将使用AI工具来支持产业链流程设计,企业运营成本将至少降低 5%。到2026年,25%的金融机构将使用生成式AI,助力金融服务在产业链的生产、制造、流通、消费等各个环节领域深度融合。
作为AI工具中最具关注度的大模型,到底能否在金融核心业务中发挥作用一直是市场讨论的热点。不过,理解大模型应用的价值,先要理解产业链金融遇到的困境。
在近期举行的2024数字产业链金融行业峰会上,网商银行行长冯亮举了一个例子:一家普通的小微企业,工商信息显示从事机械制造,年营业额在1000万元左右。这是根据工商信息和企业数据,一家制造行业小企业在金融机构眼中常常生成的画像。以往方式下,这家公司生产的是什么,最终去往哪里并不清楚。如果向银行申请信贷服务时,通常需要抵押房产,并等待至少一周时间。
“除非安排人力去实地尽调,否则在没有品牌企业担保的情况下,金融机构很难给予符合其经营需求的贷款额度。”冯亮表示。
上述类似中小企业如何能在产业链的视角下有更多维度的信息在线上“看见”,且不走上传统金融机构线下风控(对应了更高的融资成本)的老路子?2023年3月开始,网商银行技术团队尝试用大模型来解决这一问题。
大模型在这一过程中主要解决的是风控之前“精确识别”的问题。
方珂在接受记者采访时表示,通过把海量企业、工商等信息交给大模型去“计算”,大模型可以用知识抽取能力,从海量信息中形成产业链图谱,再通过多模态数据融合、协同推理等技术识别小微企业的主营业务,将其精准挂载到产业链上。比如汽车产业链,大模型最终可以“看到”发动机厂商、4S店、轴承厂商等环节,然后看见每个环节分布着哪些企业。
通过这种方式,网商银行大雁系统识别到了前述小企业更多的信息——这家生产高温尼龙材料的企业拥有12项专利,是浙江省的高新技术企业。而高温尼龙是汽车电子元器件上的关键原材料,用于保护连杆器核心电子器件的绝缘层。从产品供应客户看,该企业的产品辗转几个环节最终去到了比亚迪汽车,因此算是新能源车企供应商的供应商。
此外,在地域上,可以识别到该公司所处的产业带是浙江嘉兴平湖,是中国四大高新材料的聚集地,这一地域的公司业务相对稳定性更强。
“这些颗粒度更细的数据最终可以让风控系统‘看到’更精确的企业画像,为线上风控决策系统进行非常重要的辅助。”方珂向记者表示。
记者注意到,这种将大模型用于金融核心业务的“辅助”,市场上的供应链金融科技参与者也进行了不同方向和程度的尝试。
联易融相关负责人在接受记者采访时表示,大模型在供应链金融中应用后主要提升了产业信息整合与交易分析的效率,实现智能化风险评估,从而进一步降低融资及运营成本。据其透露,目前其内部研发的供应链金融GPT模型已运用在与一家大型外资银行合作的AI智能审单科技项目中。
与此前的风控方式相比,大模型的优势表现在处理各种复杂文档及适应不同业务需求上。“比如在上述审单项目中使用的供应链金融GPT模型,我们在通用大模型基础上,用近200万张各个专业领域的文档图片对供应链金融GPT模型进行了重新训练,训练数据涵盖合同、商业发票等关键文档类型。从结果看,大模型在要素识别与定位、规则基于语义的比对等方面表现出了更精确的能力,同时单次调用成本低至几分钱,成本效益突出。”该负责人表示。
京东供应链金融科技相关负责人向记者透露,目前正在探索将大模型用于行业风险监测与预警、动产融资模式下押品准入+估值、应收融资模式下供应商信用评估、小微金融模式下中小企业信用评估等场景的实践。
大模型的“能”与“不能”
大模型技术用于金融核心业务环节时,其仍有应用的边界。比如,在前述网商银行实际应用中,没有用大模型的生成能力直接与客户交互。大模型绘制的产业链图谱会向风控系统提供客户识别、经营评分和画像,但最终小微经营者获得的贷款额度,仍然是风控系统多维度交叉验证的结果。
大模型解决的是更精确地识别问题,而不是最终的决策。
IDC中国副总裁兼首席分析师武连峰在接受记者采访时表示,大模型高价值应用,最关键的是找到合适的场景。它至少必须满足两个条件,一个是需要对海量数据进行分析,另一个是需要价值高昂的专家知识。
如何理解这种高昂的专家知识?网商银行行业金融一部汽车及医疗总经理杨希望告诉记者,比如要去识别中小微制造企业,哪些是给汽车产业链供货而不是其他产业链,基础数据之外,要知道企业需要具备哪类资质认证,满负荷运转时候的水电需求是什么水平,这些都需要前端业务人士通过大量调研形成“认知”。然后再去把这类专业的知识“投喂”给大模型,模型再按照计算机或者风控能够理解的语言去“跑出来”。
此外,由于大模型众所周知的“幻觉”问题,一旦判断失误将会造成严重损失或风险传导。因此,用于金融领域时必须要面对更高级别的限制。与图文生成一类大模型应用相比,金融大模型应用必须经过严格备案。
在方珂看来,风控系统是“神经中枢”,也是大模型的“守门员”。最终决定一家机构风控水平的,仍然是其客户量、数据与风控能力沉淀以及对某一类客群认知的积累。
目前,业内人士也普遍认同大模型确实有助于推动风控算法精确度的提升。萨摩耶云科技集团创始人林建明向记者表示,虽然大模型的爆款应用是图文交互类,但在风控环节应用时并不是直接调用整个通用大模型,而是拆解大模型的一些关键算法再去训练金融机构的内部数据——让大模型将海量的非结构性数据“结构化”,做好标签,确实有可能让风控得到更精确的变量。
他在近期出版的《AIGC重塑金融:AI大模型驱动的金融变革与实践》一书中也预判,未来AIGC的市场服务方可能会逐步走向类似SaaS付费模式——将模型能力结构化后封装在软件服务里,为金融机构按需定制。
不过记者注意到,目前市场上真正将大模型运用于风控等核心领域的金融机构凤毛麟角。除了技术投入实力外,一个重要因素是金融行业对于安全和风险底线要求更高,新技术的研发应用流程较慢。
比如在通用大模型的使用和部署上,由于金融机构数据不出域等限制,一定程度对其部署节奏有所影响,“从头开始自己做训练非常难,目前大部分机构会选择开源的基础大模型,再结合自己的数据做微调,训练成‘自研’模型,但这种模型也面临着一定瓶颈。”武连峰表示。
成本反而不是制约金融机构最重要的关键因素。据武连峰透露,通用大模型训练时需要大量高质量数据,如果金融机构运用通用大模型作为底层模型且不再进行太多预训练,直接做推理或者微调,数据量需求并不算大。“比如只要高质量地标注500条、1000条左右的数据,模型提升效果就会有5%到10%。”
他判断,2024年仍然是金融机构围绕大模型基础设施和解决方案的投入年,未来两到三年才会真正进入产出期。
来源:网络公众平台