关于ChatGPT的思考及其在智慧风控层面应用的初探

来源：发表日期：2023-06-30

美国东海岸微软云数据中心，在数层楼高的白色集装箱内堆叠的服务器中，代码总量超350G的ChatGPT系统正飞速推衍，生成亿万灵魂，迎接四海来客。海量流量沿着粗壮电缆涌入服务器内，这些流量来自美国、欧洲、中亚，来自风尘仆仆辗转而来的远东。最初的访客是程序员、工程师、AI从业者，很快又多了鲨鱼般游弋的投资人，最后是无数懵懂又好奇的普通人。而他们都在探寻一个问题：ChatGPT究竟是什么？

一、诞生背景

ChatGPT是一款由OpenAI开发的人工智能聊天程序，开发公司OpenAI于2015年由一群科技界领袖创立，是一家致力于学术研究的小型非营利性实验室，核心宗旨在于“实现安全的通用人工智能（AGI)”，马斯克也是其创始人之一。ChatGPT作为公司的一项基于GPT-3.5架构的自然语言处理工具，于去年11月底推出，亮相即封神。

有别于过往的聊天程序，ChatGPT并非根据提问搜索回答，而是通过自身数据库，自行理解后作答。它的智力诞生于此前3年100亿条句子的日夜训练，训练总文本超45TB。与它的一问一答已非提问和搜索，更像是一场跨物种的对话。

谷歌面试官发现ChatGPT能通过年薪18万美元工程师招聘考试；北密歇根大学教授发现班里最好的论文出自ChatGPT之手；有UP主用它写《植物大战僵尸》游戏代码，发现直接可用；公关公司用它当宣传策划；推销员把它训练成资深客服；房产中介用它生成房源文案，一小时工作量，5秒完成；剧作家和小说家发现ChatGPT掌握地球上大多数小说的情节，熟稔无数套路，并可模仿众多名家文风。

人们开始热衷讨论它的神奇，而这背后的逻辑在于：每一场超级工具降临，都将蕴含着革命的风暴。

二、革命意义

人类发展两大主线，一是掌握和使用更高级的能源，二是更高效地传输信息，智能AI显然属于后者。

第一条主线上，人类对火、风能等的应用，促成了人类起源，并完成了从原始社会到农耕文明的转换；而电力、石油资源，更促成了现代工业文明。人类自诞生起百万年的演化主要都是在这条主线上发展。

第二条主线上，电信号的出现催生了电报、电话为代表的通信革命，更大范围、更深层次的信息交互推动了现代工商业发展和全球化进程；这一阶段，能量和信息均取得了质的飞跃，两者融合创新对人类文明的促进作用明显提升。20世纪中叶，信息技术和互联网的诞生更是对现代文明产生了十分深远的影响。

结合这两条主线观察人类的发展史，可以毫不夸张地说，尽管从生理水平来看，这一个世纪以来人类发展的进程远远比不上此前数十万年的进化，但这一个世纪的生活方式和文明演化却是此前数十万年都无法比拟，且呈指数级变化的。近百年来，人类已在第二条主线上经历两次超级工具的降临，而且密集发生在最近三十年。

第一个降临的超级工具是互联网，它引发了“空间革命”，用虚拟的聚合跨越了现实的空间。第二个降临的超级工具是智能手机，它引发的是“时间革命”，让我们的工作、生活、娱乐，无时无刻不线上化。

而今，不少人将ChatGPT视作第三次超级工具的起点，断言它将引发“思维革命”，改变人类思考和处理问题的方式，并由此重塑世界。

三、回归理性

2月9日，谷歌感受到了ChatGPT的巨大压力，加速冲刺推出了对标的竞品“BARD”，并发布了一段宣传视频。其中为了展示BARD的能力，演示了一段问答。问题是：我可以告诉9岁的孩子关于詹姆斯韦伯望远镜的哪些新发现？

BARD给出了三条答案，其中第三条是“詹姆斯韦伯望远镜拍摄了太阳系外行星的第一张照片（JWST took the very first picture of a planet out side of our own solar system）”。很快推特上就有天文专家指出这个答案是错误的，第一张太阳系外行星的照片是2004年欧洲南方天文台拍摄的。

消息一出谷歌立刻就意识到错误，迅速删掉了宣传视频，但为时已晚，互联网以爆炸的速度将此事发酵和扩散，很多人开始对谷歌的产品前景感到失望，股价随即引发了一波跳水，市值蒸发约千亿美元，谷歌一夜之间成了全网的笑柄。

而这也暴露出目前AI的不成熟：目前的AI聊天程序（无论BARD或是ChatGPT）都充斥着大量类似的错误。AI会把一部分错误的信息包裹在一个大部分内容都正确的答案里，然后一本正经地发出来。这对用户是个考验，因为通常大部分人是不会逐一求证内容是否100%正确，但如果不进行检查，100%信任它，迟早会因为错误酿成大的损失。

ChatGPT回答问题所使用的内容，一部分来自网络的科普文章，一部分则根本经不起推敲，最重要的是，虽然推荐的文献看起来有模有样，但实际上很多都是搜不到的，很可能是ChatGPT乱编的。此外，用写代码时，也会出现看起来一本正经，实则完全没办法使用的情况。脱离了可以写车轱辘话的文科领域，在金融、生化等理科专业，ChatGPT开始展现出不足；而即使在ChatGPT熟悉的语言学习领域，ChatGPT并不能真正理解专业术语，提出的观点缺乏深度，更像鹦鹉学舌。

四、现实应用

基于上述基础，在2月底，笔者通过OpanAI官网测试，提出针对性问题对话AI，以期望通过ChatGPT-3.5实现智慧风控，但发现以下问题：1）GPT-3.5尚无法完成检索动作，无法直接从互联网上发掘客户信息。2）对于财务信息的智能发掘，目前只能通过简单的聊天窗口输入文字，对完成财务报表的输入工作尚有难度。3）笔者特意输入了勾稽关系错误的数据，发现GPT-3.5未能发现其中的错误，无法胜任财务信息的发掘判断工作。4）对于具体的财务指标，其分析停留在“解释指标、阐述变化趋势”的简单分析中，对背后的隐含风险判断较浅显。5）可以提供一些行业的指标信息以便比对，但无法验证准确性，不如更具威信的行业研报。

2023年3月14日，ChatGPT-4发布，微软旗下的搜索引擎必应（Bing）在第一时间将其接入自己的搜索引擎，自此，ChatGPT变得更加严谨、更加富有创造力，且实现了数据联网。随后，在Bing测试环境下，笔者尝试了用GPT-4实现智慧风控。

（一）测试平台：通过最新的Microsoft Edge浏览器（笔者测试版本111.0.1661.62，旧版本Edge浏览器该功能受限）访问微软的搜索引擎Bing官网：https://bing.com（大陆的IP会自动跳转导向Bing中国区网站https://cn.bing.com/），早先可以通过配置浏览器插件HeaderEditor的方式实现大陆IP访问境外官方Bing，后被微软官方禁用，因此建议采用VPN全局模式访问。

（二）微软账号注册：新Bing的“聊天”功能需要登录微软账号，QQ邮箱用于Bing登录会出现无响应的情况，因此建议在Windows注册Outlook邮箱，通过Outlook邮箱作为Bing的登录用户名。

（三）切换模式：登录后进入“聊天”即可激活搭载GPT-4的智能对话模型，此时有三种选择模式可供选择：“更具创造力”“均衡”“更严谨”。鉴于智能风控模型的专业性要求，此处切换至“更严谨”。

（四）导入分析指标：可以直接通过问题的方式让Bing对我们所关注的指标做出细化。如提问：“企业有哪些重要的偿债能力指标、经营效率指标、盈利能力指标、现金流量指标？”对于Bing一次提供的指标较少的情况下可以通过多次提问激发扩增，如“这些指标对我的分析来说还有点不够，请帮我再多列示一点”，甚至直接向Bing说明如“关于现金流量指标，还有销售收现率（销售商品、提供劳务收到的现金/营业总收入），可以很好地反映当期销售收入中现金的收回程度”。经过2-3次对话优化，Bing可以将我们所关注的指标列示出来，并叙述其计算方式。为了便于叙述，笔者将测试文字对话的输出内容整理至下表格中。

可以看出，Bing的输出非常体系化，而且可以直接通过财务数据实现计算输出。事实上，本部分工作作为AI的训练过程，随着越来越多的测试样本输入，其比重会越来越少，越来越智能。

（五）导入财务报表：对Excel格式的财务报表可以直接复制粘贴输入给Bing，Bing会自动识别空格、换行符等信息，由此判断哪些数据是年初数，哪些数据是年末数，甚至笔者测试输入财务报表的四列内容（项目、注释、本年金额、上年金额）中注释栏里的内容，如“附注八、16”等信息都不会对AI的识别产生影响。在输入过程中可以适当地增加提示，以增加可靠性。如：“接下来我将输入一个企业2022年的宅产负债表资产部分，请稍候依据财报的数据按我的要求分析”。

（六）指标计算：通过“请根据该企业的三张财务报表帮我计算上述提到的所有指标”等指令可以直接输出计算结果，Bing会按照上述的公式查找数据并详细列示计算公式以便验证，对于有问题的指标也可以指正（注：每次回答显示的篇幅有限，对于指标较多后半段显示不全的情况，可以要求Bing重新显示部分内容）。

（七）企业画像：通过“根据上述计算的所有指标，帮我分析一下该企业的特点”“请再帮我根据现有的信息深入挖掘一下该企业的信息，有哪些风险点”等指令Bing可以依据上述的财务指标实现企业画像。根据笔者测试数据的结果，Bing反馈信息如下：

首先，在偿债能力方面，该企业的流动比率和速动比率都在1以下，这意味着该企业的流动资产可能不足以偿还其短期债务。如果该企业无法及时筹集到足够的资金来偿还短期债务，那么它可能面临财务危机。此外，在经营效率方面，该企业的存货周转率、应收账款周转率和总资产周转率都较低，这意味着该企业在存货管理、应收账款管理和资产利用方面可能存在一些问题。如果这些问题不能得到有效解决，那么它们可能会影响该企业的经营效率和盈利能力。在盈利能力方面，该企业的毛利率、净利润率和净资产收益率都较低，这意味着该企业的盈利能力不强。如果该企业无法提高盈利能力，那么它可能难以实现可持续发展。在现金流量方面，该企业的现金流量比率和现金流量充当比率都较低，这意味着该企业的现金流量状况不太理想。如果该企业无法改善现金流量状况，那么它可能面临现金流断裂的风险。综上所述，该企业可能存在偿债能力不足、经营效率低下、盈利能力不强和现金流量不足等风险点。

结合企业的实际情况来看，作为初步判断和简单画像，Bing输出的分析较为贴合实际情况，对于项目的前期筛查、常规租后风险筛查具备一定的现实意义。

五、问题和风险

（一）联网信息筛查问题：Bing作为搜索引擎本身可以联网搜索，实测基于GPT-4的Bing聊天结合了互联网的搜索筛查功能，可以用于对特定企业进行信息发掘，甚至可以通过企业英文名对应中文名并实现搜索，发掘企业工商信息、诉讼信息等。但根据输出结果的信息源来看，中国企业的信息源多出自企查查等企业信息聚合网站，实际通过企查查直接搜索针对性更强。

（二）数据安全和信息保密问题：财务信息和其他特异性的信息是企业的非公开信息，在使用AI模型的过程中容易发生这部分非公开涉密信息的外泄，引发数据安全和信息保密问题，发生法律风险。因此，建议用ChatGPT搭建智慧风控模型时，剥离企业的具体信息，仅进行财务信息的分析发掘工作。在复制财务报表输入过程中避免将企业名称、审核人等信息复制输入。在对话过程中避免提及企业名称。而针对企业的具体信息则通过企查查和其他相关公示网站进行，一方面是避免链接财务等非公开信息，引发信息安全问题，另一方面也是由于企查查等途径的信息源更加权威可靠，信息针对性更强。

（三）政策风险和过度依赖问题：近期ChatGPT在意大利被禁止，大量账户被封禁，加之1000多名硅谷企业家科学家联名呼吁所有人工智能实验室立即暂停比GTP-4更强大的人工智能系统的训练，暂停时间至少为6个月，以“远离极端的大规模风险”。4月10日，中国支付清算协会发出倡议，呼吁从业人员谨慎使用ChatGPT等工具，对其引发的信任风险、模型风险和数据安全问题作出说明。结合我国目前不在GTP合法使用区域内的现实，在实际应用中也需要考虑政治政策风险，对应用GTP的模型建立备用计划或人工替代方案，避免对其过度依赖。

（四）信息准确性问题：根据验证，GTP-4输出的财务指标整体正确，包括计算过程引用的财务报表中的数据都会列示，准确性问题已较GPT-3.5大大改善，但鉴于GPT模型毕竟是语言模型，且无论任何严谨的模型，错误都不可避免。因此建议该智慧风控模型突出辅助研判的特点，作为支线嵌套于项目流程中，用作项目前、中、后的研判参考，而不可偏信。相关人员在采用模型时要对准确性风险作出说明，对于重要性情况务必对输出信息复核。后期在大量使用本模型的情况积累了数据量的情况下，可以参照数理统计的方法，对过往输出信息的准确性进行分析，在一定置信度下做假设检验。由此判断当前置信度能否达到我司标准为我所用。

六、总结

从目前的测试结果来看，GPT-4已经可以实现通过输入财务信息完成客户画像，识别风险，该智慧风控模型对于信贷业务中前期的基础研判和常规贷后风险揭示展现出了一定的作用，此部分项目分析工作可与信贷审批流程和贷后管理流程结合完成标准化和智能化操作。

同时，在具体应用层面，需注意联网信息筛查问题、数据安全和信息保密问题、政策风险和过度依赖问题、信息准确性等问题，做到合规、合理、安全。

此外，除去在信用风险防范方面的应用，ChatGPT还可用于智能客服，防范操作风险；用于市场信息挖掘，防范市场风险。但鉴于我司主要不存在客服岗位面向C端消费者，利率作为市场风险也较为单一的情况下，此部分内容暂不赘述。

考虑此前GPT-3.5还存在很多问题，无法胜任此部分工作，仅仅几个月GPT-4便实现了如此之大的改进升级，建议保持关注，相信后续版本的发展会带来智慧风控模型的不断提升，实现智能化和精确化的双重提升，助力项目分析和风控发展。

关于ChatGPT的思考及其 在智慧风控层面应用的初探

来源： 发表日期：2023-06-30

关于ChatGPT的思考及其在智慧风控层面应用的初探

来源：发表日期：2023-06-30