近期分析多个场景的 AI 技术落地,从自己做过的第一个完整的 AI 产品开始整理。并调研 NLP 技术如何落地到金融领域的具体应用和场景。
个人理解:金融的核心在于信贷风险控制,所以将 AI 技术用在风控策略中能发挥出最大的价值。相比之下,智能客服最核心的场景应该是在电商领域,因为用户在购物过程中都离不开咨询客服流程。
AI 在金融领域的应用场景
在信贷授信过程中,AI 运用在全流程,包括贷前审核、风险定价、反欺诈、客户行为预测与价值挖掘、贷后监控管理等,而风险定价与反欺诈流程的 AI 技术渗透性最强。
调研了多个平台的风控服务与智能客服助手,我选取以下2个核心场景,分析 AI 技术如何应用于金融领域。
核心场景:
- 反欺诈:主要包括账号安全保护、网络信用检查、交易安全保护、文本内容安全、营销活动保护等。关于账号欺诈,可以通过生物识别技术,提高用户在注册或支付流程中,对用户进行身份验证来提高账号安全性。生物识别技术主要有人脸识别、指纹识别和虹膜识别3类:
- 人脸识别,是提取用户的脸部图像特征,并将其与数据库中的脸部图像进行对比,从而达到验证的效果;
- 指纹识别,是通过提取验证者的指纹,将其与数据库中的指纹进行对比,目前大部分手机银行、支付宝等都支持指纹验证支付;
- 虹膜识别,是基于人眼中的虹膜图像进行识别,它的复杂度高、安全性强,尤其用于在银行核心区域,如金库、数据中心等场景。
- 智能顾投:是一种机器学习算法,可以根据客户的收益目标及风险承受能力自动调整金融投资组合。主要分为两类:
- 一类是针对普通客户,智能投顾系统可以采集客户的年龄、消费轨迹、经济基础、风险偏好等指标,为客户提供个性化的金融服务,比传统的个人投资顾问更客观和可靠;
- 另一类主要是针对投资机构,使计算机能够学习金融数据,并且通过分析处理发现模式,综合分析企业上下游各个环节和相关合作、竞争公司的情况,主动发现风险,及时调整投资策略。
- 智能客服:主要分为线上和线下两个方面:
- 线下部分指银行大堂里的智能机器人,解放大堂经理的繁杂工作、也节省用户办理办理业务的时间;
- 线上部分是指在线智能客服,快速答复并解决客户咨询的问题;降低人工服务压力和运营成本;并分析客户信息,为客户服务和精准营销提供决策支持;
参考:
- 人工智能在金融科技领域有哪些应用? - 知乎
- 《人工智能在金融领域中的应用分析_杨文斌》
- 信贷风控服务-同盾科技
AI 在金融领域落地面临困难和挑战
- 深度学习模型的构建比较困难
- 目前并没有成熟的理论对深度学习模型的构造提供指导,主要还是依靠研究学者不断实验、不断探索。
- 深度学习模型的稳健性和适用性有待商榷
- 深度学习模型能否适用于特定领域的分析和预测,需要大量实验进行验证。目前相关理论研究还处于对单一模型的优化处理,并没有提炼出通用的规律性方法和框架,从而限制了最终模型的稳健性和广泛适用性。
- 深度学习模型较难正确地阐述金融数据分析结果背后的经济学原理
- 深度学习模型在分析金融数据时,削弱了利用经济学解释最终结果的因果关系、以及隐藏于数据背后的经济学原理。
参考:
- 《人工智能技术在金融领域应用的思考_以深度学习为例_王立鹏》
下面分析三个 AI 在金融领域应用的核心场景:
- 风控 - 反欺诈 - 账号欺诈 - CV
- 智能客服 - 线上客服 - NLP
反欺诈场景
账号/交易安全保护
解决在线银行、互联网金融行业对注册用户的身份验证问题,包括:账号注册、更换账号密码、支付、绑定银行卡等有一定安全风险的场景。
- (1)传统的注册用户身份验证是通过人工审核的方式,而人工效率低,审核周期长,导致流失部分用户。而使用AI技术可自动验证,加快用户在注册或其他流程上的验证时间;
- (2)面对海量用户的数据,肉眼无法做出精细化的判断,在某些环节如果出现漏洞则存在被攻击的风险,比如不法分子使用软件合成的人脸图片或三维模型,并盗取他人身份证图片来批量注册赚取「新人红包」,甚至盗取他人账号。
身份验证解决方案
综合使用活体检测 + 证卡OCR识别 + 人脸比对 + 图片防伪等技术,确保注册用户的真实性,提升用户体验。
- 采集用户的身份信息:用户通过互联网或移动端扫描身份证,可快速提取用户信息,并完成卡片文字 OCR 识别转换为电子文本,加快用户录入时间,确保高准确率。
- 活体验证:使用交互式验证方式,提示用户完成随机动作(如眨眼、张嘴、点头、摇头),判断图片是否来自真人注册(静默活体的验证方式,一般用于快速登录场景,减小用户的操作负担)。
- 人脸比对:对比本人照片(活体检测中提取的人脸图)与证件照片(或权威机构留档底照)的 1:1 人脸验证,判定两张图片中的人脸是否为同一人,从而减小身份验证流程中的安全漏洞。
- 云端使用人脸防伪与证卡防伪技术,分析用户在上述过程中是否存在虚假攻击行为(如:纸质图片、屏幕翻拍、面具模型、合成视频等)。
AI 技术点
- 活体人脸检测(真人检测):检测摄像头前用户是否为真人操作,能有效分辨高清照片、三维模型等仿冒欺诈。一般支持两种场景:交互检测和静默检测:前者需要用户配合做一系列的动作,后者是用户无需刻意动作,只需对着摄像头有自然活动变化即可。
- 光学字符识别(OCR):这里使用的身份证 OCR 识别技术,属于图像字符识别领域。检测图片中的身份证位置,通过 OCR 技术将关键字段提取并转换,得到规范的证件信息文本。
- 人脸比对:对两张人脸图片进行相似度比对,利用人脸特征的相似度比对,来区分不同的人脸。
- 深度学习:近年来深度学习在人脸识别、语音识别、语义分析、图像分类等众多领域都突破了传统机器学习取得的成果。
参考:
- 商汤 - 身份验证服务
- 自己之前在商汤的一些工作总结
智能客服场景
智能客服机器人,使用自然语言处理、语音识别、机器学习和大数据等人工智能技术,降低企业服务成本,增强用户体验。
调研 - 网易七鱼
产品价值
用户体验
支持功能:
案例
案例
算法指标:
总结:
1、提升产品指标:
- 用户咨询时间缩短xx%
- 节省超xx%的人力成本
- 提高xx%的订单转化率
2、算法指标:
- 语义理解准确率xx%
- 语音识别字错误率xx%
- 数据指标:每天消息量xxxx万条,是Siri全球用量的1/3
参考:
调研 - 小i机器人
调研 - 讯飞语音助手/AIUI平台
AIUI 提供以语音交互为核心的交互解决方案,全链路聚合了语音唤醒、语音识别、语义理解、内容(信源)平台、语音合成等模块。
AIUI 开放平台主要包含了语义技能(Skill)、问答库(Q&A)编辑以及AIUI 应用(硬件)云端配置的能力,并为不同形态产品提供了不同的接入方式。
开发者可以根据实际的业务需求,利用热词、静态实体、动态实体、所见即可说等特性,进行个性化的优化和改进,提升交互准确率。
参考:
AI 技术点
语音唤醒
语音唤醒是指通过4-6个音节的唤醒词,将设备从不对外部声音进行识别的休眠状态唤醒为接受并识别外部声音的交互状态。
基础型唤醒词支持4-6个汉字,加强型唤醒词支持4-6个汉字或2-4个英文单词。
唤醒词定制建议,遵循规则效果更佳:音节覆盖尽量多,长度最少为四个音节;相邻音节要规避,字要发音清晰响度大;不常说词放心选择,可以有效降低误唤醒。
语音识别
语音识别(ASR)是一种将人的语音转换为文本的技术。
AIUI 的普通话近场识别准确率达98%,普通话远场识别准确率达95%。同时拥有英语,粤语等21种方言的识别引擎。
语义理解
语义理解(NLP)指将一句自然语言转化为计算机可读的结构化数据。
基于无监督句子语义表示的相似度算法,面向各类用户说法,提供高效的语义理解能力。
语音合成
语音合成(TTS)是指将文字信息转化为声音信息。
其合成音在音色、自然度等方面的表现均接近甚至超过了人声。拥有中英粤多语种、川豫多方言、男女声多风格的选择,音量、语速、音高等参数也支持动态调整,同时提供定制专属发言人。
- updated,180519(添加NLP调研)
- created,170415(工作总结摘录)