原文:
www.kdnuggets.com/2021/10/bank-data-scientists-working-fintech.html
评论
由Shameek Kundu(金融服务部门负责人,首席战略官)、Divya Gopinath(研究工程师)和Arridhana Ciptadi(机器学习工程师)共同撰写,均为 TruEra 公司成员。
1. 谷歌网络安全证书 - 快速进入网络安全职业轨道。
2. 谷歌数据分析专业证书 - 提升你的数据分析能力
3. 谷歌 IT 支持专业证书 - 支持你组织的 IT
除了技术行业,银行和保险业可能是数据科学家的最大雇主。鉴于金融服务一直依赖数据和模型——例如,用于贷款审批或保险承保——这并不令人惊讶。然而,作为数据科学家,你如何决定这是否适合你?你将解决哪些实际问题?你可以预期哪些挑战?成功需要具备什么条件?
数据科学家在金融服务领域工作的最大优势之一是用例的丰富性和数据科学家能够产生的实际世界影响。当然,还有所有在任何面向客户的业务中常见的应用,例如个性化体验、针对性的交叉销售优惠或预防客户流失的主动策略。但银行、保险公司以及它们的金融科技挑战者以许多其他有趣且有影响力的方式使用数据和分析。
示例包括:
-
使用替代数据,从卫星图像、电信提供商、物联网网络或社交媒体等来源提取,以改善保险风险定价、将贷款扩展到传统上被排除的客户群体或生成投资创意
-
网络分析创建客户生态系统的详细图像——客户、供应商、员工和所有者——这些图像有助于检测和调查恐怖融资、洗钱或人口贩运的案例
-
自然语言处理算法检测投资银行中的潜在内幕交易
-
图像识别算法自动处理大多数汽车保险索赔
-
计算拟议金融投资的环境足迹,例如新的工业设施或甚至个人抵押贷款
许多数据科学家第二个吸引力将是数据集的广度和深度,这些数据集可以用来生成有意义的见解。银行和保险公司通常能够获取大量数据,如人口统计、交易和关系,涵盖宏观层面以及个人客户层面。尽管使用这些数据存在一些限制,但高质量的数据集通常可以追溯多年,这对于构建预测模型来说是数据科学家的梦想。
金融服务公司在数据和技术上的开支规模以及数据生态系统的相对成熟度也可以使其对数据科学家具有吸引力。例如,大多数银行在技术上的年度收入支出超过 10%。数据和分析的支出是其中越来越重要的组成部分,并且对于许多大型公司来说,每年的支出很容易达到或超过数亿美元——这一数字仅次于科技行业中最大的公司。因此,多年的数据支出也使许多公司拥有相对成熟的数据团队。因此,数据科学家可能会发现现有的支持系统,而无需独自管理从数据管道到数据治理的一切。
最后,在大多数地区,银行、保险公司和金融科技公司通常是数据科学家的高薪雇主。尽管这本身很有吸引力,但它也是对这些公司重视数据科学的价值和其对长期职业发展的影响的有用指标。在至少一家主要的全球银行中,首席数据和分析官现在直接向集团首席执行官汇报。
当然,有一个陷阱。使数据科学家在银行和保险公司工作有趣的一切,特别是大公司,也可能使其在某些时候变得繁琐和令人沮丧。一些数据科学家可能纯粹将这些视为挑战;其他人可能还将其视为自我发展的机会,并产生更大的影响。
鉴于行业中数据和分析的高风险使用,存在高标准的信任要求,以证明数据和模型足够适用于现实生活中的使用。例如,如果数据科学家正在构建一个预测模型,该模型可能被用来拒绝某人贷款或保险,或将某人标记为潜在的洗钱者,那么他们应该预计会受到大量审查。
类似地,鉴于客户经常将生活中最隐私的方面——例如他们的收入或医疗历史——托付给银行和保险公司,数据科学家可以发现复杂的数据可用性和可用性控制。数据隐私、主权、伦理和安全问题存在于各个行业,但很少有其他行业在管理这些问题上投入如此多的时间和精力。
对数据及相关技术的大量投资,以及资源充足的数据工程师、分析师和风险专家团队,可以为数据科学家提供良好的成长环境。然而,相同的因素也可能导致日常工作的灵活性丧失。在许多情况下,这可能意味着数据科学家需要面对限制性的技术选择或多步骤流程,带有复杂的控制和交接程序,才能让他们的工作最终在生产中见光。一个特别让银行新员工感到惊讶的领域是需要由独立团队对所有重要模型进行正式验证——这一步骤可能会使正常的模型生命周期增加几周甚至几个月。
所有这些挑战的根本原因是金融服务是全球最受监管的行业之一。对此,大多数银行和保险公司建立了风险与合规的 DNA,特别是在 2008 年金融危机之后。在许多地区,银行和保险公司的高级经理对其雇主的行为承担个人责任,因此任何可能破坏客户信任或违反监管要求的行为都受到特别谨慎的对待。数据和算法的使用符合所有这些标准。毫不奇怪,金融监管机构已成为首批发布有关负责任使用数据和人工智能的指导方针的机构——例如,在新加坡、香港、欧盟、英国和美国。
显然,并不是每个数据科学家都喜欢在银行、保险公司或甚至受监管的金融科技公司工作。然而,如果你符合以下条件,你应该积极考虑在该行业的发展:
-
你对在如此广泛的现实世界应用中运用你的技能并通过更大的金融包容性或更好地将金融资源用于全球气候议程等举措产生深远影响感到兴奋。
-
你认为你的工作不仅仅是建立出色的模型,还包括教育他人了解数据科学的“魔力”,以及赢得非数据科学家的信任。你可能是专家,但你公司中还有许多人不是专家,但仍然必须支持你的工作。
-
你接受在“工作方式”中一定程度的标准化和纪律性是为了实现你工作的广泛影响而必须付出的代价。
-
你将数据使用方面的限制,如隐私、伦理和主权等问题,不仅视为挑战或麻烦,而是作为做正确的事情和个人发展的机会。例如,银行和保险公司是隐私增强技术的早期采纳者之一。大多数也走在算法透明度和公平性倡议的前沿。在这些公司工作可以为你作为数据科学家提供实际机会,建立高性能的同时值得信赖的模型。
简历:Shameek Kundu是一位在技术和商业战略方面都具有领先地位的 AI 专家,并且在金融服务行业推动数据分析/AI 负责任应用的职业生涯中大部分时间都致力于此。他是 TruEra 的首席战略官和金融服务部负责人。他还在英格兰银行 AI 公私论坛和 OECD 全球 AI 伙伴关系中担任职务,并曾参与新加坡金融管理局的AI 公平、伦理、问责与透明度指导委员会。最近,Shameek 在渣打银行担任集团首席数据官,帮助银行在多个领域探索和采用 AI(例如,信贷、金融犯罪合规、客户分析、监控)。
Divya Gopinath是 TruEra 的研究工程师,该公司专注于使 AI 值得信赖和透明。在加入之前,Divya 在 MIT 完成了本科和硕士学位,她的研究集中在为医疗领域构建机器学习算法。Divya 是《Towards Data Science》中有关值得信赖 AI 的主要贡献者,专注于公平性和解决机器学习模型中的偏见问题。
Arridhana Ciptadi 是 TruEra 工程团队的成员。他曾是 Blue Hexagon 的创始团队成员,并担任公司所有机器学习工作的技术负责人。在此之前,他在 Amazon Lab126 担任机器学习科学家,负责为各种 Amazon 产品开发机器学习和计算机视觉技术。Ciptadi 拥有乔治亚理工学院计算机科学博士学位。
相关内容: