| 数据挖掘在金融行业的运用 |
|
| http://www.cnfp.net 时间:2004-3-29来源:国家外汇管理局湖北省分局 赵涛 |
|
|
 在世界经济全球化进程不断加快的今天,金融业尤其是银行业的竞争也日益激烈,中国的金融业如何应对?本文试图介绍数据挖掘技术在提高我国金融业竞争力方面的作用,在借鉴国外成功经验的基础上,为我国金融业有效利用数据挖掘技术提出有关建议。
一、金融业信息化竞争的新趋势 随着更多的外资金融机构进入中国市场,金融行、比在争夺优质客户、优秀人才和扩人新业务市场占有率等方面的竞争将会更加激烈。金融企、比又将如何找到自己最有效的客户,如何开发有竞争力的业务呢?毋庸置疑通过信息化建设手段提升中国金融行业的核心竞争力是必然选择的关键手段之一。但是,尽管中国的金融行业进入了数据大集中时代, 目前仍然要面临很多难题,如何从海量的用户信息中分析出个人用户的投资偏好,然后有针对性地提出投资方案:如何对海量的信息进行科学的分析处理,推出新业务, 以及时为决策者提供决策支持,成为摆在金融企业面前的新课题。 由此,数据挖掘技术应运而生。数据挖掘(DataMining)是数据库中知识发现的最核心部分。根据决策目标,分析海量数据、确立分析方法、构建数学模型、定制应用系统、提供决策支持正是数据挖掘的原则和目标。具体到金融行业,数据挖掘技术应用的价值在于帮助金融企业分析影响其业务的关键因素,帮助金融企业增加收入、降低成本,使金融行业的管理决策更趋科学,客户分析更趋精确。这一新兴的数据管理技术,必将成为金融业数据管理的新热点,把信息化推向又个新高峰。 二、什么是数据挖掘 1.数据挖掘概述 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一种从大型数据库或数据仓库中提取隐藏的预测性信息的新技术。它能开采出潜在的模式,找出最有价值的信息,指导商业行为或辅助科学研究。数据挖掘是一门广义的交叉学科,它汇聚了不同领域的研究者尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。 2.数据挖掘的流程 (1)数据取样。通过对数据样本的精选,不仅能减少数据处理量,节省系统资源,而且能通过对数据的筛选,使数据更加具有规律性。 (2)数据探索。数据探索就是对数据深入调查的过程,从样本数据集中找出规律和趋势。 (3)数据调整。通过上述两个步骤的操作,对数据的状态和趋势有了进一步的了解以体现对状态的有效描述。 (4)模型化。在问题进——步明确,数据结构和内容进一步调整的基础上,就可以建立模型。这一步是数据挖掘的核心环节,运用神经网络、决策树、数理统计、时间序列分析等方法来建立模型。 (5)评价。从上述过程中将会得出一系列的分析结果、模式和模型,这时就要综合它们的规律性,提供合理的决策支持信息。 3.数据挖掘的功能 数据挖掘的日标是从数据库中发现隐含的、有意义的知识,主要有以下五类功能。 (1)自动预测趋势和行为。数据挖掘自动在大型数据库中寻找预测性信息,由数据本身迅速直接得出结论。
(2)关联分析。关联分析的目的是找出数据库中隐藏的关联网,生成带有可信度的规则。 (3)聚类。数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类增强了川门对客观现实的认识,是概念描述和偏差分析的先决条件。 (4)概念描述。概念描述就是对某类对象的内涵进行描述,并概括这类对象的有关特征。 (5)偏差检测。数据库中的数据常有——些异常记录,从数据库中检测这些偏差很有意义。 三、数据挖掘在金融业的具体应用 1.数据挖掘技术的运用步骤 除金融行业外,数据挖掘技术在电信、零售、税务、能源等具有数据海量的特点和深度分析需求的行业都有广泛的应用。虽然在不同的行业可以有不同的应用特点,但是应用的方法都是具有一定的规律的。其运用按照以下步骤进行:确定商业日标一建立数据仓库一分析数据一建立模犁一评价和解释一实施 2.数据挖掘技术在欧洲银行的应用实例 数据挖掘技术在欧洲银行金融领域应用广泛。比如法兰克福——家银行利用IBM推出的——种大范围的多平台数榭挖掘工具,称之为IntelligentMinerforData(nO智育擞据挖掘器)来搜集和处理金融事务中的大量数据。对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣,并可观察金融市场的变化趋势。对账户进行科学的分析和归类,并进行信用评估,保证最大的利润和最小的风险。该银行将数据挖掘应用在三个商业领域:通过市场和客户关系管理达到收益最大化:通过风险管理,如欺诈检测和风险预测达到风险最小化;通过商业流程的再设 计,主要是通过将一些原来由人工工作完成的调查任务由流水线自动处理,以达到提高商业流程(如贷款担保)的成本效率。 利用科学的分析和预测的结果,该银行在几年间实现了最初制定的商业目标: (1)销售收入增加50% 利用IUD对该银行的历史销售数据进行挖掘并展示各种统计指标,分析指标之间的关联度,来发现过去表现出特定购买习惯的客户以及类似的人和行为,删未来的购买行为并建立预测模型,在制定营销策略时对银行的资源进行优化。根据报告,短短三年时间,银行的数个产品线销售提高了50%。 (2)营销费用减少30% 通过数据挖掘,该银行不仅更精确地定位于对特定产品最有前景的目标客户,同时也减少了对不符合预测模型特征的客户的联系。节约了费用。 (3)制定营销战略快速灵活 在瞬间万变的商场,时间就是金钱。该银行使用的IMD具有易用性和强大的统计分析功能,可以快速地建立有相当分析深度和广度的模型。——旦模型建立好了,向决策者发布也非常容易。决策者无需了解任何关于统计分析的知识就可以快速看到过去某一产品和客户之间的逻辑关系,帮助他们可以快速、自信、果断地采取行动。 四、对国内金融业应用数据挖掘的建议 数据挖掘在国内目前尚处初级阶段,绝人部分企业还不具备这方面的知识和技能。但最近两年来,国内一些人型企业尤其是金融机构已经认识到数据挖掘的先进性和必要性,开始了这方面的立项和实施工作。万事开头难,在数据挖掘的启动阶段,最有挑战性的工作之一就是: 如何在市场上林林总总的数据挖掘丁具中进行最佳选择。目前,世界上已经有很多商业公司和研究机构开发出了各自的数据挖掘产品,而且功能和使用简易性也在日益提高,如IBM、CA、SAS、微软等公司的产品,此外,国内公司的相关软件也已逐渐成熟。在进行广泛选择时,应结合企业的实际情况着重考虑以下几点: 1.企业进行数据挖掘的需求定位 如果是短期行为,就购买那些能解决特定问题的软件包或外包给咨询公司。如果是长期使用,就需要购买功能比较丰富,使用比较方便,维护升级比较好的企业型数据挖掘工具。 2.企业自身的技术经验和水平 企业应该根据内部数据挖掘团队的经验和水平,选取一些经过基本培训后就能掌握并立即投入使用的工具。而不要盲目求好,最终导致因不会使用工具而将其束之高搁,从而造成资源的浪费。 3.企业的数据基础 在挑选数据挖掘工具前,公司必须对现有的数据进行评估。如果没有具备进行业务主题数据挖掘的数据或者现有数据格式不合瞒足数据挖掘工具的需求,那就需要等数据具备了,才可考虑购买工具。 4.企业的购买预算 在选择数据挖掘工具时,企业也要结合自身的财务预算来决定。 5.数据挖掘工具的性能 好的工具可以更有效地挖掘出高准确和高价值的信息,在评价工具性能时,主要考察以下几点进行综合评定:数据存取能力、数据处理能力、模型运算能力、自动优化建模能力、可视化技术、兼容性等。
|
|
|