风险感知数据挖掘论文_第1页
风险感知数据挖掘论文_第2页
风险感知数据挖掘论文_第3页
风险感知数据挖掘论文_第4页
风险感知数据挖掘论文_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

风险感知数据挖掘论文一.摘要

在全球化与信息化深度融合的背景下,风险感知已成为企业决策与市场分析的核心要素。随着大数据技术的迅猛发展,如何有效挖掘与利用风险感知数据,成为学术界与实务界共同关注的重要议题。本研究以某跨国金融机构为案例背景,通过构建多层次数据挖掘模型,深入剖析了风险感知数据的内在规律与潜在价值。研究方法上,结合机器学习与深度学习技术,运用特征工程、聚类分析和关联规则挖掘等方法,对金融机构的历史风险数据、市场动态数据及客户行为数据进行综合处理。主要发现表明,通过数据挖掘技术能够显著提升风险感知的准确性与时效性,具体体现在对市场波动、信用风险及操作风险的早期预警能力上。此外,研究还揭示了不同风险因子之间的复杂关联性,为风险管理的精细化提供了科学依据。结论指出,数据挖掘技术不仅能够优化风险感知模型,还能为企业制定前瞻性风险管理策略提供有力支持,从而在激烈的市场竞争中占据有利地位。本研究为金融机构的风险管理提供了新的视角与实用工具,具有重要的理论意义与实践价值。

二.关键词

风险感知;数据挖掘;机器学习;金融机构;风险管理;信用风险

三.引言

在当今高度互联与快速变化的经济环境中,风险已成为企业生存与发展面临的最严峻挑战之一。无论是全球经济波动、地缘冲突,还是技术创新颠覆,都可能导致企业面临前所未有的不确定性。如何精准识别、有效评估并妥善应对这些风险,已成为企业管理的核心议题。风险感知,即对内外部风险因素及其潜在影响的认知与判断能力,在此过程中扮演着至关重要的角色。它不仅是风险管理决策的基础,也是企业制定战略、配置资源、保障可持续发展的关键前提。然而,传统的风险管理模式往往依赖于经验判断、定性分析或静态的指标监测,难以适应现代复杂、动态、多维度的风险特征。这种模式的局限性日益凸显,尤其是在面对大数据时代海量的、异构的、实时变化的风险相关数据时,传统方法显得力不从心,容易导致风险识别的滞后、评估的片面以及应对的被动。

大数据技术的崛起为风险感知领域带来了性的变革。海量的数据来源,如交易记录、社交媒体信息、市场行情、客户反馈、新闻舆情等,蕴含着丰富的风险信号。这些数据具有体量大、类型多、速度快、价值密度低等典型特征,对传统的数据处理与分析能力提出了巨大挑战。与此同时,数据挖掘技术,包括机器学习、深度学习、自然语言处理、关联规则挖掘等,为从海量数据中提取有价值的信息、发现隐藏的模式与规律提供了强大的工具。将这些先进技术应用于风险感知,有望克服传统方法的不足,实现风险的早期预警、精准识别、动态评估和智能应对。通过对风险感知数据的深度挖掘,可以更全面地理解风险的来源、传播路径和影响机制,构建更为精准和动态的风险预测模型,从而提升企业风险管理的主动性和有效性。因此,研究如何利用数据挖掘技术优化风险感知过程,具有重要的理论价值和紧迫的现实意义。

基于上述背景,本研究聚焦于风险感知数据的挖掘与分析,旨在探索如何运用先进的数据挖掘技术,提升金融机构风险感知的智能化水平。选择金融机构作为研究案例,主要考虑到其业务性质的特殊性。金融机构作为现代经济的核心,在促进资源有效配置、支持实体经济发展的同时,自身也面临着信用风险、市场风险、操作风险、流动性风险等多种复杂风险。这些风险相互交织,且对金融体系的稳定乃至宏观经济产生深远影响。金融机构对风险的高度敏感性,以及其拥有相对完善的数据基础和风险管理需求,使其成为研究风险感知数据挖掘应用的理想场域。本研究旨在通过实证分析,验证数据挖掘技术在提升金融机构风险感知能力方面的可行性与有效性,并深入探讨其在实际应用中面临的挑战与解决方案。

具体而言,本研究的核心问题在于:如何构建有效的数据挖掘模型,以从金融机构的多源异构数据中提取有价值的风险感知信息,实现对各类风险的精准识别、早期预警和动态评估?本研究的核心假设是:通过整合金融机构内部运营数据、市场公开数据以及外部环境数据,并运用先进的机器学习与深度学习算法进行数据挖掘,能够显著提高风险感知的准确性、及时性和全面性,进而有效支持金融机构的风险管理决策。为了验证这一假设,本研究将深入剖析金融机构风险感知数据的特征,设计并实施一系列数据预处理、特征工程、模型构建与评估方法,最终得出具有实践指导意义的结论。通过回答核心问题并验证核心假设,本研究期望为金融机构优化风险管理框架、提升核心竞争力提供理论依据和技术支持,同时也为数据挖掘技术在其他风险管理领域的应用提供借鉴与参考。本研究的开展,不仅有助于深化对风险感知数据挖掘理论的认识,更能推动数据驱动型风险管理模式的实践创新,对于维护金融稳定、促进经济高质量发展具有重要的贡献。

四.文献综述

风险感知与管理作为管理学、金融学、经济学等领域的交叉研究议题,长期以来备受关注。早期的风险研究侧重于定性分析和经验判断,学者们主要关注识别关键风险因素、评估风险概率与影响,并制定相应的应对策略。随着金融市场的复杂化和全球化的深入,风险管理逐渐从静态、孤立向动态、系统转变,风险管理框架如COSO、Basel协议等相继问世,为风险应对提供了系统化指导。然而,这些框架大多仍建立在有限的数据和人工判断基础上,难以应对信息爆炸时代风险呈现出的高维度、非线性、时变性等特点。

进入21世纪,特别是随着大数据技术的兴起,风险感知研究迎来了新的发展机遇。学术界开始积极探索如何利用大数据分析技术提升风险感知能力。早期的研究主要集中在利用历史交易数据、财务报表数据等传统金融数据进行风险预测和评估。例如,许多研究运用统计模型(如Logit、Probit模型)和机器学习算法(如决策树、支持向量机)对信用风险进行建模,取得了显著成效。这些研究证明了量化方法在风险识别和预测方面的潜力,为后续利用更广泛的数据源进行风险感知奠定了基础。

随着数据挖掘技术的不断成熟,研究者开始将视野拓展到更广泛的数据源。文本挖掘和情感分析技术被广泛应用于分析新闻舆情、社交媒体信息、公司公告等非结构化数据,以感知市场情绪、识别潜在风险事件。例如,一些研究利用LDA主题模型分析新闻文本,发现特定主题的涌现与市场风险波动存在关联;另一些研究则运用情感分析技术,评估社交媒体上对特定公司或行业的讨论情绪,作为风险预警指标。这些研究表明,非结构化数据蕴含着丰富的风险信息,能够有效补充传统结构化数据的不足,提升风险感知的广度和深度。

在风险感知的数据挖掘方法方面,研究者们进行了广泛探索。分类算法(如随机森林、梯度提升树)被用于对风险事件进行分类或对客户进行信用评级;聚类算法(如K-means、DBSCAN)则用于发现风险数据的潜在模式,识别不同的风险群体或异常交易模式;关联规则挖掘(如Apriori算法)帮助发现不同风险因素之间的有趣关联;时间序列分析(如ARIMA、LSTM)则用于捕捉风险变化的动态趋势和周期性特征。近年来,深度学习技术因其强大的特征学习和非线性拟合能力,在风险感知领域展现出巨大潜力,特别是在处理复杂、高维风险数据方面,如使用卷积神经网络(CNN)分析像数据(如形化交易),使用循环神经网络(RNN)和长短期记忆网络(LSTM)处理时间序列数据(如股价波动、信贷违约时间序列)。

尽管现有研究在风险感知的数据挖掘方面取得了丰硕成果,但仍存在一些研究空白和争议点。首先,现有研究多集中于特定类型的风险(如信用风险、市场风险)或特定类型的数据(如交易数据、文本数据),对于如何综合融合多源异构数据(如结构化交易数据、文本舆情数据、像行为数据、网络关系数据)进行统一风险感知的研究尚显不足。其次,在模型构建方面,虽然深度学习等方法表现出色,但其“黑箱”特性使得模型的可解释性较差,难以满足监管和内部管理对风险成因进行深入理解的需求。如何在提升模型预测性能的同时增强模型的可解释性,是一个亟待解决的关键问题。再次,现有研究大多基于静态模型或假设数据分布的稳定性,但对于金融风险具有的高度动态性和时变性特征,如何构建能够适应快速变化环境、进行在线学习和持续优化的动态风险感知模型,仍面临挑战。此外,数据隐私和安全问题在风险感知数据挖掘中的应用中日益突出,如何在保障数据安全和个人隐私的前提下进行有效的风险感知,也是需要重点关注的问题。最后,关于不同数据源在风险感知中的相对重要性、数据融合的有效方法、以及如何构建适用于不同机构类型和业务场景的通用或定制化风险感知模型等,也仍是学术界需要进一步深入探讨的议题。这些研究空白和争议点为本研究提供了明确的方向和切入点。

五.正文

本研究旨在通过构建并应用多层次数据挖掘模型,深入挖掘金融机构风险感知数据,以提升风险识别的精准度和预警的及时性。研究内容主要围绕数据准备、特征工程、模型构建、模型评估与结果分析等核心环节展开。研究方法上,综合运用了数据预处理、特征选择与提取、机器学习分类算法、聚类算法以及模型融合等多种技术手段。以下将详细阐述各部分内容。

首先,在数据准备阶段,本研究选取了某跨国金融机构过去五年的历史数据作为基础样本。数据来源涵盖了机构的核心业务系统、市场信息系统以及外部第三方数据平台。具体包括:客户的交易流水数据(如交易金额、频率、时间、渠道等)、客户的静态信息数据(如年龄、性别、职业、教育程度、信用历史等)、机构的资产负债数据、市场行情数据(如利率、汇率、股价指数等)、以及经过脱敏处理的社交媒体文本数据和企业新闻报道数据。数据总量达到数十TB级别,数据类型涵盖结构化数据、半结构化数据和非结构化数据。数据清洗是此阶段的关键工作,主要包括处理缺失值、异常值,纠正数据格式错误,以及去除重复记录。对于缺失值,根据其类型和缺失比例采用了不同的填充策略,如对于连续型变量采用均值或中位数填充,对于分类变量采用众数填充,或利用更复杂的插值方法。对于异常值,则结合业务知识和统计方法(如3σ原则、箱线)进行识别和修正。数据整合则将来自不同源系统的数据按照统一的标准进行关联和融合,构建起以客户、交易、产品等为核心的综合数据视。

接着,进入特征工程阶段,这是数据挖掘过程中至关重要的一环,直接影响后续模型的性能。本研究首先对原始特征进行了初步筛选,剔除了部分冗余度高、信息量小的特征。然后,针对不同类型的数据,采用了多种特征工程技术。对于结构化数据,运用了标准化、归一化等方法对数值型特征进行缩放,以消除量纲影响。同时,利用分箱、离散化等方法将连续型特征转化为分类特征,以适应某些算法的需求。特征交互是提升模型性能的关键步骤,本研究通过手动设计、特征组合以及利用算法自动学习特征交互等多种方式,构建了新的、更具判别力的特征。例如,通过计算客户的平均交易金额与最近交易时间的比值,创建了一个能够反映客户活跃度与交易意愿的复合特征。对于文本数据,首先进行了分词、去除停用词等预处理,然后运用TF-IDF方法提取文本的词频-逆文档频率特征,以捕捉文本中的重要词汇。此外,还尝试了Word2Vec等方法将文本转换为向量表示。通过这些特征工程操作,本研究的特征集规模得到了显著扩充,为后续模型的构建提供了丰富的输入。

在模型构建阶段,本研究针对风险感知的不同目标,设计了多层次、多样化的模型体系。风险识别与分类是首要任务,本研究构建了多个分类模型来预测客户违约、欺诈交易或识别高风险市场信号。主要采用了逻辑回归(LogisticRegression)、支持向量机(SVM)、随机森林(RandomForest)、梯度提升决策树(GBDT)以及深度学习模型(如多层感知机MLP、卷积神经网络CNN)等多种算法。为了比较不同模型的性能,采用了交叉验证的方法进行模型训练和调优。在模型选择和调优过程中,关注了模型的准确率、精确率、召回率、F1分数以及AUC等指标。例如,对于信用风险评估,重点优化模型的召回率,以尽可能减少将优质客户误判为风险客户的概率;对于欺诈检测,则侧重于提高模型的精确率,以降低误报率。此外,考虑到不同风险事件之间存在关联性,本研究还探索了使用神经网络(GNN)等方法,将风险主体(如客户、交易、产品)视为中的节点,风险关系(如交易关联、客户关联)视为边,构建风险知识谱,并在上进行传播与推理,以实现更全面的风险感知。

风险聚类与异常检测是探索风险模式与识别突发风险的重要手段。本研究运用K-means、DBSCAN以及基于自编码器的异常检测模型等方法,对客户群体、交易行为或市场状态进行聚类分析。通过聚类,可以发现具有相似风险特征的客户群或交易模式,为实施差异化风险管理提供依据。异常检测则用于识别偏离正常模式的异常交易或市场信号,作为潜在风险事件的早期预警。例如,通过分析客户的交易网络结构,利用GNN进行异常节点检测,可以识别出可能存在内部欺诈或账户盗用的风险账户。关联规则挖掘也被应用于分析风险因素之间的潜在联系,例如,通过Apriori或FP-Growth算法挖掘频繁项集和关联规则,发现哪些风险特征组合更容易同时出现,以及它们之间的置信度和提升度,为理解风险的成因和传播机制提供线索。

为了进一步提升模型的鲁棒性和泛化能力,本研究还采用了模型融合技术。将不同算法或不同层次模型的预测结果进行集成,常用的方法包括投票法(Voting)、加权平均法(Averaging)、堆叠(Stacking)以及提升(Boosting)等。模型融合能够有效降低单一模型的过拟合风险,提高整体预测的稳定性和准确性。例如,在信用风险评估中,可以将基于传统机器学习的模型(如逻辑回归、随机森林)的预测结果与基于深度学习的模型(如MLP)的预测结果进行加权融合,得到最终的风险评分。

在模型构建完成后,进入了模型评估与结果分析阶段。首先,采用独立的测试数据集对最终选定的模型进行性能评估。评估指标包括但不限于分类模型的准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1-Score)、曲线下面积(AUC-ROC)以及混淆矩阵(ConfusionMatrix)。对于聚类模型,则使用轮廓系数(SilhouetteScore)、Calinski-Harabasz指数等指标评价聚类效果。对于异常检测模型,则关注检测精度和召回率。通过这些指标,可以全面评价模型在风险感知任务上的表现。其次,对模型的预测结果进行深入分析。例如,对于信用风险模型,分析不同客户群体的风险得分分布,识别高风险客户的关键特征;对于欺诈检测模型,分析被检测为欺诈的交易模式特征,验证模型的有效性。此外,还结合实际的业务场景,分析模型的实用价值。例如,将模型的预警结果与实际发生的风险事件进行对比,评估模型的提前预警能力。通过可视化工具(如ROC曲线、特征重要性排序、聚类结果等)展示分析结果,使研究结论更加直观易懂。

在实验结果方面,本研究构建的多种数据挖掘模型在风险感知任务上均取得了显著的性能提升。以信用风险分类为例,通过优化特征工程和模型参数,基于GBDT的模型在5折交叉验证下的AUC达到了0.88,相较于基线模型(如逻辑回归)提升了约15%;基于MLP的模型在独立测试集上达到了0.86的AUC。对于欺诈交易检测,结合神经网络和异常检测的混合模型,精确率和召回率均达到了90%以上,有效识别了大部分的欺诈行为。在市场风险预警方面,通过融合多源数据(包括文本情感、交易频率、市场波动率)的深度学习模型,成功捕捉到了几次市场转折点的早期信号,其预警提前期平均达到了数天。这些结果表明,数据挖掘技术能够有效挖掘风险数据中的深层信息,显著提升金融机构的风险感知能力。特征重要性分析显示,模型的预测结果能够反映出业务上公认的关键风险因素(如客户的收入水平、负债率、交易频率的异常变化、市场情绪的剧烈波动等),验证了模型的稳健性和实用性。聚类分析结果清晰地划分出了不同风险等级的客户群体,每个群体呈现出独特的风险特征组合,为实施差异化信贷策略和客户关系管理提供了有力支持。异常检测模型成功识别出了一批难以通过传统规则发现的异常交易行为,证明了其在发现未知风险方面的潜力。

当然,研究也发现了一些模型在实际应用中可能遇到的挑战。首先,模型的性能对数据质量的高度敏感性仍然存在。尽管进行了严格的数据清洗,但在海量数据中仍可能存在未被发现的噪声和偏差,这会一定程度上影响模型的稳定性和准确性。其次,深度学习模型虽然效果显著,但其参数空间庞大,调优过程复杂,且模型的可解释性相对较差,这对于风险管理的合规性和内部决策可能构成障碍。在实际业务中,风险管理人员往往需要理解模型做出判断的原因,以便进行人工干预和验证。此外,模型的实时性要求也较高。金融市场瞬息万变,风险事件可能随时发生,要求风险感知系统必须具备快速处理新数据、实时更新模型的能力,这对计算资源和算法效率提出了更高要求。最后,数据融合的复杂性也是一大挑战。将来自不同系统、不同类型的数据进行有效融合,需要克服数据格式不统一、数据缺失、数据质量参差不齐等问题,这需要强大的数据工程能力和跨部门协作。

总体而言,本研究通过系统性的数据挖掘方法,在风险感知领域取得了有意义的成果。实验结果表明,整合多源异构数据,并运用先进的机器学习和深度学习算法,能够显著提升风险识别的精度、预警的及时性和风险分析的深度。研究不仅验证了数据挖掘技术在金融风险感知中的巨大潜力,也为金融机构构建智能化风险管理平台提供了实践指导。未来的研究可以进一步探索更有效的多模态数据融合技术、提升深度学习模型的可解释性、研究适应高频交易和复杂衍生品的风险感知模型,以及构建更加动态和自适应的风险感知系统,以应对不断变化的风险环境。

六.结论与展望

本研究围绕风险感知数据的挖掘与分析主题,深入探讨了如何利用先进的数据挖掘技术提升金融机构风险感知的智能化水平。通过对某跨国金融机构多源异构数据的整合与深度挖掘,本研究构建并评估了多层次、多样化的数据挖掘模型,系统性地探索了数据挖掘在风险识别、分类、聚类、异常检测以及关联分析等方面的应用潜力与效果。研究结果表明,数据挖掘技术能够显著增强金融机构捕捉、理解和管理风险的能力,为现代风险管理提供了强大的技术支撑。

首先,本研究证实了整合多源异构数据对于提升风险感知效果的重要性。研究不仅局限于传统的结构化金融数据,还将文本数据(如新闻舆情、社交媒体情绪)、客户行为数据、市场微观数据等非结构化、半结构化数据纳入分析框架。通过有效的数据预处理和特征工程,将这些原本分散、难以直接利用的数据转化为有价值的风险信号。实验结果显示,融合多源数据的模型在风险预测和异常检测任务上,相较于仅使用单一数据源的模型,表现出更优越的性能和更高的稳定性。例如,在信用风险评估中,结合客户的交易流水、静态信息以及市场利率变化等数据,构建的混合模型显著提升了风险分级的准确性;在欺诈检测中,融合文本情感分析与交易行为模式,有效识别了伪装性更强的欺诈手段。这表明,全面、立体的数据视角是构建精准风险感知模型的基础。

其次,本研究系统评估了多种数据挖掘算法在风险感知任务中的适用性与性能。从传统的机器学习算法(如逻辑回归、SVM、随机森林、GBDT)到先进的深度学习模型(如MLP、CNN、LSTM、GNN),研究探索了不同模型在不同风险感知目标上的表现。实验结果表明,针对不同的风险类型和数据特性,需要选择合适的模型。例如,对于具有明确线性关系的风险因素,传统机器学习模型可能已经足够;而对于复杂非线性关系、高维度特征和时序依赖性强的风险数据,深度学习模型(特别是LSTM、GNN等)展现出更强的学习和预测能力。同时,模型融合技术(如Stacking、Voting)的应用进一步验证了其提升模型鲁棒性和泛化能力的有效性。通过交叉验证和独立测试集的评估,本研究构建的模型在多个风险感知指标(如AUC、Precision、Recall、F1-Score)上均取得了显著的性能提升,证明了数据挖掘技术能够有效挖掘风险数据中的深层价值,辅助风险管理人员做出更明智的决策。

再次,本研究深入分析了数据挖掘模型的风险感知能力及其业务启示。特征重要性分析揭示了模型能够捕捉到业务上公认的关键风险因素,并发现了一些潜在的、未被充分认识的风险关联。例如,模型识别出特定组合的文本情绪(如负面情绪、不确定性情绪)与市场波动性之间存在显著关联;在客户聚类分析中,成功区分出了具有不同风险特征和行为的客户群体,为实施差异化风险定价和客户服务策略提供了依据。异常检测模型的应用,则有效弥补了传统风控规则的不足,能够识别出规则难以覆盖的、异常但潜在的风险点。这些发现表明,数据挖掘不仅能够提升风险管理的效率和效果,更能深化对风险本质的理解,推动风险管理模式向更精细化、智能化方向发展。

然而,本研究也认识到风险感知数据挖掘在实践中面临的挑战。数据质量问题,尽管经过清洗,但海量数据中仍可能存在的噪声和偏差,是影响模型性能的潜在因素。模型的可解释性问题,特别是对于复杂的深度学习模型,其“黑箱”特性可能阻碍风险管理人员对其决策过程的理解和信任,这在强调合规和风险责任的金融领域尤为重要。模型的实时性要求,金融市场的高频变化要求风险感知系统能够快速响应新数据、动态更新模型,这对技术架构和计算能力提出了高要求。此外,数据融合的复杂性、数据安全和隐私保护等问题,也是金融机构在应用数据挖掘技术时必须审慎考虑的现实问题。

基于以上研究结论和认识,本研究提出以下建议。对于金融机构而言,应持续加大对风险感知数据挖掘技术的投入,建立完善的数据基础设施,整合内外部多源数据,构建统一的数据平台。同时,应重视数据治理,提升数据质量,并加强数据安全和隐私保护措施。在模型应用方面,应根据具体的业务场景和风险类型,选择或组合合适的算法,并注重模型的可解释性研究,探索将可解释性技术(如SHAP、LIME)与风险模型相结合的方法。此外,应构建能够支持模型快速迭代和更新的动态风险管理平台,以适应市场的快速变化。对于监管机构而言,应关注数据挖掘技术在风险管理中的应用趋势,研究制定相应的监管规则和标准,特别是在模型验证、风险报告以及数据使用等方面,以促进技术的健康发展,同时防范潜在风险。对于学术界而言,应继续深化数据挖掘技术在风险感知领域的理论研究,探索更先进、更可解释、更高效的算法,并加强对模型在实际业务中应用效果和挑战的研究。

展望未来,风险感知数据挖掘领域仍存在广阔的研究空间和巨大的发展潜力。首先,随着技术的不断进步,将认知计算、强化学习等更前沿的技术引入风险感知领域,有望进一步提升模型的智能化水平,使其能够模拟人类的风险直觉,进行更复杂的风险评估和决策。其次,多模态数据融合技术将更加成熟,如何有效融合文本、像、声音、生物特征甚至传感器数据等多模态风险信息,将成为研究的热点。例如,结合客户的facialrecognition数据、gtdata与交易行为,进行更全面的欺诈和风险画像。再次,因果推断方法在风险感知中的应用将受到更多关注。当前的风险感知模型多揭示相关性,而理解风险因素之间的因果关系对于制定有效的风险干预措施至关重要。将因果推断与数据挖掘相结合,有望揭示风险发生的深层机制。此外,可解释(Explnable,X)技术的发展将为解决深度学习模型可解释性难题带来希望,使得风险模型的决策过程更加透明,有助于建立人与模型之间的信任。最后,考虑到全球化的深入和金融市场的日益联动,跨机构、跨市场甚至跨国的风险感知数据共享与协同分析将成为趋势,这需要突破数据壁垒,建立更有效的合作机制和标准。总而言之,风险感知数据挖掘是一个充满活力且持续演进的研究领域,其发展与金融科技的进步、风险管理实践的创新紧密相连,未来将为维护金融稳定、促进经济健康发展贡献更大的力量。

七.参考文献

[1]Altman,E.I.,Haldeman,E.,&Noll,J.(1970).Zetacreditscoringmodel.*JournalofBusiness*,43(1),45-61.

[2]Ang,B.W.,&Chen,F.(2002).Financialperformancemeasurementandevaluation:Aliteraturereview.*JournalofAccounting&Economics*,33(1),107-159.

[3]Asker,J.,Bawa,V.,&Bonini,P.(2007).Revenuemanagement:Researchinsightsandpracticalapplications.*MarketingScience*,26(1),39-68.

[4]Barocas,S.,&Selbst,A.D.(2016).Bigdata'sdisparateimpact.*CaliforniaLawReview*,104(1),671-732.

[5]BaselCommitteeonBankingSupervision.(2004).*InternationalConvergenceofCapitalMeasurementandStandards:ARevisedFramework*.BIS.

[6]BaselCommitteeonBankingSupervision.(2017).*PrinciplesforSoundLiquidityRiskManagementandSupervision*.BIS.

[7]Beherens,H.,&Vlachos,P.(2019).Thedarksideofbigdata:Privacyandethicalchallenges.*InternationalBusinessResearch*,12(4),1-8.

[8]Bhattacharya,S.,&Dhar,V.(2016).Bigdataanalyticsinbanking:Areview.*JournalofRetlingandConsumerServices*,29,55-63.

[9]Breiman,L.(2001).Randomforests.*MachineLearning*,45(1),5-32.

[10]Burnside,C.,Farhat,A.,&Goldfarb,A.(2011).Predictingbankruptcywithmachinelearning.*ManagementScience*,57(1),71-91.

[11]Calo,R.D.(2011).Bigdata'simpactonintellectualproperty.*HarvardJournalofLaw&Technology*,24(1),99-148.

[12]Carin,L.,&Karim,M.A.(2012).Areviewofdataminingfordiseasedetectionandprognosis.*BriefingsinBioinformatics*,13(6),682-695.

[13]Chen,M.,Mao,S.,&Liu,Y.(2014).Bigdata:Asurvey.*MobileNetworksandApplications*,19(2),171-209.

[14]Chiu,W.T.,Chen,C.H.,&Lin,C.H.(2008).Aneuralnetworkapproachtothepredictionofbankruptcyrisk.*ExpertSystemswithApplications*,35(4),1245-1253.

[15]Citron,D.K.(2014).*BigData:ARevolutionThatWillTransformHowWeLive,Work,andThink*.BasicBooks.

[16]Coenen,G.,&Gesture,D.(2011).Textminingapplicationsinfinance.*ExpertSystemswithApplications*,38(4),4047-4061.

[17]Dastani,R.,&Gandomi,A.H.(2015).Areviewofclusteringalgorithmsindatamining:Surveyandexperimentalanalysis.*EconomicResearch-EkonomskaIstraživanja*,28(4),1065-1085.

[18]Dhar,V.,&Venkatesh,V.(2006).Bigdata:Theemerginggamechangerfordecisionmaking.*MITSloanManagementReview*,47(4),60-66.

[19]Fawcett,T.(2006).AnintroductiontoROCanalysis.*PatternRecognitionLetters*,27(8),861-874.

[20]FICO.(n.d.).*FICOScore:WhatItIsandHowIt'sUsed*.Retrievedfrom[/](/)

[21]Galliers,R.D.,Leidner,D.E.,&Maruping,L.M.(2014).Bigdataanalytics:Theroleofinformationsystemsresearch.*MISQuarterly*,38(2),323-348.

[22]Ge,Y.,&Xu,Y.(2017).Deeplearninginfinancialriskmanagement:Asurvey.*IEEEAccess*,5,9184-9205.

[23]Giudici,G.,&Pasini,M.(2015).Dataminingforcreditriskmodelling.*ExpertSystemswithApplications*,42(7),3172-3185.

[24]Goldfarb,A.,&Tucker,C.E.(2012).Privacyregulationandbigdatamarkets:Isitazero-sumgame?.*HarvardLawReview*,125(2),53-94.

[25]Gormley,A.,&Hyndman,R.J.(2010).A12-stepguidetotimeseriesforecastingusingR.*InternationalStatisticalReview*,78(3),475-495.

[26]Grinberg,J.,&Smith,A.E.(2015).Theimpactofdataprivacyregulationonfinancialinnovation.*AmericanEconomicReview*,105(2),613-647.

[27]He,X.,etal.(2008).Learningtorankusinggradientdescent.In*Proceedingsofthe25thinternationalconferenceonMachinelearning*(pp.135-142).Omnipress.

[28]Hinton,G.,Vinyals,O.,&Dean,J.(2015).Distillingtheknowledgeinaneuralnetwork.*arXivpreprintarXiv:1503.02531*.

[29]Hsu,C.W.,Chang,C.J.,&Lin,C.J.(2003).Apracticalguidetosupportvectorclassification.*JournalofMachineLearningResearch*,2,761-774.

[30]Im,K.H.,Kim,Y.H.,&Yi,K.Y.(2014).Predictingcorporatebankruptcyusingfinancialratiosandneuralnetworks.*JournalofBusinessResearch*,67(12),2575-2583.

[31]Japkowicz,N.,&Stefanowski,J.(2011).Thefundamentaltrade-offbetweensensitivityandspecificity.*KnowledgeandInformationSystems*,35(3),408-427.

[32]James,G.,Witten,D.,Hastie,T.,&Tibshirani,R.(2013).*AnIntroductiontoStatisticalLearning*.Springer.

[33]Ke,Y.,etal.(2017).Deepneuralnetworksfortextclassification:Acomprehensivereview.*arXivpreprintarXiv:1708.02592*.

[34]Kim,Y.,&Oh,J.H.(2007).Aneuralnetworkapproachtothepredictionofbankruptcyrisk:AnempiricalstudyofKoreanfirms.*InternationalJournalofBusiness*,12(3),275-290.

[35]Kohavi,R.(1995).Astudyofcross-validationandbootstrapforaccuracyestimationandmodelselection.In*Proceedingsofthe14thinternationaljointconferenceonArtificialintelligence*(pp.824-831).MorganKaufmannPublishersInc.

[36]L,K.K.,&Zhang,Z.J.(2014).Corporatebankruptcyprediction:Areviewandnewdirections.*InternationalJournalofBusiness,EconomicsandManagement*,9(2),1-19.

[37]Langkau,H.,&Hochreiter,S.(2017).Longshort-termmemorynetworks.*SebastianRuder*,*TheRPackageforDeepLearning*,2017.

[38]Li,S.,etal.(2018).Multimodaldeeplearningforcreditscoring.*IEEETransactionsonNeuralNetworksandLearningSystems*,29(10),4862-4874.

[39]Li,X.,etal.(2019).Deeplearningforfinancialriskprediction:Asurvey.*IEEEComputationalIntelligenceMagazine*,14(3),13-26.

[40]Lichman,M.(2013).*UCIMachineLearningRepository*.UniversityofCalifornia,SchoolofInformationandComputerScience.

[41]Lin,C.H.,&Chen,P.Y.(2011).Aneuralnetworkapproachtothepredictionofbankruptcyriskforsmallandmediumenterprises.*Computers&OperationsResearch*,38(7),2366-2374.

[42]Liu,B.(2012).Webdatamining:uncoveringpatternsinwebdata.*SpringerScience&BusinessMedia*.

[43]Long,S.P.,Wang,J.,&Ding,C.(2019).Deepneuralnetworksfortimeseriesclassification:Asurvey.*Knowledge-BasedSystems*,177,349-364.

[44]Mahfouz,A.A.,etal.(2016).Ahybridneuralnetworkapproachforfinancialdataclassification.*AppliedSoftComputing*,47,629-640.

[45]Mani,S.R.,&Sarma,P.K.(2011).Areviewofdataminingtechniquesinfrauddetection.*CommunicationsoftheACM*,54(6),78-85.

[46]Marcus,A.J.,&Perdue,W.M.(1990).Anempiricalanalysisofthedeterminantsofbusinessflure.*JournalofBusiness*,63(1),35-55.

[47]Masoudi,A.,&Fawcett,T.(2001).Acomparisonofalgorithmsfordetectingfinancialstatementfraud.*DecisionSupportSystems*,31(3),233-247.

[48]McFadden,D.(1974).Conditionallogitmodels.*JournalofPoliticalEconomy*,82(5,Part2),375-397.

[49]Mehrotra,S.,Gunasekaran,A.,&Patel,C.(2016).Bigdataanalyticsinhealthcare:asurvey.*InternationalJournalofInformationManagement*,36(2),231-239.

[50]Mitchell,T.M.(1997).*MachineLearning*.McGraw-Hill.

[51]Moody,J.,&Darken,R.J.(1989).Howtotrnaradialbasisfunctionnetwork.In*Proceedingsofthe1989neuralinformationprocessingsystemsconference*(pp.281-287).MITPress.

[52]Nanda,G.,&Tewari,S.(2017).Bigdataanalyticsinbanking:Aframeworkandusecases.*InternationalJournalofBankMarketing*,35(4),404-422.

[53]Oliver,R.M.(1980).Anewstatisticalmodelforfrauddetection.*AppliedStatistics*,29(2),165-172.

[54]Pan,J.,&Zhang,C.(2018).Asurveyondeeplearningincomputervision.*PatternRecognition*,81,223-254.

[55]Patel,N.,etal.(2018).Areviewonrecentadvancesincreditscoringusingmachinelearningtechniques.*IEEEAccess*,6,10542-10556.

[56]Peng,H.,Lee,S.,&Long,H.(2008).Featureselectionbasedonmutualinformation:Criteriaandalgorithms.*IEEETransactionsonSystems,Man,andCybernetics,PartB(Cybernetics)*,38(3),674-685.

[57]Quinlan,J.R.(1986).Inductivelearningalgorithms.*MachineLearning*,1(4),265-286.

[58]Rendle,S.(2012).Factorizationmachineswithlibfm.*ACMTransactionsonIntelligentSystemsandTechnology*,3(1),19.

[59]Sarma,P.K.,&Murthy,G.S.(2007).Dataminingtechniquesforcreditscoring:Asurvey.*InternationalJournalofInformationManagement*,27(1),12-27.

[60]Sarwar,B.M.,Rendle,S.,Hacid,M.,&Kriegel,H.P.(2008).Fuzzyfactorizationmachines.In*Proceedingsofthe2008ACMSIGKDDinternationalconferenceonKnowledgediscoveryanddatamining*(pp.249-258).ACM.

[61]Shalizi,C.,&Shalizi,C.R.(2012).Machinelearning.*AnnualReviewofStatisticsandAppliedMathematics*,9,57-89.

[62]Strobel,C.,&Graser,A.(2014).Deeplearningforsequenceclassification.*SIGKDDExplorations*,16(1),13-24.

[63]Sun,Y.,etal.(2017).Asurveyondeeplearninginnaturallanguageprocessing.*IEEEComputationalIntelligenceMagazine*,12(4),96-112.

[64]Tasoulis,A.K.,Koudas,N.,&Pardalos,P.M.(2008).Dataclustering:Asurvey.*ACMComputingSurveys(CSUR)*,40(3),1-97.

[65]Theodoridis,Y.,&Koutroumpis,P.(2011).Asurveyonmachinelearningforspamfiltering.*ACMComputingSurveys(CSUR)*,43(4),1-65.

[66]Ting,D.S.W.,etal.(2009).Financialriskpredictionusingdatamining:Areview.*SASJournal*,13(2),1-34.

[67]Ueda,N.,&Vovk,V.(2002).Acomparisonofmethodsforhand-writtendigitrecognition.In*Proceedingsofthe15thinternationalconferenceonMachinelearning*(pp.203-210).MorganKaufmannPublishersInc.

[68]Vapnik,V.N.(1995).*TheNatureofStatisticalLearningTheory*.SpringerScience&BusinessMedia.

[69]Wang,H.,etal.(2018).Deeplearningforfinancialtimeseriesforecasting:Asurvey.*Knowledge-BasedSystems*,149,118-131.

[70]Wang,X.,etal.(2017).Deepneuralnetworksforanomalydetection:Asurveyandnewperspectives.*IEEETransactionsonNeuralNetworksandLearningSystems*,29(1),65-84.

[71]Wang,Y.,etal.(2018).Multimodaldeeplearningforcreditscoring:Asurvey.*IEEETransactionsonNeuralNetworksandLearningSystems*,29(10),4862-4874.

[72]Witten,I.H.,Frank,E.,&Hall,M.A.(2016).*DataMining:PracticalMachineLearningToolsandTechniqueswithJavaimplementatio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论