《大数据技术在财务中的应用》课件 项目6 搭建财务初阶应用模型_第1页
《大数据技术在财务中的应用》课件 项目6 搭建财务初阶应用模型_第2页
《大数据技术在财务中的应用》课件 项目6 搭建财务初阶应用模型_第3页
《大数据技术在财务中的应用》课件 项目6 搭建财务初阶应用模型_第4页
《大数据技术在财务中的应用》课件 项目6 搭建财务初阶应用模型_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目六搭建财务初阶应用模型任务一利用pandas,创建供应商筛选模型

利用pandas创建供应商筛选模型业务背景:智融创想集团计划采购一批原材料,现有5家供应商可供选择。企业决定采用QCDS评价体系来综合评估供应商。使用pandas读取和处理评分数据。计算每个供应商的QCDS得分。筛选出最优供应商。

利用pandas创建供应商筛选模型将“供应商综合评分.xlsx”文件放置于Python程序所在的文件夹路径下导入pandas模块,读取供应商综合评分情况

利用pandas创建供应商筛选模型创建名为weights的字典,用于存储各因素的权重。

利用pandas创建供应商筛选模型计算供应商各项得分。计算时,需将各指标得分标准化至0到1之间,以便加权计算。成本越低、交货期越短,得分越高;而质量评分和服务评分越高越好。

利用pandas创建供应商筛选模型计算供应商综合得分。通过访问字典weights的“键”,获取各项指标的权重“值”据此加权计算供应商的各项得分。

利用pandas创建供应商筛选模型选择综合得分最高的供应商。通过df['综合得分'].idxmax(),获取得分最高行的索引。2.用loc索引器定位该行,并赋值给变量best_supplier。

利用pandas创建供应商筛选模型输出最优供应商编号和综合得分。谢谢项目六搭建财务初阶应用模型任务二利用聚类算法,进行产品成本分组

利用聚类算法,进行产品成本分组Python提供了丰富的库和工具,能够解决财务工作中的问题。聚类算法就像是一个“分类小能手”,可以根据数据自身相似性,把数据分成不同的组,这些组被称为“簇”。例如,在分析生产成本时,聚类算法可以把成本结构相似的产品归到同一个簇里,使得同一簇内的数据相似度高,而不同簇之间的数据相似度低。

利用聚类算法,进行产品成本分组业务背景:智融创想集团生产多种产品,管理层希望通过对生产成本数据进行分析,找出成本结构相似的产品群组,以便制定针对性的成本控制策略。每种产品单位生产成本数据如右表所示。os模块是Python标准库的一部分,提供了使用操作系统功能的接口。在进行数据处理和分析时,计算机可能会使用多个线程(即并行处理多个任务),以提高计算效率。可以通过设置环境变量OMP_NUM_THREADS来限制程序使用的线程数量。将OMP_NUM_THREADS设置为1,意味着在聚类计算中仅使用单个线程避免因多线程引发的潜在内存管理问题,确保程序运行的稳定性和可靠性。利用聚类算法,进行产品成本分组scikit-learn是常用的机器学习库。sklearn.preprocessing是scikit-learn库中的一个模块,提供了一系列预处理数据的工具。StandardScaler用于对数据进行标准化处理,将数据特征缩放到均值为0,标准差为1的范围。在聚类分析中,标准化处理有助于消除不同特征之间量纲和尺度差异的影响,提升聚类效果。利用聚类算法,进行产品成本分组

利用聚类算法,进行产品成本分组将“6-2产品生产成本.xlsx”文件存放到Python程序所在路径下,读取产品生产成本数据。通过标准化处理,将每个特征的值调整到均值为0,标准差为1,可以确保所有特征在聚类分析中具有相同的影响力,从而提升聚类效果。利用聚类算法,进行产品成本分组

利用聚类算法,进行产品成本分组KMeans聚类算法,通过指定参数n_clusters,设置数据分成的簇数,每个簇都有一个中心点。设置random_state参数可以确保每次运行算法时,初始中心点相同,从而使结果可重复。参数n_init,表示算法运行次数,并从中选择效果最好的一次(通常是簇内平方和最小的那次)。

在执行KMeans聚类时,fit_predict方法用于对标准化后的数据scaled_data进行训练和预测,结果存储在df的新列“Cluster”中,标明各产品所属的簇,为后续的成本分析和决策制定提供支持。利用聚类算法,进行产品成本分组调用pandas的sort_values方法,按“Cluster”列对df排序,将同一簇的产品集中在一起。利用聚类算法,进行产品成本分组通过可视化图表,呈现聚类结果,展现产品聚类分布。根据可视化结果,不同颜色的点代表不同的簇,显示产品成本结构的相似性。例如,紫色簇的产品在成本上具有相似的特征,可能在原材料、人工和制造费用的比例上有共性。利用聚类算法,进行产品成本分组

利用聚类算法,进行产品成本分组基于聚类结果,企业可针对性制定成本控制策略。对于低成本聚类产品,可考虑维持现有成本结构,同时关注市场动态,防止成本上升。对于高成本聚类产品,重点从成本构成要素入手,寻找成本优化点,如与供应商谈判降低直接材料成本,优化生产流程减少制造费用等.对于中间成本聚类产品,可评估是否有潜力向低成本聚类靠拢,提升产品竞争力。谢谢项目六创建财务初阶应用模型任务三利用pandas,实现财务预算管控

利用pandas,实现财务预算管控大数据技术推动下,pandas为财务预算管控提供高效精准支持。财务人员可快速处理分析大量财务数据。及时发现预算与实际支出差异。助力企业决策。

利用pandas,实现财务预算管控业务场景:创新科技集团是一家多元化企业,涉及多个业务领域。为了更好地控制成本和提高资金使用效率,集团财务部门需要定期核对各部门的财务预算和实际支出情况。具体做法:以部门名称和项目名称为关键维度,对预算和支出数据进行分类与汇总。逐一比对每个部门每个项目的预算金额和实际支出金额,精准查找数据差异。通过核对及时发现预算与实际支出的偏差,以控制成本、提高资金使用效率。导入pandas模块,并将数据输出格式设置为保留两位小数。利用pandas,实现财务预算管控将原始数据“6-3预算与实际支出数据.xlsx”存放到Python程序所在路径下。分别读取预算管理系统导出的预算数据和财务核算系统导出的实际支出数据。利用pandas,实现财务预算管控为了便于后续比对,将预算数据的“预算项目”列和实际支出数据的“支出项目”列统一命名为“预算或实际支出”。利用pandas,实现财务预算管控部门名称是关联两张表的重要维度,根据部门名称,预算或实际支出,汇总数据。利用pandas,实现财务预算管控将汇总后的预算数据和实际支出数据进行合并,并计算每个部门每个项目的预算金额与实际支出金额的差额和差异率。利用pandas,实现财务预算管控筛选出差异率绝对值大于一定阈值(这里设为5%)的项目,查看具体差异情况,并将结果保存到Excel文件中。利用pandas,实现财务预算管控谢谢项目六搭建财务初阶应用模型任务四利用分类算法,进行筹资决策

利用分类算法,进行筹资决策业务场景:智融创想集团计划采用逻辑回归(LogisticRegression)模型,用于筹资决策。逻辑回归是广泛应用于分类任务的算法,可判断事件发生的概率并划分为“是”或“否”的二分类问题。在财务决策中,逻辑回归可判断企业是否适合筹资。模型通过分析财务指标(如资产负债率、盈利能力、现金流状况等)预测企业是否适合筹资扩大经营。该模型提供明确决策依据,帮助企业理解筹资决策的风险和收益。构建逻辑回归模型,需导入必要模块。从sklearn.model_selection模块导入train_test_split函数:划分训练集与测试集。从sklearn.linear_model模块导入LogisticRegression类:创建逻辑回归模型。从sklearn.metrics模块导入accuracy_score和confusion_matrix函数:accuracy_score:计算模型预测的准确率confusion_matrix:生成混淆矩阵,以此评估模型的分类效果。从seaborn和matplotlib.pyplot模块分别导入sns和plt模块:直观展示混淆矩阵利用分类算法,进行筹资决策读取“6-4子公司财务指标历史数据.xlsx”文件,并查看前5行数据,初步了解数据的结构和内容。利用分类算法,进行筹资决策利用分类算法,进行筹资决策将数据集划分为特征(X)和目标变量(y)。X包含除目标列外的所有特征列。y是目标列,表示“是否筹集扩大经营(1表示筹资,0表示不筹资)”。利用分类算法,进行筹资决策将特征数据集X和目标变量y划分为训练集和测试集。test_size=0.2表示测试集占总数据的20%。random_state=42表示设置随机种子。分割后的结果,分别存储在X_train(训练集特征)、X_test(测试集特征)、y_train(训练集目标变量)和y_test(测试集目标变量)中。构建逻辑回归模型进行分类预测。通过LogisticRegression(),创建一个逻辑回归模型实例。使用训练集数据X_train和目标变量y_train,训练模型。利用训练好的模型,对测试集特征X_test进行预测,生成预测结果y_pred利用分类算法,进行筹资决策最后,通过accuracy_score函数,对比测试集的真实目标变量y_test与预测结果y_pred,计算出模型预测正确的样本比例,从而评估模型的分类性能。利用分类算法,进行筹资决策利用分类算法,进行筹资决策对逻辑回归模型的分类结果,进行混淆矩阵评估。混淆矩阵是评估分类模型性能的重要工具,展示了模型预测值与真实值之间的匹配情况。利用分类算法,进行筹资决策通过confusion_matrix函数计算混淆矩阵,并使用seaborn的heatmap函数将其可视化为热力图,直观地展示模型的分类效果。(图例为上页任务的输出结果)

利用分类算法,进行筹资决策混淆矩阵热力图显示模型的分类效果:在实际为“不筹资”样本中,2个正确预测,1个误判为“筹资”。“筹资”样本全部正确预测,无误判。模型整体准确率为75%,分类性能较好,尤其在“筹资”类别上表现优异,但在“不筹资”类别上存在误差,需进一步优化。利用分类算法,进行筹资决策基于训练好的逻辑回归模型,对当前子公司的财务状况进行是否筹资扩大经营的预测。谢谢项目六搭建财务初阶应用模型任务五利用线性回归,创建本量利分析模型

利用线性回归,创建本量利分析模型线性回归(LinearRegression)是广泛应用的数据分析方法。用于确定变量之间线性关系的广泛应用数据分析方法。通过建立数学模型,找到最佳拟合直线,实现因变量对自变量的合理预测与分析。线性回归可精准计算固定成本和变动成本,完成成本性态的科学划分。基于本量利分析理论,利用线性回归计算固定成本和变动成本数据,结合产品单价,可准确计算保本点销售量和保利点销售量。

利用线性回归,创建本量利分析模型业务场景:为加强成本控制和提升运营效率,智融创想集团拟基于本量利分析,测算保本点与保利点,明确达到盈亏平衡以及实现目标利润所需的销售量,其1-12月份的产量和总成本数据,如右表所示。导入所需模块:从scikit-learn库的linear_model模块中,导入LinearRegression类,用于构建线性回归模型。导入pandas模块,用于数据处理。导入matplotlib.pyplot用于绘制可视化图表。利用线性回归,创建本量利分析模型将“6-51-12月份产量和总成本数据.xlsx”文件存放到Python程序所在路径下,读取产量和总成本相关的数据(也可以使用绝对路径)。利用线性回归,创建本量利分析模型为了进行线性回归分析,首先需要从数据集df中提取自变量和因变量。自变量“产量”,将用于预测因变量“总成本”。利用线性回归,创建本量利分析模型创建线性回归模型并初始化。使用model.fit(X,y)拟合数据,学习产量与总成本的线性关系。通过intercept_获取固定成本。通过coef_[0]获取单位变动成本。。利用线性回归,创建本量利分析模型调用model.score(X,y)方法,计算决定系数R²值,R²值衡量了回归模型对观测数据的拟合程度,其取值范围在0到1之间,越接近1表示模型拟合效果越好。利用线性回归,创建本量利分析模型对成本性态分析进行可视化分析,方便直观观察产量与总成本之间的关系。利用线性回归,创建本量利分析模型对成本性态分析进行可视化分析,方便直观观察产量与总成本之间的关系。(图例为上页任务的输出结果)利用线性回归,创建本量利分析模型通过本量利分析,计算保本点销售量,即收入等于总成本的销售量。利用线性回归,创建本量利分析模型计算目标利润为1000000元时的保利点销售量。利用线性回归,创建本量利分析模型谢谢项目六创建财务初阶应用模型任务六利用时间序列,预测股价变动趋势

时间序列定义时间序列是按时间顺序排列的数据点,如每日股价、每月销售额、每年利润。时间序列分析通过观察历史数据找出规律,预测未来数据。在财务分析中,时间序列可分析变化趋势、季节性规律和周期性波动。常用分析方法包括移动平均、指数平滑、ARIMA模型。ARIMA模型结合自回归(AR)、差分(I)和移动平均(MA),适用于非平稳时间序列预测。

自回归模型(AR)

滑动平均模型(MA)

ARMA模型

ARMA模型的应用条件①

平稳性ARMA模型要求:时间序列需平稳,即均值和方差等统计特性不随时间改变。平稳性示例:如某商店每日流量长期稳定,无明显增减趋势。非平稳数据问题:若数据不平稳,ARMA模型预测可能不准确。差分方法:通过一阶差分(用t时刻值减去t-1时刻值)使非平稳数据变得平稳。ARIMA模型:结合差分和ARMA模型,用于处理非平稳时间序列的预测。

ARMA模型的应用条件②

非白噪声时间序列要求:时间序列不能是白噪声序列。白噪声序列特点:完全随机,无可预测模式。示例:抛硬币结果,每次正面或反面概率均为50%,不受之前结果影响。ARMA模型限制:对白噪声序列建立ARMA模型无意义,因模型无法从随机性中找到规律进行预测。

ARIMA模型介绍ARIMA模型结合了自回归(AR)、差分(I)和移动平均(MA)三个部分。模型的参数包括:p(自回归项数):表示模型中包含的过去观测值的数量。d(差分次数):表示为了使时间序列平稳,需要进行的差分次数。一般通过不断尝试差分并检验序列平稳性确定d。q(移动平均项数):表示模型中包含的过去预测误差的数量。自相关函数(ACF)和偏自相关函数(PACF)

自相关函数(ACF):衡量序列中不同时期观测值的相关性。ACF值域:在[-1,1]之间。相关性强度:越接近1或-1,线性相关性越强;越接近0,相关性越弱。ACF图作用:直观显示不同时间间隔下观测值的相关程度。应用:帮助确定MA模型的阶数q。自相关函数(ACF)和偏自相关函数(PACF)

谢谢项目六创建财务初阶应用模型任务六利用时间序列,预测股价变动趋势创建股票价格变动预测模型业务背景:股票投资是财富增值的重要手段,但其价格受宏观经济、公司基本面和市场情绪等多因素影响,具有高度不确定性和复杂性。智融创想集团财务人员整理了某股票近200天的价格数据,以预测其变动趋势并制定投资策略。为便于查看,仅展示前10行,如右表所示。创建股票价格变动预测模型构建ARIMA模型:需导入必要模块。时间序列要求:平稳的非白噪声序列。导入函数:从statsmodels库中导入adfuller函数。从statsmodels库中导入acorr_ljungbox函数。adfuller函数:用于ADF单位根检验,判断序列是否平稳。acorr_ljungbox函数:用于Ljung-Box检验,判断残差是否为白噪声序列。从Excel文件中读取股票价格变动数据,并将日期列设置为索引。随后,将数据转换为日频率格式,以便进行后续的时间序列分析。创建股票价格变动预测模型对股票价格历史变动金额数据进行可视化展示,以便更直观地观察数据特征。创建股票价格变动预测模型对股票价格历史变动金额数据进行可视化展示,以便更直观地观察数据特征。(图例为上述任务的输出结果)创建股票价格变动预测模型定义函数:自定义adf_test函数,输入为时间序列。执行检验:使用adfuller()函数进行ADF单位根检验。输出结果:返回ADF统计量、p值及不同显著性水平下的临界值。创建股票价格变动预测模型比较p值:若p值小于0.05,则数据平稳。比较ADF统计量:若ADF统计量小于5%显著性水平下的临界值,则数据平稳。综合判断:根据上述两个条件判断数据是否平稳。(图例为上页任务后续)创建股票价格变动预测模型原始数据平稳性检验:检验发现原始数据不平稳。一阶差分操作:对股票变动价格时间序列stock_price进行一阶差分,降低趋势性。差分后数据检验:调用adf_test()函数对差分后的diff_price进行ADF检验。检验结果:差分后的diff_price满足平稳性要求。创建股票价格变动预测模型

时间序列要求:不能是白噪声。Ljung-Box检验:用于判断时间序列是否为白噪声。检验方法:计算序列在多个滞后期(如1天、2天……10天)的自相关系数。判断依据:综合评估自相关系数的显著性,判断序列是否存在自相关性。常用滞后期:股票价格分析中,滞后10期是常用选择。ARIMA模型的应用条件

Ljung-Box检验假设:时间序列是白噪声,观测值之间无自相关性。p值含义:在原假设为真的情况下,观察到当前或更极端序列的概率。判断标准:如果p值小于显著性水平(如0.05),拒绝原假设,认为序列存在自相关性,适合用ARIMA模型。如果p值大于或等于显著性水平,没有足够证据拒绝原假设,即序列可能是白噪声。ARIMA模型的应用条件Ljung-Box检验结果:在1至10滞后阶数下,p值均小于0.05。结论:时间序列diff_price在各滞后期存在显著自相关性。判定:diff_price非白噪声。建议:适合采用ARIMA模型进行分析与预测。创建股票价格变动预测模型ACF图:显示序列在不同滞后期的自相关性。PACF图:展示排除其他滞后期影响后,某一特定滞后期与当前值的直接相关性。确定模型参数:通过观察ACF图和PACF图中的系数,确定ARIMA模型的p和q值。创建股票价格变动预测模型ACF和PACF图:展示一阶差分后时间序列的自相关性和偏自相关性。蓝色竖线:表示不同滞后期的自相关系数或偏自相关系数。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论