大数据财务分析与决策 课件 第8章 企业战略分析_第1页
大数据财务分析与决策 课件 第8章 企业战略分析_第2页
大数据财务分析与决策 课件 第8章 企业战略分析_第3页
大数据财务分析与决策 课件 第8章 企业战略分析_第4页
大数据财务分析与决策 课件 第8章 企业战略分析_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章

企业战略分析XX老师本章内容8.1战略分析方法简介8.2基于NPL的机会与威胁分析8.3基于NLP的企业优劣势分析8.4基于Kmeans聚类的战略群组分析机器学习平台网址

01战略分析方法简介8.1.1SWOT分析8.1.2战略群组分析8.1.3传统战略分析与智能战略分析的比较8.1战略分析方法简介

企业战略分析指的是对企业所处的内外部环境进行系统深入的了解,以识别环境中的机会和威胁、评估企业的优势和劣势,从而为制定有效的战略决策提供依据。企业战略分析通常包括外部环境分析和内部环境分析。8.1战略分析方法简介常见的战略分析工具和方法8.1.1SWOT分析SWOT分析是对企业的内外部条件进行综合概括,S指企业内部的优势(Strength),W指企业内部的劣势(Weakness),O指企业外部环境中的发展机会(Opportunity),T指企业面临的外部威胁(Threat)。优劣势分析主要着眼于企业相比于竞争对手的实力,机会和威胁分析则着眼于外部环境变化及其对企业的潜在影响。SWOT分析概念8.1.1SWOT分析典型的SWOT分析框架优势(S)劣势(W)S有力的战略w

缺乏明确战略导向S

有利的金融环境w

陈旧的设备S

有利的品牌形象和美誉w

高于对手的财务杠杆(资产负债率)S

被广泛认可的市场领导地位w

高于对手的成本费用S专利技术w

缺少关键技能和资格能力S成本优势w

侵蚀利润的各项支出S强势广告w

不利的内在运作环境S产品创新技能w

落后的研发能力S优质客户服务w

过分狭窄的产品组合S优秀产品质量w

缺乏市场规划能力S

战略联盟与并购

机会(O)威胁(T)O服务独特的客户群体T强势竞争者的进入O新地理区域的扩张T替代品引起的销售下降O产品组合的扩张T市场增长减缓O核心技能向产品组合转化T交换率和贸易政策的不利转变O垂直整合的战略形式T由新规则引起的成本增加O分享竞争对手的市场资源T商业周期的影响O竞争对手的支持T客户和供应商的杠杆作用加强O战略联盟与并购带来的超额市场覆盖T消费者的购买需求下降O新技术开发T人口与环境的变化O品牌形象拓展8.1.1SWOT分析外部因素机会威胁内部因素优势SOST劣势WOWT增长型战略(SO):在该战略下,企业应当充分利用内部优势来把握外部机会。如开发市场、增加产量等。多种经营战略(ST):在该战略下,企业应当利用自身优势来回避或减少外部威胁的冲击。扭转型战略(WO):该战略旨在借助外部机遇来弥补企业内部的劣势,如充分利用环境变化带来的机会设法消除劣势。防御型战略(WT):该战略是一种弥补内部劣势并规避外部威胁的防御性策略,通过业务调整来设法避开威胁和消除劣势。通常,企业需要先采用WO,ST或WT战略,以逐步达到能够采用SO战略的程度。SWOT分析结果将形成一个2×2的矩阵,矩阵的不同区域被赋予了不同的战略意义。SWOT矩阵将企业可选择的战略分成了四种类型。SWOT分析结构与战略8.1.2战略群组分析战略群组定义战略群组是在同一行业中经营并且在某方面采用相同或相似战略的企业集合,通常只有少数几个战略群组,各组采用特征不同的战略;而同一个战略群组内的企业却在许多方面存在相似之处。战略群组竞争

战略群组内企业竞争激烈,行业五力强度各异;进入壁垒阻止新企业进入,不同战略群组间的战略越接近,企业相互成为竞争者的可能性越大。战略群组划分方法根据2至3项代表性特征把行业内的企业进行分类,如产品的差异化程度、细分市场的数目、所使用的分销渠道等,选择两项绘制二维坐标图,根据企业在两个特征上的表现确定其在坐标图中的位置,位置接近的企业属于同一战略群组。战略群组分析图选取两项特征,如地区覆盖与营销力度,绘制战略群组分析图,每个战略群组用圆表示,半径与销售收入份额成正比,直观展示竞争地位。选取变量的条件在选取划分战略群组的依据时,变量应体现各企业的竞争目的,避免共性特征,且两个变量不能具有强相关性,以确保分析的准确性和有效性。战略群组分析价值战略群组分析有助于企业确定战略行动方向;思考外部环境变化的影响;发现竞争者,把握市场定位,发现潜在的合作伙伴或寻找竞争优势;了解移动障碍,避免其他群组的进攻8.1.2战略群组分析

例如,选取“地区覆盖”与“营销力度”两项特征,可以得到如下战略群组分析图:战略群组分析图根据研究目的,从多个角度绘制战略群组分析图,以全面地反映企业的竞争地位。在选取划分战略群组的依据时,位于横纵坐标的两个变量应能够体现各企业的竞争目的,避免选择行业内企业所共有的特征,且两个变量不能具有强相关性。8.1.3传统战略分析与智能战略分析的比较

在复杂多变的商业环境下,传统战略分析方法局限性渐显。数智化时代的智能战略分析,凭借大数据和智能化技术,解决了传统战略管理的滞后性和信息遗漏问题,以全面、动态、科学的优势,更契合企业发展需求,助力企业在激烈竞争中把握先机,实现可持续发展。对比维度传统战略分析智能战略分析信息收集依赖历史资料、市场调研报告,信息采集成本高,易遗漏重要信息。利用大数据技术,高效搜寻和处理海量信息,来源广泛且全面。分析方法基于相对静态环境,人工分析耗时耗力构建数据模型,自动分析和排列影响因素,形成矩阵。预测能力决策滞后,难以应对快速变化的环境实时监控内外部环境,及时识别风险和机遇分析效果决策信息集不完整,增加企业风险隐患。确保战略分析的全面性、动态性和科学性,助力企业发展02基于NPL的机会与威胁分析8.2.1实训任务要求与特点8.2.2情感分析的方法8.2.3基于词典法的情感分析8.2.4基于调包法的情感分析8.2.5基于机器学习法的情感分析8.2.6企业机会和威胁分析8.2.1实训任务要求与特点家电行业文本分析企业外部环境相关的信息并非都是结构化的信息,相反,许多此类信息蕴含在政府的政策文件、监管机构的规章制度、分析师报告等文本中。因此,需要使用自然语言处理(NLP)技术对这些文本进行内容和情感分析。家电政策语料库构建利用爬虫技术,搜集了可能影响家电企业所处的宏观环境、产业环境和竞争格局的政府政策、行业报告、监管要求、行业规范等公开文件。提取上述文件中与家电行业相关的语句,删除无关语句。语料库情感分析生成OT表基于家电行业外部环境语料库,采用词典法、调包法、机器学习法对外部环境相关语句进行文本情感分析,积极暗示机会,消极暗示威胁;如“消费市场”一词中性,但“蓬勃”与“疲软”分别代表机遇与风险。8.2.2情感分析的方法情感分析方法及原理目前,主流的文本情感分析方法可分为基于情感词典的情感分析法、基于调包的情感分析法以及基于机器学习的情感分析法。词典法调包法机器学习法8.2.2情感分析的方法需情感词、否定词、程度副词词典情感词词典包含许多个表达积极或消极情绪的情感词,以及每个词对应的情感分数。否定词词典包含许多个否定词,在遇到这些否定词时,句子取相反意思,而双重否定则表示肯定。程度副词词典包含许多个用来调整情感词的情感分数权重(即情绪强度)的程度副词,以及每个词本身的程度副词分数(即调整力度)。词典法的基本流程如下:(1)遍历每个句子的分词结果;(2)初始化情感分数权重,取值为1;(3)对于当前句子的每个单词:如果该单词是情感词,根据权重和情感词得分,更新情感分数。获取下一个情感词的位置索引,更新位置索引。判断当前情感词与下一个情感词之间是否存在否定词或程度副词,根据否定词调整情感分数的正负符号,根据程度副词调整情感分数的取值大小,更新情感分数权重。(4)将每个句子的加权情感分数作为情感分析结果。词典法的特点在于综合考虑了情感词、否定词和程度副词,以及其词汇属性、位置、相互作用等因素,实现对文本数据的情感分析。词典法8.2.2情感分析的方法调包法可以更快地实现文本情感分析。Python、R、Matlab等高级编程语言能够为我们提供广泛的生态系统和丰富的第三方包,而直接调用开源环境中其他人预先编写好的库或模块,相当于“站在巨人的肩膀上”——只需自行编写少量代码,即可扩展程序的功能并实现特定的任务。以情感分析任务为例,现阶段Python有许多自然语言处理(NLP)包,可以轻松实现文本情感分析,如SnowNLP、NLTK和TextBlob等,这些NLP包已经内嵌了分词、词性标注、与词典对比等操作。调包法8.2.2情感分析的方法机器学习法可以更加自主地实现文本情感分析。传统方法如决策树,能有效捕获关键特征。集成学习算法如XGBoost通过优化梯度提升框架,提升模型准确性和效率。深度学习模型如DNN、LSTM能够自动学习文本的抽象特征,处理非线性关系,效果更理想。机器学习法需要先对一个带情感标签的样本进行学习,才能建立模型对样本外数据的情感分类进行预测。带标签样本又称为样本内数据,即由人工判断每条文本观测记录的情感倾向,打上积极、消极、中性等情感标签,其将被划分为训练集和测试集两个部分,分别用来训练机器学习模型和评估模型的预测效果。机器学习法8.2.2情感分析的方法方法优势劣势词典法简单直观,不需要大量标注数据,适用于快速情感分析。受限于情感词典的质量和覆盖范围,对于新词、复杂语境以及歧义性较高的文本可能表现不佳。调包法开发者提前训练并封装好NLP模型,使用者可以直接使用,操作方便模型的可调试空间有限,通常无法自由调整模型参数;开发者训练好的模型可能不适配数据集特征。机器学习法能够根据特定领域或特定任务的数据进行自定义训练,具有较好的灵活性和可解释性。依赖于数据标注,需要大量的训练样本和特征工程,消耗大量的训练时间和计算资源,编程难度与学习成本较高。情感分析方法比较8.2.3基于词典法的情感分析词典法流程基于词典法的技术流程图步骤一:数据导入与清洗01导入名为“家电行业政策.xlsx”的文本数据集,该数据共有50行观测记录,5列特征;其中的“内容”列是我们进行情感分析的对象。数据导入02本次任务所涉及的变量均为字符型变量,因此,在数据清洗阶段主要检查各变量是否存在缺失值和重复值,而无须进行异常值检测。将缺失比例较高的特征变量删除,并检查是否存在完全相同的观测记录,若有则只保留其中一条。缺失值和重复值处理8.2.3基于词典法的情感分析8.2.3基于词典法的情感分析文本分词和词性标注分词按照特定需求把文本切分成一个字符串序列,其中的元素被称为词语。分词中涉及到几个基本问题:分词规范、歧义切分、未登录词的识别。词性标注仅保留对机器学习或人工智能识别有益的词汇。删除停用词删除对文本分析意义不大的词汇,如介词、助词、连词、代词等,其出现频率很高却不携带太多语义信息。文本分词结果步骤二:文本分词与词性标注保留词性的结果8.2.3基于词典法的情感分析计算文本情感分数读者在选择相应的中文情感词典和否定词典之后,便可自动计算文本的情感分数。情感分数的取值范围是0-1,取值越趋近于1,说明文本的分词结果中正向情感词越多,文本情感越积极;取值越趋近于0,说明文本情感越消极;取值在0.5左右,则说明文本没有明显的情感倾向。图8-5展示了词典法下的情感分析结果。步骤二:计算文本情感分数词典法情感分析结果8.2.4基于调包法的情感分析基于调包法的技术流程图“包”的概念与调包法流程调包法中的“包”指的是专注于中文文本情感分析的一系列程序集合,“包”里面内嵌了文本分词、词性标注、去除停用词等处理,并能够基于大规模的情感词典和概率算法,根据情感词的出现频率、情感词前后的词语以及语法规则等对文本的整体情感进行分析,计算并输出文本的情感分数。如SnowNLP包就是一个简单易用的情感分析包,能够较好地识别中文文本的情感倾向。调包法计算的情感分数的取值范围同样在0-1之间。取值越趋近于1,文本情感越积极;反之则情感越消极。在调包法下,分析人员无须再进行分词等文本预处理操作,直接调用程序包即可。8.2.5基于机器学习法的情感分析基于机器学习法的技术流程图机器学习法技术流程机器学习法需要先对一个带情感标签的样本进行学习,才能建立模型对样本外数据的情感分类进行预测。所谓的“带标签”的样本,即由人工判断每条文本观测记录的情感倾向,打上积极、消极、中性等情感标签。带标签样本又称为样本内数据,将被划分为训练集和测试集两个部分,分别用来训练机器学习模型和评估模型的预测效果。在建模完成后,就可以用该模型对样本外数据进行情感分析了。导入一份名为“家电行业政策_带标注.xlsx”的数据集。新数据集共有50条文本观测记录,其中40条带有情感分数(变量名为“OT分数”),剩余10条不带标签。数据导入8.2.5基于机器学习法的情感分析步骤一:数据导入与清洗缺失值和重复值处理同8.2.3主要检查各变量是否存在缺失值和重复值,而无须进行异常值检测。将缺失比例较高的特征变量删除,并检查是否存在完全相同的观测记录,若有则只保留其中一条。先对文本的内容进行分词、词性标注、删除停用词等预处理。将分词结果中的每个词汇都转变成一个向量,最终形成许多内容向量,第N个词汇对应“内容向量N”。“内容向量N”的取值代表了第N个词汇在该条观测记录中出现的位置;若“内容向量N”取值为0,则说明第N个词汇未曾出现在这条观测记录中。8.2.5基于机器学习法的情感分析步骤二:文本向量化文本向量化结果首先剔除数据集中的样本外数据(不带标签的观测记录),再将样本内数据进行拆分。将带标签观测记录中的80%划分为训练集,其余20%作为测试集。划分训练集和测试集步骤三:决策树建模过程与效果评估8.2.5基于机器学习法的情感分析模型训练将划分得到的训练集用于模型训练,预测目标是“OT分数”,所使用的特征变量即之前生成的全部文本向量。设置决策树模型的各种参数取值。模型评估我们用构建的决策树模型来预测测试集样本的情感分数,并与其真实的情感分数进行对比,从而评价该模型的预测效果。由于此数据的样本规模较小,样本量少于特征量,应使用R²而非调整R²进行模型评价。目前模型未经过系统性调参,故而R²仅为0.7199,模型性能一般,仍具有改进空间。模型评估结果导入样本外数据,重复前述的数据清洗、分词、标注词性、文本向量化等预处理过程。或对样本内、外的数据同时进行数据清洗、分词、词性标注、文本向量化等预处理操作,再单独保留经过预处理的样本外数据,以便在模型应用阶段使用。进行样本外预测,将已经构建的决策树模型用于不带标签的样本,以全部文本向量作为预测因子,便可得到所有样本外观测记录的情感分数(OT分数)。步骤四:决策树模型应用8.2.5基于机器学习法的情感分析通过对样本内数据的学习,分析人员得到了情感分数的预测模型,可以用该模型对样本外数据进行预测。8.2.2情感分析的方法机器学习法情感分析调包法情感分析使用专注于中文文本情感分析的程序包,如SnowNLP,直接调用程序包进行情感分析。调包法计算的情感分数取值范围为0-1,越趋近于1表示情感越积极,越趋近于0表示情感越消极。词典法情感分析选择合适的中文情感词典,如Hownet词典、清华大学李军词典等,结合否定词典进行情感分析。词典法计算的情感分数取值范围也是0-1,取值越趋近于1表示情感越积极,反之亦然。对少量文本语句打标签,将带标签的观测记录作为样本内数据,分为训练集和验证集。通过模型训练、验证和应用,对样本外数据进行情感分类。机器学习模型的性能可以通过均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R²)等指标进行衡量。情感分析方法对比8.2.6企业机会和威胁分析设置划分阈值生成OT清单统计分析结合企业的风险偏好和风险容忍度,设置机会和威胁的划分阈值将符合机会/威胁定义的观测记录筛选出来并列表通过统计机会和威胁因素各自的数量或占比,得到外部环境整体的有利或不利程度企业机会和威胁分析步骤得到与某家电企业相关的所有外部环境文本的情感分数后,在此基础上,计算外部环境整体蕴含的机会或威胁大小程度8.2.6企业机会和威胁分析机会/威胁因素清单03基于NLP的企业优劣势分析8.3.1实训任务要求与特点8.3.2文本主题分析8.3.3基于LDA的文本主题分析8.3.4企业优势和劣势分析8.3.1实训任务要求与特点消费者往往会在电商平台的评论区分享自己的商品使用体验,对商品的外观设计、质量、价格、创新性等进行评价。这些消费者评论能够很大程度地反映出品牌的优势和劣势。因此,需要从电商平台上爬取海尔冰箱的公开客户评价,其中包括评分星级、评论内容、时间、产品型号等信息,形成产品评论文档。客户评价评分星级是客户对商品的定量评价,通常在1-5分之间,属于数值型信息。评论内容是客户对商品的定性评价,表现为文字形式,是我们进行文本分析的对象。我们要基于评分星级对产品评论文本进行情感分类。建模对评论内容的主题做提取和分类,使一个主题代表企业的一项能力。基于正面(负面)评论样本所得到的主题即为美的冰箱的优势(劣势)。生成SW表以列表形式对优劣势进行直观呈现。消费者评论信息步骤一从文档的主题分布中随机选择一个主题步骤二从被选择的主题的词分布中随机选择一个词作为该位置的词文本主题分析(ThematicAnalysis)指对文本内容与含义进行有效概括与诠释。LDA(LatentDirichletAllocation)模型是最为常用的文本主题分析模型,在LDA模型中,每个文档可以被表示为对各个主题的概率分布,而每个主题又可以被表示为对各个词的概率分布。8.3.2文本主题分析文档中每个词生成过程通过重复这一过程,可以生成整个文档的词序列。而LDA模型的目标就是通过观察到的文本数据,推断出最有可能的主题分布和词分布,从而揭示文档集合中的潜在主题结构。8.3.3基于LDA的文本主题分析文本主题分析的技术流程图文本主题分析的技术流程文本数据清洗数据导入:导入名为“冰箱产品评论.xlsx”的数据集,其中有9167行观测记录和5列特征,最关键的三个变量是“评论级别”、“评论内容”和“品牌”。数据筛选:我们主要分析海尔冰箱的优劣势,因此,需要剔除其他品牌的观测记录。缺失值处理:主要检查各变量是否存在缺失值和重复值,无需进行异常值检测和处理。将缺失比例较高的特征变量删除,并将变量缺失率达到10%以上的观测记录删除。8.3.3基于LDA的文本主题分析步骤一:文本数据清洗8.3.3基于LDA的文本主题分析分词结果步骤二:文本分词和词性标注分词:将文本拆分成一个个有意义的词语删除停用词:将研究对象的代称或者同义词等非常用的停用词排除在外。词性标注:主题分析时仅保留词性标注为名词的词汇,比如外观、容量、包装、设计等,其余词性的词汇均予以删除。(1)正面评论筛选。根据“评论级别”的取值大小来区分正面评论与负面评论,先筛选出“评论级别”大于等于4的正面评论。(2)词频关键词建模。将所有备选主题词按照其在文本中出现的频率(即词频)由高到低来排序,排序最靠前的就是关键词。(3)LDA主题建模。若设定主题数为2、每个主题下的关键词数为4,则代表评论内容的所有词汇整体上描述了2个主题,每个主题又涵盖了4个细分主题。优势分析劣势分析步骤三:优劣势分析8.3.3基于LDA的文本主题分析(1)负面评论筛选。先筛选出“评论级别”小于等于2的负面评论,保留下来观测记录中的各个名词就是代表产品劣势的备选主题词。(2)词频关键词建模。基于备选主题词在负面评论中出现的频率高低来判断关键词。(3)LDA主题建模。使用LDA主题模型对负面评论进行主题建模,设定主题数为2个,每个主题下的关键词数为4个。SW分析结果列表结合内部优劣势分析与外部机遇风险,对比竞争对手优劣势,制定适合本公司发展的战略,提升市场竞争力。竞争对手优劣势对比通过对商品评论内容进行主题建模,分析人员能够得到研究对象的内部优势和劣势,并使用“生成SW表”选项将结果进行列表展示。冰箱优劣势分析8.3.4企业优势和劣势分析SW分析结果列表(优势/劣势清单)04基于Kmeans聚类的战略群组分析8.4.1实训任务要求与特点8.4.2聚类分析8.4.3价格-销量聚类分析8.4.1实训任务要求与特点对市场上的冰箱产品按照价格-销量两个维度进行聚类,以便对冰箱产业进行战略群组分析。目前,在国内市场上销售的冰箱品牌多达30个左右,有的品牌在价格定位和销售策略上存在巨大差异,但也有一些品牌拥有相近的商品单价,并且取得了相似的销量(如表所示)。很显然,在我国冰箱产业中存在多个战略群组。基于价格和销量对冰箱产业进行战略群组分析能够帮助冰箱企业或潜在进入者进行战略决策。本任务所使用的数据源自电商平台,使用真实有效的消费者评论数作为销量的代理变量。常见的聚类算法有K均值聚类(Kmeans),基于密度的聚类算法(DBSCAN),层次聚类算法(AGNES、Birch等),亲和传播聚类算法(AffinityPropagation)和均值漂移聚类算法(MeanShift)等。以K均值聚类为例,其实现过程和原理如下:1)随机选择K个数据点作为初始质心;2)将每个数据点分配到与之最近的质心所在的簇中;3)重新计算每个簇的质心;4)重复前述步骤2)和3),直到簇内的误差平方和最小化。聚类算法基本原理适用场景Kmeans↵基于数据点之间的距离将数据划分为K个簇,适用于凸形簇结构市场细分、客户群体分析、产品推荐等DBSCANe基于数据点的密度寻找高密度区域形成簇,适用于任意形状的簇结构异常检测、噪声过滤、地理信息数据聚类等AGNESe自下而上合并相似簇形成层次化结构,适用于不同尺度的簇结构生物学分类、医疗影像分析等Birche利用树状结构逐步合并数据点形成簇,适用于大规模数据集的聚类分析大规模数据的聚类分析、客户行为分析等AffinityPropag

ation↵根据数据点之间的相似性选择代表点形成簇,适应于数据非球形分布图像分割、社交网络分析、异常检测等MeanShifte通过调整数据点密度中心找到局部密度最大值形成簇,适用于密度估计空间聚类、图像分割、自动驾驶领域等不同聚类算法的比较8.4.2聚类分析聚类分析(Cluster)是一种无监督学习方法,指的是将相似的对象归入同一个类别,也即同一个“簇”;“簇”就是聚类之后形成的具有相似特征和行为模式的群体。8.4.3价格-销量聚类分析聚类分析的技术流程图聚类分析技术流

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论