基于Word2Vec及多分类任务的影评分类_第1页
基于Word2Vec及多分类任务的影评分类_第2页
基于Word2Vec及多分类任务的影评分类_第3页
基于Word2Vec及多分类任务的影评分类_第4页
基于Word2Vec及多分类任务的影评分类_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要由于互联网的进步,人们评论电影的方式越来越简单,所以对于电影的评论就越来越多,想看完这部电影的全部评论来分析这部是好还是坏,这明显不是明智的选择。本论文的主要内容是根据网上的电影评论数据进行情感分类预测,使用基于Word2Vec的模型,对全部电影评论进行情感分类,进而分析这部电影是一部值得观看的好电影,还是一部浪费时间的坏电影。同时分析基于词义的词向量模型是不是更适用于情感分类,我将对比基于单词语义的词向量模型和基于词频的词向量在同一个分类器下,基于Word2Vec的语义模型能否提高影评情感分类的准确性。最终的结果表明,Word2Vec模型中87%的准确率和88%的召回率都要比传统的词袋模型中的86%的准确率和86%的召回率要高一点,所以基于Word2Vec的词向量模型用机器学习的分类器进行分类是可以提高影评情感分类的准确性。关键词:基于词频构造的词袋模型;Word2Vec;随机森林算法;逻辑回归算法;情感分类ABSTRACTBecauseoftheprogressoftheInternet,people'swayofcommentingonthemovieismoreandmoresimple,sotherearemoreandmorecommentsonthemovie.It'sobviouslynotawisechoicetoanalyzewhetherthemovieisgoodorbadafterwatchingallthecommentsonthemovie.ThemaincontentofthispaperistoclassifyandpredicttheemotionbasedonthemoviereviewdataontheInternet,usetheword2vecbasedmodeltoclassifytheemotionofallmoviereviews,andthenanalyzewhetherthismovieisagoodmovieworthwatchingorabadelectricmoviethatwastestime.Atthesametime,itanalyzeswhetherthewordvectormodelbasedonwordmeaningismoresuitableforemotionalclassification.Iwillcomparewhetherthewordvectormodelbasedonwordsemanticsandthewordvectorbasedonwordfrequencycanimprovetheaccuracyofemotionalclassificationofmoviereviewsunderthesameclassifier.Thefinalresultsshowthat87%accuracyand88%recallrateofword2vecmodelarehigherthan86%accuracyand86%recallrateoftraditionalwordbagmodel,sothewordvectormodelbasedonword2veccanimprovetheaccuracyofemotionalclassificationbymachinelearningclassifier.Keywords:wordbagmodelbasedonwordfrequency;word2vec;randomforestalgorithm;logisticregressionalgorithm;emotionclassification目录TOC\o"1-5"\h\z\u第一章 绪论 .6本章小结本章主要说明了实验的具体操作步骤其中包括主要的代码实现及其代码的运行结果,本章的最后还有实验结果和对实验结果的分析,从结果上看虽然证明了Word2Vec工具在情感分析领域的可用性是优于传统的词袋模型的,但是最终的实验结果并不明显,以下会对本论文的结果进行反思和思考改良的方法,争取下次能更好。第五章结论与展望5.1总结引入Word2Vec模型,用词的语义特征来表示电影评论的数据特征,并分别逻辑回归、随机森林多项式模型作为情感分类的分类器,实验结果表明,Word2Vec模型可明显的提高情感分类方法的性能,对比传统的词袋模型是有优化的,特征维度对模型性能也有一定影响,同时,随机森林分类器即使在得到最优参数下的泛化能力还是稍逊色于逻辑回归分类器的。该实验只是简单的应用了Word2Vec模型,计算句子的相似度也是使用了最计算句子词向量的平均值,对于分析Word2Vec对情感分析的影响有一定的局限性,想要得到更为准确的数据,还需要做更深入的研究。5.2展望本论文只是大致的讨论了word2vec对情感分类的影响,我们训练数据的数据集并不大,而且还没考虑特征维度对分类器的影响,我们计算句子相似度的方法是最简单的计算句子中的所有词向量的平均值,实际上句子相似度的计算还有更好的做法,等种种因素,受这些因素的影响本论文最终得到的实验结果并不明显,所以未来的实验应该更加严谨,把所有能优化实验的因素都考虑进去,让实验更有说服力,就本论文来说,我们还可以使用更大的数据集,使用PCA降维来计算不同维度对实验结果的影响,使用更好的算法计算句子的相似度,所以未来还需要更加努力,对事情的考虑要更加周到,不能放过每一个细节。参考文献[1]基于卷积记忆网络的视角级微博情感分类[J].廖祥文,谢媛媛,魏晶晶,桂林,程学旗,陈国龙.模式识别与人工智能.2018(03)[2]基于Word2vec的句子语义相似度计算研究[J].李晓,解辉,李立杰.计算机科学.2017(09)[3]基于word2vec的互联网商品评论情感倾向研究[J].黄仁,张卫.计算机科学.2016(S1)[4]基于情感关键句抽取的情感分类研究[J].林政,谭松波,程学旗.计算机研究与发展.2012(11)[5]基于Stacking组合分类方法的中文情感分类研究[J].李寿山,黄居仁.中文信息学报.2010(05)[6]模型评估之混淆矩阵(confusion_matrix)含义及Python代码实现致谢本编论文能够完成,首先我要感谢我的指导老师,苏康老师,他在我还没找到论文题目的时候指明了一个方向,还为我提供了技术上的支持,对于本编论文的撰写,为我提供了多方面的宝贵建议,让本编论文得以完善,所以我在这里十分感谢苏康老师,他是一个非常负责任的老师。

电脑不启动故障诊治了解电脑启动的过程在诸多电脑故障中,无法正常启动是最令用户头痛的事了。笔者长期从事维护电脑的工作,在这个方面积累了一些经验,现在就将这些经验整理归纳出来与朋友们分享。本文将以家用电脑和windows98操作系统为基础,介绍电脑无法正常启动故障的诊治。要想准确地诊断电脑不启动故障,首先要了解的起动过程,当我们按下电源开关时,电源就开始向主板和其它设备供电,此时电压还没有完全稳定,主板控制芯片组会根据CMOS中的CPU主频设置向CPU发出一个Reset(重置)信号,让CPU初始化,电压完全稳定后,芯片组会撤去Reset信号,CPU马上从地址FFFF0H处执行一条跳转指令,跳到系统BIOS中真正的启动代码处。系统BIOS首先要做的事情就是进行POST(PowerOnSelfTest,加电自检)。POST的主要任务是检测系统中的一些关键设备(电源、CPU芯片、BIOS芯片、定时器芯片、数据收发逻辑电路、DMA控制器、中断控制器以及基本的64K内存和内存刷新电路等)是否存在和能否正常工作,如内存和显卡等。自检通过后,系统BIOS将查找显示卡的BIOS,由显卡BIOS来完成显示卡的初始化,显示器开始有显示,自此,系统就具备了最基本的运行条件,可以对主板上的其它部分进行诊断和测试,再发现故障时,屏幕上会有提示,但一般不死机,接着系统BIOS将检测CPU的类型和工作频率,然后开始测试主机所有的内存容量,内存测试通过之后,系统BIOS将开始检测系统中安装的一些标准硬件设备,这些设备包括:硬盘、CD-ROM、软驱、串行接口和并行接口等连接的设备,大多数新版本的系统BIOS在这一过程中还要自动检测和设置内存的相关参数、硬盘参数和访问模式等。标准设备检测完毕后,系统BIOS内部的支持即插即用的代码将开始检测和配置系统中已安装的即插即用设备。每找到一个设备之后,系统BIOS都会在屏幕上显示出设备的名称和型号等信息,同时为该设备分配中断、DMA通道和I/O端口等资源。最后系统BIOS将更新ESCD(ExtendedSystemConfigurationData,扩展系统配置数据)。ESCD数据更新完毕后,系统BIOS的启动代码将进行它的最后一项工作,即根据用户指定的启动顺序从软盘、硬盘或光驱启动。以从C盘启动为例,系统BIOS将读取并执行硬盘上的主引导记录,主引导记录接着从分区表中找到第一个活动分区,然后读取并执行这个活动分区的分区引导记录,而分区引导记录将负责读取并执行IO.SYS,这是Windows最基本的系统文件。IO.SYS首先要初始化一些重要的系统数据,然后就显示出我们熟悉的蓝天白云,在这幅画面之下,Windows将继续进行DOS部分和GUI(图形用户界面)部分的引导和初始化工作,一切顺利结束,电脑正常启动。根据故障现象诊治了解电脑启动的过程,故障就好判断了,下面我们就根据故障现象开始诊治了:现象一:系统完全不能启动,见不到电源指示灯亮,也听不到冷却风扇的声音。这时,基本可以认定是电源部分故障,检查:电源线和插座是否有电、主板电源插头是否连好,UPS是否正常供电,再确认电源是否有故障,最简单的就是替换法,但一般用户家中不可能备有电源等备件,这时可以尝试使用下面的方法(注意:要慎重):先把硬盘,CPU风扇,或者CDROM连好,然后把ATX主板电源插头用一根导线连接两个插脚(把插头的一侧突起对着自己,上层插脚从左数第4个和下层插脚从右数第3个,方向一定要正确),然后把ATX电源的开关打开,如果电源风扇转动,说明电源正常,否则电源损坏。如果电源没问题直接短接主板上电源开关的跳线,如果正常,说明机箱面板的电源开关损坏。现象二:电源批示灯亮,风扇转,但没有明显的系统动作。这种情况如果出现在新组装电脑上应该首先检查CPU是否插牢或更换CPU,而正在使用的电脑的CPU损坏的情况比较少见(人为损坏除外),损坏时一般多带有焦糊味,如果刚刚升级了BIOS或者遭遇了CIH病毒攻击,这要考虑BIOS损坏问题(BIOS莫名其妙的损坏也是有的),修复BIOS的方法很多杂志都介绍过就不重复了;确认CPU和BIOS没问题后,就要考虑CMOS设置问题,如果CPU主频设置不正确也会出现这种故障,解决方法就是将CMOS信息清除,既要将CMOS放电,一般主板上都有一个CMOS放电的跳线,如果找不到这个跳线可以将CMOS电池取下来,放电时间不要低于5分钟,然后将跳线恢复原状或重新安装好电池即可;如果CPU、BIOS和CMOS都没问题还要考虑电源问题:PC机电源有一个特殊的输出信号,称为POWERGOOD(PG)信号,如果PG信号的低电平持续时间不够或没有低电平时间,PC机将无法启动。如果PG信号一直为低电平,则PC机系统始终处于复位状态。这时PC机也出现黑屏、无声响等死机现象。但这需要专业的维修工具外加一些维修经验,因此,建议采用替换法;电源没有问题就要检查是否有短路,确保主板表面不和金属(特别是机箱的安装固定点)接触。把主板和电源拿出机箱,放在绝缘体表面,如果能启动,说明主板有短路现象;如果还是不能启动则要考虑主板问题,主板故障较为复杂,可以使用替换法确认,然后更换主板。现象三:电源指示灯亮,系统能启动,但系统在初始化时停住了,而且可以听到嗽叭的鸣叫声(没有视频):根据峰鸣代码可以判断出故障的部位。ccid_page/AwardBIOS1短声:说明系统正常启动。表明机器没有问题。2短声:说明CMOS设置错误,重新设置不正确选项。1长1短:说明内存或主板出错,换一个内存条试试。1长2短:说明显示器或显示卡存在错误。检查显卡和显示器插头等部位是否接触良好或用替换法确定显卡和显示器是否损坏。1长3短:说明键盘控制器错误,应检查主板。1长9短:说明主板FlashRAM、EPROM错误或BIOS损坏,更换FlashRAM。重复短响:说明主板电源有问题。不间断的长声:说明系统检测到内存条有问题,重新安装内存条或更换新内存条重试。AMIBIOS1短:说明内存刷新失败。更换内存条。2短:说明内存ECC较验错误。在CMOS中将内存ECC校验的选项设为Disabled或更换内存。3短:说明系统基本内存检查失败。换内存。4短:说明系统时钟出错。更换芯片或CMOS电池。5短:说明CPU出现错误。检查CPU是否插好。6短:说明键盘控制器错误。应检查主板。7短:说明系统实模式错误,不能切换到保护模式。8短:说明显示内存错误。显示内存有问题,更换显卡试试。9短:说明BIOS芯片检验和错误。1长3短:说明内存错误。内存损坏,更换。1长8短:说明显示测试错误。显示器数据线没插好或显示卡没插牢。现象四:系统能启动,有视频,出现故障提示,这时可以根据提示来判断故障部位。下面就是一些常见的故障提示的判断:一、提示“CMOSBatteryStateLow”原因:CMOS参数丢失,有时可以启动,使用一段时间后死机,这种现象大多是CMOS供电不足引起的。对于不同的CMOS供电方式,采取不同的措施:1.焊接式电池:用电烙铁重新焊上一颗新电池即可;2.钮扣式电池:直接更换;3.芯片式:更换此芯片,最好采用相同型号芯片替换。如果更换电池后时间不长又出现同样现象的话,很可能是主板漏电,可检查主板上的二极管或电容是否损坏,也可以跳线使用外接电池,不过这些都需要有一定的硬件维修基础才能完成。二、提示“CMOSChecksumFailure”CMOS中的BIOS检验和读出错;提示“CMOSSystemOptionNotSet”,CMOS系统未设置;提示“CMOSDisplayTypeMismatch”,CMOS中显示类型的设置与实测不一致;提示“CMOSMemorySizeMismatch”,主板上的主存储器与CMOS中设置的不一样;提示“CMOSTime&DateNotSet”,CMOS中的时间和日期没有设置。这些都需要对CMOS重新设置。三、提示“KeyboardInterfaceError”后死机原因:主板上键盘接口不能使用,拔下键盘,重新插入后又能正常启动系统,使用一段时间后键盘无反应,这种现象主要是多次拔插键盘引起主板键盘接口松动,拆下主板用电烙铁重新焊接好即可;也可能是带电拔插键盘,引起主板上一个保险电阻断了(在主板上标记为Fn的东西),换上一个1欧姆/0.5瓦的电阻即可。四、自检过程中断在xxxKCache处这表示主板上Cache损坏,可以在CMOS设置中将“ExternalCache”项设为“Disable”故障即可排除。同理,在自检主板部件时出现中断,则可以认为该部件损坏,解决方法一般可以在CMOS中将其屏蔽,如果不能屏蔽该部件最好更换主板。五、提示“FDDControllerFailure”BIOS不能与软盘驱动器交换信息;提示“HDDControllerFailure”,BIOS不能与硬盘驱动器交换信息。应检查FDD(HDD)控制卡及电缆。六、提示“8042GateA20Error”8042芯片坏;提示“DMAError”,DMA控制器坏。这种故障需要更换。七、提示“DisplaySwitchNotProper”主板上的显示模式跳线设置错误,重新跳线。八、提示“KeyboardisLock...Unlockit”键盘被锁住,打开锁后重新引导系统。九、IDE接口设备检测信息为:“DetectingPrimary(或Secondary)Master(或Slave)...None”表示该IDE接口都没有找到硬盘,如果该IDE口确实接有硬盘的话,则说明硬盘没接上或硬盘有故障,可以从以下几方面检查:1、硬盘电源线和数据线是否接触不良,或换一根线试试;2、CMOS设置有无错误,进入CMOS将“PrimaryMaster”、“PrimarySlave”、“SecondaryMaster”三项的的“TYPE”都设置成“Auto”;3、替换法确认硬盘本身有故障。十、IDE接口设备检测信息下面显示“Floppydisk(s)fail(40)”出错信息表示CMOS所指定的软盘驱动器有问题。判断和解决的方法与硬盘相似。现象五:系统不能引导。这种故障一般都不是严重问题,只是系统在找到的用于引导的驱动器中找不到引导文件,比如:BIOS的引导驱动器设置中将软驱排在了硬盘驱动的前面,而软驱中又放有没有引导系统的软盘或者BIOS的引导驱动器设置中将光驱排在了硬盘驱动的前面,而光驱中又放有没有引导系统的光盘,这个都很简单,将光盘或软盘取出就可以了,实际应用中遇到“DiskBootFailure,InsertSystemDiskAndPressEnter”的提示,多数都是这个原因。如果是硬盘不能引导的话一般有两种情况:一种是硬盘数据线没有插好,另一种就是硬盘数据损坏。前者一般多会出现硬盘容量检测不正确和引导时出现死机的现象;后者则是干脆找不到引导文件或提示文件损坏。前者只需重新连接好数据线即可;后者则需要用win98的启动软盘或启动光盘启动,根据实际情况来定:一、提示“Invalidpartitiontable”或“NotFoundany[activepartition]inHDDDiskBootFailure,InsertSystemDiskAndPressEnter”,这说明找不到硬盘活动分区,需要对硬盘重新分区。二、提示“Missoperationsyste”,说明硬盘活动分区需要重新格式化(formatc:/s)。三、提示“InvalidsystemdiskReplacethedisk,andthenpressanykey”或显示“StartingWindows98…”时出现死机,说明硬盘上的系统文件丢失了或损坏,使用“sysc:”,命令传递系统文件给c盘,再将C拷贝给c盘。现象六:硬盘可以引导,但Windows不能正常启动,也不能进入安全模式。这种情况表明Windows98出现了严重的错误,首先,用杀毒软件查杀病毒,看是不是病毒造成的,如果没有发现病毒可以用以下方法试一试。一、直接将接口卡与各个外设都拨去,再插回去,并调整接口卡上的设置(如果可以的话)来检查是否是硬件冲突造成,开机看看是否可正常进入Windows。二、检查CMOS中的设置是否有不正确的地方,若不清楚,可选择LoadBiosDefault项目,然后重开机,开机看是否可正常进入Windows。三、在启动时按下F8键,一般会出现6个选项(如果安装了DOS6.22则出现7个选项)选择第4项“step-by-stepconfirmation”进入单步运行方式,按照出现死机的命令选择处理方法:1、执行“Processthesystemregistry”计算机就死机,说明是注册表故障,那么可以重新启动按F8键,选第4项后,只在Device=c:\windows\himem.sys这一项上按“Y”,其余的按“N”后,在DOS提示符下输入Scanreg/fix修复注册表或者是scanreg/restore恢复到以前系统自动备份的注册表后,再重新启动即可。2、在出现“Createastartuplogfile(BOOTTLOG.TXT)[Enter=Y,Esc=N]”时,选择Y建立Bootlog.txt这个文件,可以检查启动过程中各个系统文件装载的情况。如果在装载某一个.vxd文件时死机,可以到其它计算机上复制该.vxd文件拷贝过来。3、如果是一启动就出现“现在可以安全地关闭计算机了”,一般是因为Windows的System目录的vmm32.vxd被损坏,可以到其它计算机上重新复制一个过来。4、一启动就出现蓝屏并显示“VFATDevcieInitializationFaild”,表示调用Windows目录下的dblbuff.sys和ifshlp.sys文件出了问题,可以在config.sys文件中手工加入如:“device=c:\windows\dblbuff.sys”和“devicehigh=c:\windows\ifshlp.sys”,如果还是不行,则表明这两个文件己损坏,可以到其他计算机上新复制过来一份。四、使用文本编辑程序将Msdos.sys文件中的LOGO参数设置为“0”,关闭后再开机时,看看是否可进入Windows,若还是不行,则只能重新安装Windows系统了。在重装Windows时,建议先采用覆盖原来的Windows的方法,这样做的好处是:如果故障能够排除,原来的许多应用程序就不用再安装了;如果覆盖式安装不能解决问题,再采用硬盘格式化之后安装Windows的方法。现象七:Windows无法启动,但能进入安全模式。这种故障一般问题不大,修复的几率较高。具体可以参照下面的几种方法去做:一、在安装新设备后不能正常启动,进入安全模式后,在“控制面板”--“系统”中选择“设备管理器”选项卡,在列出的所有设备中查找前有一个感叹号冲突的设备,如果有的话,打开这个设备的“属性”,查看“资源”选项卡,看看这个设备与其它设备的中断冲突,然后取消“自动设置”复选框,单击“更改设置”按钮,选择一个没有使用的中断号即可。如果还不行,则可以在设备属性中选择“常规”选项卡,选中“在此硬件配置文件中禁用”复选框,如果能正常启动成功,证明这个硬件的驱

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论