


全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
衿膀芆薃袅腿蒈衿螁膈薀蚁肀膇芀袇羆膇莂蚀袂膆蒅袅螈芅薇蚈肇芄芇蒁羃芃葿蚆罿节薁蕿袅节芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈芈螁螇莇莀薄肆莆薂蝿肂莆蚄蚂羈莅莄袈袄羁蒆蚀螀羀蕿袆肈罿芈虿羄聿莁袄袀肈蒃蚇螆肇蚅蒀膅肆莅螅肁肅蒇薈羇肄薀螄袃肃艿薆蝿肃莂螂肇膂蒄薅羃膁薆螀衿膀芆薃袅腿蒈衿螁膈薀蚁肀膇芀袇羆膇莂蚀袂膆蒅袅螈芅薇蚈肇芄芇蒁羃芃葿蚆罿节薁蕿袅节芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈芈螁螇莇莀薄肆莆薂蝿肂莆蚄蚂羈莅莄袈袄羁蒆蚀螀羀蕿袆肈罿芈虿羄聿莁袄袀肈蒃蚇螆肇蚅蒀膅肆莅螅肁肅蒇薈羇肄薀螄袃肃艿薆蝿肃莂螂肇膂蒄薅羃膁薆螀衿膀芆薃袅腿蒈衿螁膈薀蚁肀膇芀袇羆膇莂蚀袂膆蒅袅螈芅薇蚈肇芄芇蒁羃芃葿蚆罿节薁蕿袅节芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈芈螁螇莇莀薄肆莆薂蝿肂莆蚄蚂羈莅莄袈袄羁蒆蚀螀羀蕿袆肈罿芈虿羄聿莁袄袀肈蒃蚇螆肇蚅蒀膅肆莅螅肁肅蒇薈羇肄薀螄袃肃艿薆蝿肃莂螂肇膂蒄薅羃膁薆螀衿膀芆薃袅腿蒈衿螁膈薀蚁肀膇芀袇羆膇莂蚀袂膆蒅袅螈芅薇蚈肇芄芇蒁羃芃葿蚆罿节薁蕿袅节芁螅螁芁莃薇聿芀蒆螃羅荿薈薆袁莈芈螁螇莇莀薄肆 网上股评论文:基于语义的网上股评信息的提取研究【中文摘要】每天众多的财经网站会发布股票信息,这些信息数据量巨大、存在大量冗余和容易混淆的数据,一般的用户需要花费很多时间才能获得自己想要的股评信息。本文从国内互联网股评及网上信息抽取技术的分析入手,对网上股评信息的提取进行研究,具体工作如下:(1)采用网络蜘蛛的信息抽取技术实现了对网页上的信息提取。在网页中先定位到用户所需信息的链接的URL,并把这些URL放入等待抓取的队列中;然后依次下载每个URL对应的网页,对其HTML文档进行结构化分析,从中查找股票信息。(2)建立股评特征信息的词库。首先,根据对财经网站上的大量股评信息进行特征分析,找出既频繁出现、又能表示股票趋势的特征词汇。其次,由于所研究的股评信息具有前半句常为描述股票特征、后半句给出操作建议的结构,所以,对股评信息的前半句的分析得到描述股评的多特征词汇,有时表示为一个特征,有时需要用结合两个特征词描述,综合分析后可将这些特征词汇后建立特征词库、结合词库;对股评信息的后半句分析得到的建议词汇可组成建议词库。最后,对特征词库、结合词库、建议词库三个词库中的特征词汇进行总结。(3)利用所建立的特征词库对股评信息进行解析。首先从特征词库中依次.【英文摘要】Many financial web sites issue stock information every day. There are a huge amount of data and a large number of redundant and confused data on the web sites. The average users need to spend much time to get expected information about stockcomment. This paper analysed domestic stockcomment on the Internet and the the technology of information extraction, and make the study of extracting stockcomment from Internet.The studied work was as follows:(1)Achieve extracting information from the web page based .【关键词】网上股评 语义 网络蜘蛛 信息提取 股评特征【英文关键词】stockcomment in the internet semantic web spider extraction of information feature of stockcomment【目录】基于语义的网上股评信息的提取研究摘要4-5Abstract5-6第1章 绪论9-181.1 课题研究的目的和意义9-101.2 国内外研究现状10-161.2.1 国内互联网股评现状101.2.2 网上信息抽取技术现状10-151.2.3 语义的研究现状15-161.3 本文研究内容与结构16-18第2章 网上股评信息的提取18-322.1 网上股评信息的定义及内容18-202.2 网上股评信息的存储格式20-232.3 网上股评信息的提取原则23-252.4 信息抽取结果的衡量指标252.5 基于DOM的网上股评信息提取25-322.5.1 动态HTML文档对象模型26-272.5.2 信息提取过程27-282.5.3 提取模式28-32第3章 股评特征信息提取32-443.1 网上股评特征信息分析32-403.1.1 从股评信息中提取特征词32-393.1.2 从股评信息中提取出建议词39-403.2 网上股评特征信息的归类40-413.3 股评特征信息提取41-44第4章 股评信息提取模块的设计与实现44-544.1 模块的开发平台444.2 模块设计和系统界面44-544.2.1 模块总体设计44-454.2.2 网络蜘蛛的设计与实现45-514.2.3 股评特征词库的设计51-524.2.4 股评特征信息提取和存储设计52-54第5章 总结与展望54-575.1 研究工作总结54-555.2 研究工作展望55-57参考文献57-59致谢59-60攻读学位期间的主要研究成果60 蚄袀膇莀蚃羂羀芆蚂蚂膅膁艿螄羈肇芈袇膄莆莇薆羇节莆虿膂膈莆袁羅膄莅羃袈蒃莄蚃肃荿莃螅袆芅莂袇肁膁莁薇袄肇蒀虿肀莅蒀螂袃芁葿羄肈芇蒈蚄羁膃蒇螆膆聿蒆袈罿莈蒅薈膅芄薄蚀羇膀薄螃膃肆薃袅羆蒄薂蚄蝿莀薁螇肄芆薀衿袇膂蕿蕿肂肈薈蚁袅莇蚈螃肁芃蚇袆袃腿蚆薅聿肅蚅螈袂蒄蚄袀膇莀蚃羂羀芆蚂蚂膅膁艿螄羈肇芈袇膄莆莇薆羇节莆虿膂膈莆袁羅膄莅羃袈蒃莄蚃肃荿莃螅袆芅莂袇肁膁莁薇袄肇蒀虿肀莅蒀螂袃芁葿羄肈芇蒈蚄羁膃蒇螆膆聿蒆袈罿莈蒅薈膅芄薄蚀羇膀薄螃膃肆薃袅羆蒄薂蚄蝿莀薁螇肄芆薀衿袇膂蕿蕿肂肈薈蚁袅莇蚈螃肁芃蚇袆袃腿蚆薅聿肅蚅螈袂蒄蚄袀膇莀蚃羂羀芆蚂蚂膅膁艿螄羈肇芈袇膄莆莇薆羇节莆虿膂膈莆袁羅膄莅羃袈蒃莄蚃肃荿莃螅袆芅莂袇肁膁莁薇袄肇蒀虿肀莅蒀
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 舞蹈系毕业论文封面模板
- 低空空域风险评估与控制技术
- 2025年抢滩弃船演练记录范文
- 什么专业写毕业论文好写
- 网络直播平台内容监管与商业变现策略方案
- 药物警戒-内审人员理论考试试题及答案
- 英语专业毕业论文心理学
- 美容养生专业的毕业论文
- 创业团队组建与文化融合实践指南
- (完整版)2024年二级建造师市政真题及答案解析
- 盆栽养护知识培训课件
- 桥小脑角肿瘤护理查房
- 2025小学教师招聘考试试题及答案
- 2025年纪律作风测试题及答案
- 温室气体 产品碳足迹量化方法与要求 光缆
- 2025江苏苏州昆山国创投资集团有限公司第一期招聘17人笔试参考题库附带答案详解版
- 2025年建筑师考试答案-建筑师考试答案解析
- 新疆的历史文化课件
- 入场安全教育培训
- 艺术设计专业教学标准(高等职业教育专科)2025修订
- 代理记账风险管理制度
评论
0/150
提交评论