




VIP免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、专利信息系统设计论文1专利信息可视化分析系统的需求分析 1.1专利信息可视化分析系统的建设目标 专利信息可视化分析系统的设计是把商业智能(BI)技术应用于专利信息分析,主要是为了实现以下建设目标:引入专利分析指标,用户可以不用知道专利指标的计算方式,只需要了解这些指标的用途,就可以利用系统得出分析结果。建立多维分析系统,为用户从多角度分析问题提供可靠的工具,从而为专利申请和专利战略制定提供准确、及时的依据。为企业了解竞争对手的核心技术和研究热点领域及确定专利申请战略、专利实施战略与专利保护战略服务。为发现科技创新人才提供支持。为国家从宏观层面发现技术发展趋势、提升科研水平、制定投入与产出规划等
2、提供决策支持。这些建设目标决定了专利信息可视化分析系统设计的功能目标,主要包括功能体系结构的说明、各模块之间关系的描述、系统界面形式的选择以及各个功能模块的设计。 1.2专利信息可视化分析系统的主要功能 专利信息可视化分析系统最主要的功能是对专利数据进行可视化分析并绘制相关图谱以及对相关数据进行挖掘与预测。专利信息可视化分析系统的总体功能结构。专利信息可视化分析系统主要由四大部分组成,即数据仓库、ETL系统、OLAP和数据挖掘。数据仓库是专利数据的存储地;ETL系统可以批量地把异构的专利数据进行处理;OLAP系统是多维分析专利数据的技术核心;数据挖掘就是从大量的专利数据中发现隐藏的模式和规律。
3、 1.3专利信息可视化分析系统的性能需求 与一般信息系统的性能需求相同,专利信息可视化分析系统的性能需求主要包括安全性需求、可靠性需求、用户界面需求、响应时间需求、灵活性需求、故障处理需求、可扩展性需求等。 1.4专利信息可视化分析系统的功能需求 专利信息可视化分析系统的功能需求可以定义为两大类,即多维数据数分析和专利数据挖掘。多维数据分析即多角度分析数据,专利信息可视化分析系统的分析角度包括专利申请时间(从整体和技术领域分析专利申请的趋势)、专利公开时间(分析专利的公开趋势,专利申请与公开的时间差,即专利申请延迟公开的大致时间)、专利代理机构和代理人(分析和评估专利代理机构和代理人)、专利申
4、请地域(分析专利地域分布趋势及各地域技术优势和人才分布情况)、专利权人(分析专利权人的技术状况、专利申请状况、专利质量和研究热点等)、专利发明人(发现高产专利发明人和核心技术人员,与专利分类号结合可以分析专利发明人的技术特点)、专利分类号(从IPC分类和专利技术领域分析专利信息,结合区域、发明人和专利权人可以综合分析专利数据,确定各区域、发明人、专利权人的技术特点和优势)、专利授权(观察专利授权状况及相关法律状态)、专利失效(观察专利失效状况)和专利类型(分析专利类型,并结合其他角度进行综合分析,如专利技术生命周期)等。用户可以自由选择数据分析的角度,系统还需提供数据筛选功能,如制定特定的专利
5、权人和时间段作专利分析,即数据切片,系统必须提供数据切片功能。专利数据挖掘功能包括专利发明人关联分析、专利权人关联分析、IPC关联分析、专利引证分析、专利聚类分析和专利申请时序分析等。专利发明人关联分析用来发现专利发明人之间的合作发明状况,并可以通过这个模型为企业选择合适的发明人和技术人才;专利权人关联分析用来发现专利权人之间的关系网络;IPC关联分析用来发现专利技术领域间的关系;专利引证分析利用专利之间的引用关系发现基础专利、核心专利、技术演变过程;专利聚类分析用来对专利数据进行划分;专利申请时序分析用来预测未来的专利发展趋势。 2专利信息可视化分析系统的设计思路 2.1专利数据仓库建立 2
6、.1.1维度建模 数据仓库的模型构建与一般事务型数据库模型构建方式不同。美国的K.alph在长期的数据库分析与设计中总结出了一种“维度建模”法。维度建模是一种将数据结构化的设计方法,并且提供快速查询功能。维度将对象分为度量和上下文。度量常常以数值形式出现,称为“事实”,事实被大量文本形式的上下文包围。上下文被直观地分割成多个独立的逻辑块,称为“维”。维度描述了度量上下文的“5W”(即Who、What、When、Where和Why)信息以及作用方式。 2.1.2专利数据的特征 充分了解现有数据的真实情况是影响数据仓库模型的重要因素。本系统通过中国专利数据库获取了20002012年湖南省专利申请数
7、据共计93754条,这些专利数据包括发明专利和实用新型专利,但不包括外观专利。 2.2专利数据处理 2.2.1专利申请日和公开日处理 专利申请日和公开日处理的过程如下:首先从原始的专利数据源的公开日字段和申请日字段提取出日期数据,然后将这两个字段的记录合并成为一个数据集,由于这个数据集中有大量的冗余数据,为提供性能需去除重复的数据,这里采用聚合的方式去除冗余数据。 2.2.2专利分类号处理 1)专利分类号处理的方案。原始数据中的专利分类号表述形式为C11B1/00(2006.01)I;C11B1/04(2006.01)I,以“;”为拆分符拆成多条记录存入数据仓库。这个步骤的处理将IPC数据首先
8、存入DimIPC维度表,其次还要将IPC和专利申请号关联起来载入FactIPC事实表进行技术分析。专利分类号处理通常有3种方案,根据专利数据处理时间和结果,本文采用方案三。2)专利分类号处理的数据流。专利分类号的处理由3个数据流和1个包含在循环容器中的数据流所组成,这4个数据流的具体执行方式如图9所示。数据流1把原始数据中的专利申请号字段和分类号全部读取到临时的记录集中,但是在FactIPC中已存在的不再读取。这时记录集中记录是以“专利申请号|分类号1;分类2;”的形式存储。 2.2.3专利事实表处理 专利事实数据处理可以包括3个方面:专利申请区域处理;专利代理机构处理;其他数据规范化处理。如
9、图10所示。 2.2.4专利授权和专利失效数据处理 专利授权数据处理比较简单。先把FactPatent事实表中的专利是否授权字段置为0,0代表专利没有授权。在原始数据源中读取的专利数据都是已经授权的专利数据,这里只要把获得原始数据中的专利申请号与FactPatent事实表中的数据进行比对,如果存在则将FactPatent事实表中的专利是否授权字段置为1,表示该条专利已经授权。专利失效的处理同专利授权。 2.2.5其他处理 专利发明人的拆分处理和专利权人的拆分处理与专利分类号处理类似。另外,还需要对一些在上述步骤中存在但尚未入库的数据进行手工处理。比如在进行专利事实数据处理的过程中,存在区域无法
10、匹配的数据,要仔细检查这些数据的错误原因,然后修改再入库。 3SSIS包处理和数据检查 SSIS包建立好后接下来就是执行。SSIS包执行完以后,这时数据仓库中已有了专利数据,为了确保数据的准确性还需要对数据进行检查,看看是否存在异常。而最重要的一步检查是查看专利的记录数是否与搜集的数据吻合。 5 1、最灵梦想是一个天真的词,实现梦想是个残酷的词。21.3.93.9.202106:4506:45:363月-2106:452、只有收获,才能检验耕耘的好处;只有贡献,方可衡量人生的价值。二二一二二一年三月九日2021年3月9日星期二3、不要放弃,你要配的上自己的野心,也不要辜负了所受的苦难。06:4
11、53.9.202106:453.9.202106:4506:45:363.9.202106:453.9.20214、找一个理由,否认忧伤,笑容就会灿烂到无所不在。3.9.20213.9.202106:4506:4506:45:3606:45:365、成功与不成功之间有时距离很短只要后者再向前几步。三月 21星期二, 三月 9, 20213/9/20216、只要努力抬起你的双脚,胜利将属于你。6时45分6时45分9-3月-213.9.20217、青春如此华美,却在烟火在散场。21.3.921.3.921.3.9。2021年3月9日星期二二二一二二一年三月九日8、真正没有资格谈明天的人,是那个不懂
12、得珍惜今日的人。06:4506:45:363.9.2021星期二, 三月 9, 20211、你始终不属于我,属于我的只是我自己。21.3.93.9.202106:4506:45:363月-2106:452、一份信心,一份努力,一份成功;十分信心,十分努力,十分成功。二二一二二一年三月九日2021年3月9日星期二3、你是唯一的,你是十分独特的,你就是你生命中的第一名。06:453.9.202106:453.9.202106:4506:45:363.9.202106:453.9.20214、要跟成功者有同样的结果,就必须采取同样的行动。3.9.20213.9.202106:4506:4506:45
13、:3606:45:365、我们的生命,就是以不断出发的姿势得到重生。三月 21星期二, 三月 9, 20213/9/20216、只要站起来的次数比倒下去的次数多,那就是成功。6时45分6时45分9-3月-213.9.20217、自知之明是最难得的知识。21.3.921.3.921.3.9。2021年3月9日星期二二二一二二一年三月九日8、勇气通往天堂,怯懦通往地狱。06:4506:45:363.9.2021星期二, 三月 9, 20211、最灵繁的人也看不见自己的背脊。21.3.93.9.202106:4506:45:363月-2106:452、最困难的事情就是认识自己。二二一二二一年三月九日2021年3月9日星期二3、有勇气承担命运这才是英雄好汉。06:453.9.202106:453.9.202106:4506:45:363.9.202106:453.9.20214、与肝胆人共事,无字句处读书。3.9.20213.9.202106:4506:4506:45:3606:45
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB32-T 5102-2025 森林步道建设规范
- 现代化工业厂房产权及使用权转让合同
- 机器设备抵押贷款合同样本
- 仓储物流安全生产责任书
- Brand KPIs for neobanking Upstox in India-英文培训课件2025.4
- 2025年翻译专业研究生入学考试试卷及答案
- 2025年电气工程与自动化专业综合能力测试试题及答案
- 2025年宠物护理与驯养专业知识考试卷及答案
- 一年级数学教案
- 歌舞厅行业人才需求分析
- 2025年安全生产考试题库:安全生产隐患排查治理安全教育培训试题
- 马列原著选读试题及答案
- 上海韵达java面试题及答案
- T/CIQA 32-2022出入境生物安全消毒服务机构质量管理要求
- 电竞店加盟合同协议书
- 6s安全管理考试试题及答案
- 【滇人版】《信息技术》四年级第4册 第10.1课《设置动画效果》课件
- 2025年甘肃省平凉市崆峒区中考二模英语试题
- 租房销售实战技能培训
- 2025巴州财睿金融投资管理限公司招聘6人易考易错模拟试题(共500题)试卷后附参考答案
- 2025国开电大《个人与团队管理》形考任务1-10答案
评论
0/150
提交评论