已阅读5页,还剩53页未读, 继续免费阅读
(系统工程专业论文)基于模糊逻辑的专利数据层次分类研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 随着经济全球化的日益深入和知识经济的发展,知识产权,尤其是专利,引 起了国家、地区和产业界的高度重视,拥有核心技术专利已成为企业市场竞争的 战略制高点。专利数据含有大量有用信息,表明技术发展方向和趋势,对企业技 术研发策略的制定有重要参考价值。但目前的专利数据分析技术普遍存在着效率 低下,周期过长等弊端。专利申请量的激增一方面增加了对快速、自动专利分析 的迫切需求,另一方面又为基于数据挖掘技术的专利文本挖掘方法准备了充分的 资源,因此计算机辅助专利分析成为了大势所趋。 目前专利数据人工分类普遍存在着效率低下,错误过多等弊端;在实际专利 文本分类中,一篇专利文献可以属于不同的类别,在这方面与一般文本分类方法 是不同的;现有的专利文本分类大多都采用了传统的文本分类算法,没有考虑到 专利数据所涉及到多个学科领域,同族专利的相似度比较大等问题。 基于以上的考虑,本文着重研究了专利文本挖掘中的自动分类问题。首先 详细的说明了专利数据的信息特征以及国际i p c 分类的概况,并根据专利数据的 特点,提出了针对于专利数据的特征提取方法,在提到的特征提取方法当中,引 入了位置权重,使得专利文本向量表示更加准确;其次,在第四章当中概述了一 般文本分类算法,并延伸出了专利自动文本分类算法。基于考虑到对专利分析时 要对专利数据作深层次的细分,以及在研究同族专利时候,会有一些关于交叉学 科的专利归属于不只一个类别当中。我们提出了基于模糊逻辑的专利数据层次分 类算法,详细的算法在第五章当中做了比较详细的描述;最后,我们构建了一个 类层次结构模型,采用查准率和查全率作为分类结果的评价指标,对1 7 0 组专利 数据进行仿真试验,在第一,二层次上的都达到了比较理想的分类效果,在第三 层次上的分类效果一般,还需要新的改进。 关键词:专利分析模糊逻辑文本分类特征提取 a b s t r a c t 1 1 1t h ee r ao fe c o n o 血cg l o b a l i z a t i o n ,t h ep a t e n tt e c l l n o l o g yh a sb e c o m ea c o r e c o n l p e t i t i v e n e s so fac o 咖o r ar e g i o 玛a tm es 锄et i m e ;p a t e n t so fi 1 1 t e l l e c t u a l p r o p e r 哆a t t m c tr n o r ea n dm o r ea t t e n t i o n 舶mc o m p a n i e s h o w e v n l ep r e v a i l 啦 t e c h n o l o g yo fp a t e ma n a l y s i si sm e m c i e n ta n do fl o n gc y c l e t h es u r g i n go fp a t e n t a p p l i c a t i o l l si n c r e a s e dt l l ed e m a n df o ram o r er a p i d l ya u t o m a t i c a lp a t e ma 1 1 a l y s i s t e c h n o l o g y ;o nt h eo t h e r h a n d ,i tp r e p a r e sa d e q u a t er e s o u r c e sf o rt h ep a t e n tt e x t 越n gm e m o d sb a s e do nd a t ai i l i n i n gt e c h n 0 1 0 醪t h e r e f o r e ,c o m p u t e r a i d e dp a t e n t s a n a l y s i sw i l lb ea t r e n do ft h et i r n e s d e 氨e c t s ,s u c ha si n e m c i e n c y ,a i l dt o om a n y 血s t a k e sa n ds oo 玛a r ew i d e s p r e a d i i lm ec u r r e n ta r t i f i c i a lc l a s s m c a t i o n s ;i i lp r a c t i c a lc l a s s i f i c a t i o no fp a t e mt e x t ,a p a t e n tp 印e rm a yb e l o n g st o d i 虢r e n tc l a s s e s ,t h a tw a sd i 行e r e n tw i t hg e n e r a l t e s t c l a s s i 矗c a t i o n ;m o s tc l a s s i f i c a t i o n s0 fp 涨斌t e s tn o wa d o p tt h i e 缸a d m o n a lt e x t c l a s s i f i c a t i o na l g o r i t h m s ,w i m o u tc o n s i d e r i n gt h es p e c i a lp r o b l e m s ,s u c ha st 1 1 a tp a t e m d a t ai n v o l v e si i lc r o s s s u b j e c ta r e a ,a n dm el l i 曲s 砌l a r i 够e x i s t i i l gi nm ef a 觚l y p a t e n t s ,a n ds oo n b a s e do nt 1 1 ea b o v ec o l l s i d e r a t i o n s ,t k sp a p e rf o c u s e do nt h ep a t e mt e x tm m m gm t h ea u t o m a t i cc l a s s i f i c a t i o ni s s u e s f i r s t l y ,n l i sp a p e rf i r s t l yi n 切d d u c e di n f o 咖a t i o n c h a r a c t e r i s t i c so fm ep a t e n td o c u m e n t sa n dg e n e r a lc l a s s i 6 c 撕0 n so fn 锄a t i o n a li p c b a s e do nm ec h a m c t e r i s t i c so fp a t e n td o c 啪e n t s ,m i sp a p e rf 0 九a r d e dt h ef e a t u r e e x t r a c t i o nm e m o do fp a t e n td o c u m e m 7 i h ei n t r o d u c t i o no ft h el o c a t i o nw e i g h ti nt h e m e t h o dm a l ( e sm ev e c t o rd e s c n p t i o no fp a t e n t sd o c u m e n tm o r ea c c u r a t e s e c o n d l y , t l l ef o u m lc h a p t e ro u t l i n e dt h eg e n e m l t e x tc l a s s i f i c a t i o na l g o r i t h m ,a n df o n a r d e da p a t e n ta u t o m a t i c a l l yt e x tc l a s s i f i c a t i o na l g o r i t h m c o n s i d e r i n gt h ep a t e n td o c u i n e m s u b d i v i s i o no nd e 印l e v e li l lt h ep a t e ma n a l y s i s ,a i l dc r o s s d i s c i p l m a 巧p a t e n t b e l o n g i n gt om o r et h a no n ec a t e g o r yo nt h ef a i n i l yp a t e n ts t u d y ,w ea d v a n c e d ap a t e n t d a t ac l a s s i f i c a t i o na l g o r i t h mo nf u z z yl o g i c l e v e l t h e d e t a i l e d a l g o r i t l l i l l i s m e r p r e t e di nc h a p t e r5 f i n a l l y ,w ef 0 瑚u l a t e dac a t e g o 巧h i e r a u r c l l i c a lm o d e l ,a 芏1 d p r a c t i c es i m l a t i o no nt h e17 0p a t e n td o c u i n e n t s t h ec l a s s i f i c a t i o n si nt h e1 s ta n d 2 n d l e v e la r ei d e a l ,b u ts t i l ln e e d 帅r o v e m e n t si nt 1 1 i r d1 e v e l k e yw o i m s :p a t e n ta 1 1 a l y s i s ,m z z yl o g i s t i c ,t e x tc l a s s i f i c a t i o n ,f e a t u r ee x t r a c t i o n 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得苤壅盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名:诧拟l 签字日期:炒8 年与月扣日 学位论文版权使用授权书 本学位论文作者完全了解苤鲞盘茔有关保留、使用学位论文的规定。 特授权苤盗盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名: 签字日期:枷话年箩月;p 日 导师虢犀戊疹 签字日期:加踔岁月如日 第一章绪论 1 1 选题的背景和意义 第一章绪论 在全球化与知识经济时代,知识产权尤其是专利已成为国家、地区和企业竞 争力的核心。专利文献是新技术发展趋势汇集的集中地,也是竞争情报分析最重 要的信息源之一。专利文献包含着技术、市场、与其它类型资料的关系等多方面 的大量信息。通过阅读专利文献,可以了解具体技术细节;通过专利文献中固定 条目的统计分析,能够反映出一定的有关技术、市场及其它类型资料的信息。同 时专利文献提供的信息有许多是竞争者唯一的不得不向公众透露而在其它任何 地方都不会透露的某些关键信息,而且包含有战略方向、市场营销、知识产权、 人才等多方面重要竞争情报信息。随着中国经济的高速发展以及经济全球化的日 益深入,专利数据分析变得越来越重要。 专利数据分析不仅是企业争夺专利的前提,更能为企业技术研发、评估竞争 对手提供有价值的决策参考,而且通过分析某技术领域的专利现状,可识别出关 键技术,可以反映技术的发展变化周期,发现潜在对手以及潜在技术,分析并制 定竞争策略,为国家的宏观政策提供有价值的参考。因此,对于专利数据的分析 成为企业、国家提高其核心竞争力的一个必要手段。 近年来,国内开始注重专利数据的分析工作,相关单位逐步投入大量的人力、 物力和财力来进行专利数据分析工作,国家知识产权局与韩国合作推出了w i n l a b 专利分析软件;北理工大学朱东华教授对专利关键词识别以及分类算法做了大量 的研究,并进行了相关的技术分析和趋势预测n 1 ;在企业方面,东方灵盾公司在 专利检索与专利评估方面研发出了比较成熟的软件等。 对于专利数据分析工作,主要步骤乜1 可归纳大致如下: 一选题:确立研究主题的专利分析范围及目的; 二筛选:选定专利数据库,建立检索策略,下载相关专利文献; 三整理:对专利文献中数据进行加工,处理,提取相关的技术要素; 四摘要:依照目的,方法,效用等分别制作专利分析摘要表,进行专利数 据的内容分析; 五归类:按照主题对专利领域进行聚类,对专利数据进行分类; 六呈现:以多重分类表交叉分析专利文献,制作技术分布矩阵或专利地图; 七解读:判读量化图表与专利地图,进行技术分析与趋势预测。 第一章绪论 专利申请量的剧增,积累了海量的专利数据,这些专利数据涉及的专业领域 比较广泛,单单靠人工方式来完成以上七个步骤,需要耗费巨大的人力、物力。 因此,要使专利数据分析能够支撑各个产业领域的发展,采用计算机进行专利数 据的自动分析是十分必要的。 1 2 专利数据知识发现概述 数据库中的知识发现( j d ) 是从数据集中识别出有效的、新颖的、潜在 有用的,以及最终可理解的模式的非平凡过程。实际上,知识发现( i d ) 还 需要计算机反复探索数据库,以发现新的、有意义的规律,再经人工解读结果, 使得发现的规律变为有用的知识。 知识发现( k d d ) 大致分为以下几个步骤:l 数据预处理( s t e 衄i n g 分词, 特征表示,特征提取) ;2 挖掘分析技术( 文本结构分析,文本摘要,文本分类, 文本聚类,关联分析,分布分析与趋势预测) ;3 模式评估;4 可视化技术。根 据数据特性不同,知识发现可分为数据挖掘和文本挖掘,前者是结构化数据,后 者是半结构化或非结构化的数据。由于专利数据是半结构化的数据,因此在专利 数据知识发现的过程中,我们着重于研究专利文本挖掘。 1 2 1 专利文本挖掘研究现状 近年来,国内外开始重视专利数据分析与专利地图制作的工作,如美国、日 本、韩国等都陆续提供这样的服务 3 】。这些国家主要以人力进行专利分析,还没 看到专利内容主题自动分析工具的运用。韩国科资中心( s t i ) 运用过其本国 开发的p 认s 系统【4 j ,其主要功能是提供结构化资料的统计与制图。在商业化产 品方面,有k n o w l e g i s t 等产品协助分析专利内容 5 】,透过自然语言剖析与自动摘 要技术,提取了专利的应用方向,主要目标,专利方法,重要主题等,方便使用 者进行快速深入分析。 专利检索的目的有多种:技术调查,前案检索,销售购买专利等,相同的主 题但不同的目的会有不同的相关专利,因此可能需要不同的检索模式与技巧。在 某些情况下,单单检索出相关的专利还不够,需要进一步的分析,如产生专利地 图等以便理清各个专利间的关系。 在学术研究方面,国内的相关研究很少,大部分为企业管理,经济领域针对 其关心的议题进行专利方面的研究。国外则有s i g i r2 0 0 0 的专利检索工作坊 6 。 另外还有a c l 2 0 0 3 的专利文件处理的工作坊【7 】,其内容部分为n t c i r3 专利评 2 第一章绪论 比的结果报告,部分则为自然语言处理技术运用于专利自动分析的计划说明与目 前成果。 在专利内容的结构分析方面,s h i m o r i 等人针对日文专利的声明部分,作自 然语言的处理,将长句断成短句,以增加其可读性【8 】o 其利用构词分析器,语法 分析器,文法剖析器,修辞结果分析器以及针对专利文件自行整理的检索词,5 7 个前后文无关的文法等资源进行专利声明的分析与处理。 在专利的主题分析方面,l a 面r e l 等人运用类神经网络的自我组织图技术来 自动侦测专利的主题【9 】。他们从美国专利的摘要中,提取有关的方法,效用,标 题等内容的文字片段,在分别运用s o m 技术进行无监督式的自我学习与自动组 织,将相似的主题词与文件归类在一起,并以二维图显示出来,提供专业人员进 一步的分析与解读。其评估结果显示,按段落分别建出的自我组织图,比不分主 题段落而用全文产生的自我组织图,更能提供有用的分析资讯。 在专利的主题分类方面,新闻自动分类的研究研究很多,但是针对专利文件 做分类的研究很少,f a l l 等人【lo 】用美国专利文件建立了一份测试集,包括4 6 3 2 4 篇训练文件,2 8 9 2 6 篇测试文件,共1 1 4 个类别,4 5 1 个子类别。由于专利全文 长度差异极大,他们以四种方式提取内容来代表源文件:一,标题;二,宣告; 三,标题,发明人,应用领域;四,摘要;五,描述等五部分。运用n a i v eb a y e s , 壬心附,s 订等分类器做实验。实验结果显示,s v m 分类器效果最好,但计算最 耗时,蛋:n n 次之,n a i v eb a y e s 最差。 1 2 2 专利文本挖掘的方法 由于专利数据是半结构化数据,我们可以用一般的文本挖掘方法对专利数据 进行挖掘。文本挖掘可以对文本数据的内容进行总结,分类,聚类,关联分析, 分布分析以及趋势预测等【l 。文本挖掘的功能主要包括: ( 1 ) 文本总结 文本总结是指从文档中抽取关键信息,用简介形式对文档内容进行摘要或解 释。文本总结在有些场合十分有用,例如,搜索引擎在向用户返回查询结果时, 通常需要给出文档的摘要。 ( 2 ) 文本分类 文本分类是指按照预先定义的主题类别,为文档集合的每个文档确定一个类 别。用户不但能够方便地浏览文档,而且可以通过限制搜索范围来使得文档的查 找更加容易。利用文本分类技术可以对大量文档进行快速,有效地自动分类。 ( 3 ) 文本聚类 文本聚类的目标是将文档集合分成若干簇,要求同一簇内文档内容的相似度 第一章绪论 尽可能大,而不同簇间的相似度尽可能地小,可以利用文本聚类技术将搜索引擎 的检索结果划分为若干个簇,用户只需要考虑那些相关的簇,大大缩小了所要浏 览的内容。 ( 4 ) 关联分析 关联分析是从文档集合中找出不同词语之间的关系。b 血提出了一种从大量 文档中发现一对词语出现模式的算法,并用来在w e b 上寻找作者和书名的出现 模式,从而发现了数千本在a m a z o n 网站上找不到的新书籍。 ( 5 ) 分布分析 分布分析是指通过对文档的分析,得到特定数据在某个历史时刻的分布情 况。 ( 6 ) 趋势预测 趋势预测是指通过对文档的分析,得到特定数据将来的取值趋势。 在以上所提到的六种文本挖掘方法当中,文本分类,聚类在文本挖掘中应用 最广泛,也是结果最理想的两种方法,在专利文本挖掘当中,要经常的对专利文 献所涉及的领域进行聚类,然后再根据聚类的结果,对专利进行分类。在本文当 中,我们着重讲述了对专利文本分类的研究。 1 2 3 专利文本挖掘的过程 专利文本挖掘的主要处理过程是对大量专利文献进行预处理、特征提取,专 利文本分析、专利文本分类、聚类、关联分析、趋势预测,数据可视化等n 引。图 ( 卜1 ) 给出了专利文本挖掘的一般处理过程。 j 览掘,r 、 专f 上木分析 专l i 数据打旋 擎聱 _ 天j | j 分析 井手b 钾p 砖辨雨测 k 。j 拗 图( 1 一1 ) 专利文本挖掘的一般过程 1 3 专利文本分类的研究进展 用户 i p c ( 国际专利分类) 分类号包括了与发明创造有关的全部知识领域,知识 产权部门的专利审查员需要对新申请的专利分类,赋予相应的i p c 分类号,人工 完成工作量很大,费时费力采用自动或半自动辅助分类,可减少人为分类的 不确定性和分类错误,并减少审查员的工作量同时建立i p c 分类可以提高专利 4 第一章绪论 检索效率,检索的主要任务是检索技术主题的i p c 分类位置的判断和检索技术主 题的主题词的发现。然而专利的分类并不容易,主要原因有以下几点n 鲫: 1 i p c 类别繁多,最新版有近7 0 0 0 0 个类别,同时还有大量的科技术语。 2 i p c 类别中经常出现一些交互参考性的描述,如:“h 0 2 n9 9 0 0 :本小类其他组 不包含的技术主题”,“h 0 2 p5 0 4 :转入h 0 2 p2 9 0 4 ”等。 3 专利用语不规范,含有大量的模糊性、概括性的语言用以扩大自己的专利权 范围。 4 某些情况下专利需要分配多个分类号。 对于专利分类的研究逐渐开始,e p o ( 欧洲专利局) 在专利分类前要先进行 预分类以确定专利的大体类别:物理、化学、电子、还是机械。利用专利摘要和 正文,采用神经网络甄别算法对e p 0 专利数据进行分类实验,实验结果表明采用 正文要比摘要更加准确一些。采用自行设计的神经网络算法对w i p o ( 世界知识 产权组织) 数据进行实验,实验主要用于确定专利i p c 号的大类,给出了不同参 数下的实验结果,具有很好的参考价值【1 4 】。我国华南理工大学的丁月华采用核向 量空间模型对专利进行分类,效果优于直接采用向量空间模型 15 1 。但是,这些研 究都是基于现有专利的,没有考虑i p c 技术描述本身的信息。郭炜强的基于领 域知识的专利自动分类利用了这一信息,构造i p c 技术描述的向量空间模型, 但同时又忽略了海量的现有专利提供的经验信息【1 6 】。而且该模型未对i p c 技术描 述数据进行清洗处理,只是简单的计算专利与i p c 类别的夹角余弦,因此模型有 待改进。 本文在i p c 知识层次结构的基础上,构造了一个电子装置领域的类层次结构 模型( 见图5 2 ) 。对于专利数据来说,一篇专利文本可以属于多个类别,尤其 是在对交叉学科领域的专利文本进行分类时,我们要充分考虑到专利文本所要涉 及到的专业领域。我们在进行专利数据自动分类的时候,考虑到同族专利的相似 度比较大,很难清晰地确定一篇专利文本所属的类别,而采用模糊隶属度函数来 定义一篇专利文本在多大程度上属于哪一类,恰好可以解决这方面的问题,因此, 我们采用模糊逻辑的方法对专利数据进行自动分类。 1 4 本文研究的主要内容 简单地说,文本分类系统的目标和任务是:在给定的分类体系下,根据文本 的属性或内容,将大量的文本归到一个或多个类别中。文本分类是系统根据训练 集的样本数据信息总结分类规律并确定待分类文本的相关类别。 本文主要研究英文专利数据的挖掘。先将专利数据进行词条项选取,采用合 第一章绪论 适的特征提取算法对选取结果进行有效的处理,将其表示成向量模型,研究分析 与之相关的关键分类算法,并结合专利文本分类的自身特点和要求加以结合和改 进,最后实现对1 7 0 组专利数据的层次分类,最大化地提高分类准确率和分类精 度。论文的内容安排如下: 第一章绪论:介绍研究本文的背景及意义、专利知识发现概述以及专利文 本分类的研究进展,并概要介绍本文的研究的主要内容。 第二章简要概述专利信息特征以及国际i p c 分类。 第三章专利文本分类的特征提取技术:介绍文本的向量表示模型及各种特 征表示算法,分析各算法的原理、优缺点及适用领域,并提出了基于专利文献的 特征提取算法。 第四章专利自动分类算法:简单的介绍了各种文本分类的方法,以及简要 的说明了两种国内对专利自动分类算法的研究,并由此引出了本文要研究的内 容。 第五章提出了一种关于专利数据的层次文本分类的方法,考虑到交叉学科 领域的专利文献相似度较大,无法清晰的确定其所归属的类别,本文采用了模糊 逻辑的方法来实现。 第六章总结与展望:对目前的研究工作进行总结,提出需要进一步完善和 改进的部分,指明今后可能的研究发展方向。 6 第二章专利数据信息特征及国际i p c 分类 第二章专利数据信息特征及国际i p c 分类 2 1 专利数据信息特征 专利数据信息特征主要通过专利文献著录项目反映,著录项目是专利文献技术、 法律、经济三种信息特征的集合。无论是纸载体的专利检索工具书,专利光盘数据库, 还是网上专利检索,多以专利文献著录项目为检索入口,依据某一个或几个特征检索, 获取专利文献。检索结果往往获得另外一些专利数据信息特征,并以此进行再检索或 扩大检索。专利数据信息特征主要包括三个方面:技术信息特征,法律信息特征和经 济信息特征。 2 1 1 技术信息特征 顾名思义,技术信息特征是指揭示发明创造技术内容的信息特征,包括:某一技 术领域内的新发明创造,某一特定技术的发展历史,某一技术关键的解决方案,某项 发明创造所属的技术领域,某项发明创造的技术主题,某项发明创造的内容提要等。 反映在专利文献著录项目中一般有专门的i n i d 代码,如用于发明和实用新型的著录项 目: ( 5 0 ) 技术信息 ( 5 1 ) 国际专利分类 ( 5 4 ) 发明名称 ( 5 6 ) 单独列出的现有技术文献清单 ( 5 7 ) 文献或权利要求 ( 5 8 ) 检索领域 用于工业品外观涉及著录项目中也有类似的一组: ( 5 1 ) 工业设计的国际分类 ( 5 2 ) 国家分类 ( 5 3 ) 包含在一项组合( 成套) 申请或注册的工业设计标识 ( 5 4 ) 工业设计所涵盖的物品或产品的名称,或工业设计名称 ( 5 5 ) 工业设计的再现和再现相关的解释 ( 5 6 ) 现有技术文献目录 ( 5 7 ) 包含色彩指示的工业设计实质特征的描述 第二章专利数据信息特征及国际i p c 分类 著录项目代码( 5 1 ) 、( 5 2 ) 提供专利文献分类的相关信息,十分有用。可根据该 项目下提供的分类号检索不同时期的相同技术主题的发明创造,对于外观设计而言则 提供同类产品的不同设计。尤其是国际分类号,可以检索不同国家,不同时期的同类 技术主题的专利文献,从而了解发明创造所属技术领域在世界范围内的发展状况。 ( 5 6 ) 现有技术文献目录,揭示的是同类技术主题的现有技术信息,近年来欧洲 专利局,美国专利与商标局,英国德温特公司将其开发成专门的引文数据库,用于专 利文献的综合分析。 ( 5 8 ) 检索领域是审查员对发明创造申请技术主题的检索范围,对于扩大检索很 有参考价值。 2 1 2 法律信息特征 法律信息特征是指揭示与发明创造的法律保护及权利相关的信息特征,包括:某 项发明创造专利申请是否授权,某项发明创造专利申请请求法律保护的范围,某件专 利受保护的地域范围,某件专利的有效期,某件专利的权利人等。反映在专利文献著 录项目中涉及的i n i d 代码有很多,按类别划分包括以下内容: 各种号码:( 1 1 ) 文献号,注册号和或外观设计文献号,( 2 1 ) 申请号等。 各种日期:包括( 2 2 ) 申请日期,( 2 4 ) 权利生效日期等。( 2 2 ) 申请日揭示的法 律信息非常重要,它不仅是新颖性判定,先用权认定的界定日,也是大多数国家专利 或注册证书有效期计算的起始日;( 4 4 ) 经过审查的专利文献,对于该专利申请在此日 或仅为临时授权,通过印刷或类似方法使公众获悉的日期,这一项也是一个重要的权 利有效期的时间起点,因为有些国家将文献的公告日作为权利有效期计算的起始日。 优先权数据包括:包括( 3 1 ) 优先权申请号,( 3 2 ) 优先权申请日期,( 3 3 ) 优先 权申请国家。 当事人标识:包括( 7 3 ) 权利人,持有者,受让人或权利所有人名称或姓名,( 7 8 ) 当权利人变更时,新权利人的名称和地址等。 2 1 3 经济信息特征 经济信息特征是指揭示发明创造潜在的市场前景,经济价值的信息特征,包括: 某项发明创造寻求保护的地域范围,拥有的同族专利数量,对同一技术问题不同技术 解决方案进行比较,可以使人们了解各国在不同技术领域发明创造的活跃或衰落程度, 企业正在进行的商业活动,正在开辟的技术市场,某项产品销售的国家或地区,权利 人建立生产基地的国家等,从而确定较为经济的技术发展战略。值得注意的是,专利 文献的经济信息往往是从技术信息和法律信息入手。通过对大量的专利文献进行分析 第二章专利数据信息特征及国际口c 分类 和综合而得出的。直接反映在专利文献著录项目中的i n i d 代码如下:( 8 1 ) 依据专利 合作条约的指定国,( 3 0 ) 优先权数据,( 7 1 ) 申请人姓名,( 8 4 ) 根据地区专利条约的 缔约国,( 9 2 ) 第一次国家允许作为药品向市场供货的日期及号码( 用于补充保护证书) , ( 9 3 ) 第一次允许作为药品向地区经济共同体市场供货的号码,实施日期及国家( 用 于补充保护证书) ,( 8 8 ) 权利人拥有真正有效地工业或商业场所的所在国等。 2 2 专利说明书的组成部分 目前各国出版的专利说明书的组成部分基本包括:扉页,说明书,权利要求书, 摘要,附图,有些国家出版的专利说明书还附有检索报告。专利说明书各组成部分从 多角度揭示了发明创造的技术信息和法律信息。因此,了解专利说明书的各个组成部 分,对阅读,理解专利说明书的内容,进行专利数据的自动文本分类算法至关重要。 2 2 1 扉页 2 0 世纪7 0 年代末,专利说明书扉页( 类似书籍的标题页) ,相当于专利说明书的 一览表,成为了解整篇文献非常有用的一页。这是由各工业产权局在出版专利说明书 时增加的,基本结构大致相同:均包括著录项目,摘要或权利要求,一副主要附图三 部分内容: l 著录项目 著录项目是专利文献技术、法律、经济三种信息特征的集合。通常用一套国际承 认的著录数据标识代码( i n t e m a t i o n a l l ya g r e e dn 曲e r sf o r l ei d e n t i f i c a t i o no f d a t a ) , 简称i n i d 码,由圆圈或括号中的两位阿拉伯数字表示,i n i d 码的优点在于浏览各国 专利文献时不受语言限制,能够引导专利文献用户快速寻找相关专利信息和简要解释。 各国专利说明书扉页中使用的基本著录项目有以下几部分: 文献标志:( 1 1 ) 文献号,( 1 3 ) 文献种类代码,( 1 9 ) 国家或组织代码; 专利或补充保证书申请数据:( 2 1 ) 一( 2 6 ) 申请号,申请日期等; 优先权数据:( 3 1 ) 一( 3 3 ) 优先权申请的国家,日期及申请号; 文献的公知日期:( 4 3 ) 一( 4 5 ) 各种说明书的出版日期; 技术信息:( 5 1 ) 一( 5 8 ) 专利分类,发明题目,发明文摘,权利要求,检索领域 等; 与文献有关的人事引证:( 7 1 ) 一( 7 4 ) 专利申请人,发明人姓名; 除巴黎公约之外的国际公约有关数据:( 8 1 ) 依据专利合作条约的指定国,( 8 4 ) 根据地区专利条约的缔约国。 9 第二章专利数据信息特征及国际i p c 分类 2 摘要或权利要求 摘要是说明书技术内容的概要。一般写明发明创造的名称和所属技术领域,并清 楚的反应所要解决的技术问题,解决该问题技术方案的要点及主要用途。化学方面的 摘要还应有最能说明发明创造主题的化学式。各国对摘要字数均做限制,最多不超过 2 5 0 个词,通过阅读摘要,判定是否需要查阅说明书全文,是进一步检索的有效手段。 有些国家在扉页中刊登独立权利要求,表述请求法律保护的范围。 3 主要附图 扉页中的主要附图一般是一幅最能说明发明创造技术方案主要技术特征的附图。 2 2 2 说明书 说明书是清楚完整的描述发明创造的技术内容的文件。各国对说明书中发明描述 的规定大体相同,以中国为例,说明书应当包括下列内容: 技术领域:写明要求保护的技术方案所属技术领域; 背景技术:写明对发明或者实用新型的理解,检索,审查有用的背景技术,有可 能的,并引证反映这些背景技术的文件; 发明内容:写明发明或者实用新型所要解决的技术问题以及解决这些技术问题采 用的技术方案,并对照现有技术写明发明或者实用新型的有益效果: 附图说明:说明书有附图的,对各附图作简略说明; 具体的实施方式:详细写明申请人认为实现发明或者实用新型的优选方式;必要 时,举例说明;有附图的,对照附图说明。 2 2 3 权利要求书 权利要求书记载的是申请人请求专利保护的范围。权利要求书应当说明发明或者 实用新型的技术特征,清楚简要地表述请求保护的范围。当发明创造被授予专利权之 后,权利要求书就是确定该发明创造专利权范围的依据,也是判断他人是否侵权的依 据,权利要求书具有直接的法律效力。权利要求书与说明书之间有着密切的联系,权 利要求书应当以说明书为依据,说明要求专利保护的范围。 权利要求分为独立权利要求和从属权利要求。以中国为例,独立权利要求从整体 上反映发明或者实用新型的技术方案,记载解决技术问题的必要技术特征。从属权利 要求用附加的技术特征,对引用的权利要求作进一步限定。 权利要求的撰写,对于发明创造取得有效保护至关重要。如果转写不好,一项有 价值的专利申请会由于权利要求没有覆盖所有新的实用新型特征或者表述不当而得不 到保护。 1 0 第二章专利数据信息特征及国际i p c 分类 2 2 4 附图 附图用于补充说明书的文字部分。在许多国家,附图被看成是专利申请文件中的 一个独立部分,而在中国,附图是说明书中的一部分。附图和说明书一起构成权利要 求的基础。 附图包括:示意图,顺序图,流程图,数据图表,线路图,框图和化学结构式等。 但多数化学结构式并不作为附图单独刊载,而是随着对发明创造内容的描述出现的说 明书当中相应的各部位中。摘要中,化学结构式则是以附图的形式出现。 2 2 5 检索报告 检索报告是专利审查员通过对现有技术进行检索,反映检索结果的文件,相当于 一份与专利申请所属发明创造有关的文献清单,通常与专利申请说明书一起出版或单 独出版。检索报告对于评价发明创造的新颖性和创造性,决定是否授予专利权十分有 用。申请人可根据检索结果对权利要求进行删改。对于申请人的竞争对手或者其他任 何人而言,检索报告时预测该申请能否被授权的参考依据。 检索报告有两种形式:一种是检索报告,另一种是以专利文献著录项目的形式刊 登在说明书扉页上。目前,一些国际性专利组织如欧洲专利局,欧亚专利局和世界知 识产权组织国际局采用检索报告形式,其格式基本相同。 2 3i p c 分类系统层次结构 国际专利分类表的内容设置了包括与发明创造有关的全部技术和领域,将不同的 技术领域概括分为8 个部分,每一个部分定位一个分册,用英文大些字母a _ h 表示,i p c 分类体系是由高到低以此排列的等级式结构,设置的顺序是按部,大类,小类,大组, 小组进行划分盼 。 其中这8 个部所涉及的技术范围是: a 部:人类生活必需 具体包括有关农,林,牧,渔,食品,烟草,个人与家用物品与设备,医疗保健, 文娱体育用品,消防,救生等技术领域的分类号。 b 部:作业;运输 具体包括有关分离与混合,成型加工,印刷,办公用品,装饰艺术,交通运输, 输送,包装,贮存,卷扬,提升,鞍具,室内装潢,微观结构等技术领域的分类号。 c 部:化学:冶金 具体包括有关化学,冶金等技术领域的分类号。 第二章专利数据信息特征及国际d c 分类 d 部:纺织;造纸 具体包括纺织,绳缆,造纸等技术领域的分类号 e 部:固体建筑物 具体包括有关建筑,水利工程,锁,保险柜,采矿等技术领域的分类号。 f 部:机械工程;照明;加热;武器;爆破 具体包括有关发动机,泵,一般工程,工程元部件,照明,加热,武器,爆破等技 术领域的分类号。 g 部:物理 具体包括有关仪器,光学,控制与调节,计算与计算机,信号装置,乐器,核子学 等技术领域的分类号。 h 部:电学 具体包括有关电器元件,发电与输变电,基本电子电路,电通信等技术领域的分类 号。 分部:分部是为了帮助使用者对部的内容有一个概括性的了解,帮助使用者了解 技术领域的归类情况,部内设置了由技术范围所构成的分部。分部没有类号,只有信 息性类名,是将有关技术领域进行归类,起到信息的指引作用。因此在一个完整的分 类号中,没有表示分部的符号。 大类:每一部按不同的技术领域分成若干个大类,每一个大类的类名对它所包含 的各个小类的技术主题做一个全面的说明,表明该大类所包含的主题内容。每一个大 类的类号由部的类号和其后加上的两位数字组成。 小类:每一个大类包括一个或多个小类。国际专利分类的设置原则是通过各小类 的名称,结合小类的有关参见或附注尽可能精确地定义该小类所包括的技术主题范围。 大组:大组的类号是由小类类号加上一个1 3 位数字“0 0 ”组成,大组的类名明 确表示可以分类,可以检索发明的技术主题范围。 小组:小组是大组的部分,大组可以细分成若干个小组。每一个小组的类号有小 类类号加上一个1 3 位数,后面跟着斜线“”,再加上除“0 0 ”以外的至少两位的数组 成。小组的类名明确表示可检索属于该大组范围之内的一个技术主题范围,小组的类 名前加上一个或几个圆点表示该小组的等级位置,即表示一个在它上面,离它最近的, 又是比它少一个圆点的那个小组的细分类。 2 4 专利数据分析方法 专利分析法是指对有关的专利文献进行筛选、统计、分析,使之转化成可利用信 息的方法。专利分析首先要进行专利检索,检索一般包括查新检索、专利法律状态检 第二章专利数据信息特征及国际i p c 分类 索、技术跟踪检索、侵权防御性检索等。检索入口可以是某一技术主题( 关键词或分 类号) 、专利申请( 专利权) 人( 国家、公司、个人) 、专利申请( 公开) 时间、专利地域 或组合检索,形成对某一技术、重要国家、重要公司、某一自然人、主要竞争对手在 一定时间和地理范围内的专利状况研究。 专利分析法分为定量分析和定性分析两种。定量分析即对专利文献的外部特征( 专 利文献的各种著录项目) 按照一定的指标( 如专利数量) 进行统计,并对有关的数据 进行解释和分析。定性分析是以专利的内容为对象,按技术特征归并专利文献,使之 有序化的分析过程。通常情况下需要将二者结合才能达到较好的效果。 2 4 1 专利数据的定量分析 专利分析的定量指标较多,不同的指标从不同的角度揭示专利信息。许多国家和 知识产权咨询机构都建立了自己的一套分析指标体系,比如美国摩根研究与分析协会 ( m o g e er e s e a r c h a n a l y s i sa s s o c i a t i o n ) 、美国知识产权咨询公司c 眦等。而由 于各国家、地区申请专利的习惯并不相同,指标的计算方式也可能有所不同。早在1 9 7 0 年代早期,c h i 便与美国国家科学基金会一起研发出全球第一个科学成果指标,美国国 家科学基金会编写出版的美国科学与工程指标报告了采用c h i 的专利指标体系u 引。 o e c d 科技指标系列手册即弗拉斯卡蒂系列手册中的专利手册也介绍了c h i 指标的 概念和计算方法,并指出c h i 的指标最初主要针对公司设计,但同样适用于国家、地 区。下面将c h i 一些主要指标及其它一些常用的指标介绍如下鹏3 : 指标名称 含义应用 专利数量一段时间内各技术领域、各国:通过组合对比可评估当年或历 家、各公司、个人的所获得的阵某一技术领域、国家、公司 专利数量戮个人的技术活动程度和水 - 、 ,。 专利相对产出指数l 公司在某技术领域的专利申盱估公司在整个竞争环境中的 ( a c t i v i t yi n d e x ) 猜量与产业专利申请量的比相对位置。 豳| 同族专利指数藻专利权人在不同国家或地反映专利权人申请的地域范围 l 区申请、公布的具有共同优先及其潜在的市场战略 淑的一组专利数量; 专利成长率糜权利人在某段时间获得的i 计算当前较前阶段增减的幅 l 声利数量上一阶段的专利数;度,可显现技术创新随时间的 疆变化是增加还是迟缓 第二章专利数据信息特征及国际i p c 分类 引证指数莱专利被后继专利引用的绝弓i 证次数高,代表该技术属于 对总次数湛础性或领先技术,处于核心 ;j 叉卜域7 比。 。仅小,义入烈。 即时影响指数某产业或企业前五年专利的如果实际被引用数与平均值相 ( c u r r e n ti m p a c t当年被引次数系统中所有专| 等,当前影响指数即为1 。指数 i n d e x , c i i )利前五年专利的当年被引用l 大于1 ,说明该技术有较大影 次数的平均值| 响,小于1 ,则说明影响较小。 技术强度( t o t a l专利数量当前影响指数专利数量在质方面的加权,评 t e c h n o l o g y ( c i i ) 牯公司专利的技术组合力量 s t r e n g t h , t t s ) 相对专利产出率某权利人在某一领域的专利判断权利人的竞争位置,产出 申请量全部竞争者的申请量率越高,竞争力越强 技术重心指数权利人在某技术领域的专利判断某一国家和公司的研发重 申请量其全部申请量| 点 科学关联性某公司专利平均所引证的科评估某专利技术创新和科学研 ( s c i e n c el i n k a g e ,研学术论文或研究报告数量究关系。 s l ) 技术生命周期企业专利所引证专利之专利评估企业创新的速度或科技演 ( t e c h n 0 1 0 9 y年龄的中位数;化速度。t c t 较低,代表该技术 c y c l e t i m e , t c t ) 皲新且创新速度快。 科学力量( s c i e n c e专利数目科学关联性御估一家公司使用基础科学建 s t r e n g t h ,s s )该公司专利组合的程度和 l 公司在科学上的活跃强度。 专利指标的使用的注意事项: ( 1 ) 专利指标的细化、综合和时间、空间的分析。上述专利指标的描述还是比较粗糙, 还可进行进一步的细分,比如引证率可分为自我引证率和被( 外界) 引率。自我引证 率描述后续专利引用自身专利的情况,引证率越高说明研发的自主性越强,被引
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新能源开发项目合同范本及注意事项
- 我的超级好朋友作文9篇
- 社区服务志愿服务承诺书范文7篇
- 2025年矿山救护指挥员三级安全教育试卷及答案:指挥能力篇
- 基于微锥结构的光纤微光学技术:原理、特性与多元应用探究
- 电力变压器维护保养施工方案
- 公司管理岗位资格评定规范
- 合同事务年终总结报告
- 2025年企业内部劳务外包合同简易版
- 重钢混泥土建筑施工方案
- 《义务教育英语课程标准(2022年版)》测试题5套(含答案)
- 2024新《公司法》亮点全面解读课件
- 《两办意见》(关于进一步加强矿山安全生产工作的意见)培训课件2024
- 特种设备检验申请单
- 数学与土木工程的交叉应用
- 小学六年级数学上册应用题100道(全)-及答案
- 2023年延安市安塞区社区工作者招聘考试真题
- 全国主要水文站点及雨量观测分布和代码
- 2023年贵州省遵义市中考地理试卷真题(含答案)
- 儿童文学教程第2版(学前教育专业)PPT全套完整教学课件
- 中国绿色建筑三星认证标准
评论
0/150
提交评论