



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、论文格式要求一、总的要求全文一般不超过8000 汉字(约4000 英文单词),每篇论文均应有中英文两种文字的标题、作者、姓名、单位和不超过200 字的摘要。全文电子邮件投稿,要求Word2003 兼容的电子文档和 PDF 文档各一份。二、中文编排格式:大标题:居中,小二号,黑体,加粗,前空1 行作者:居中,小四号,仿宋,与题目之间间隔0.5行作者地址:五号,楷体,单倍行距中文摘要、关键词:小五号,楷体,与作者地址间隔1 行,“摘要”和“关键词”加黑全文中出现的英文单词或字母一律采用Times New Roman 字体英文题目:居中,小二号,加黑,与前面中文“关键词”行间隔1 行英文作者名:小四
2、号,与英文题目之间间隔0.5 行英文作者地址:五号,单倍行距英文 Abstract 和 Keywords :小五号,斜体,与作者地址间隔1 行,“Abstract ”和“ Keywords ”加黑正文:与前面的英文关键词间隔1 行,正文内容的汉字用五号字,宋体一级标题:四号,黑体,加粗,前后空0.5 行二级标题:小四号,黑体,加粗三级标题:五号,黑体,加粗参考文献: 小五号, 宋体, 具体请见参考文献编排格式,在正文中引用的汉语文献采用如下格式: 第一作者,年份 ,或者 第一作者等,年份1,年份2 ,或者 第一篇参考文献的第一作者,年份;第二篇参考文献的第一作者,年份, ;英文引用文献采用如下
3、格式: 英文第一作者的姓,年份 ,或者 英文第一作者姓 + et al.,年份 1,年份 2 行距:单倍行距三、英文论文编排格式:字体: Times New Roman英文论文需有中文摘要大标题:居中,小二号,加粗作者名字、通信地址、中英文摘要、关键词等分别参照上面对应的说明正文:五号一级标题:四号,加粗二级标题:小四号,加粗三级标题:五号,加粗参考文献:小五号,具体请见参考文献编排格式行距:单倍行距四、参考文献编排格式:编号:参考文献前不要加编号排序:作者姓氏的发音顺序排列格式:专著:作者1,作者 2. 出版年份 . 书名 .出版社所在城市名:出版社,出版年.刊物:作者1,作者 2. 文章名
4、 . 期刊名 . 发表年,卷或年(期) :起讫页码 .论文集:作者. 年份 . 文章名 . 论文集编者 . 论文集名 . 出版地:出版者,起讫页码翻译:原作者1,作者 2. 出版年份 . 书名 .译者名译 .出版社所在城市名:出版社外文第一作者姓在前,名字在后,姓与名中间用“,”分隔;除第一作者以外的姓名请.按正常顺序书写五、模板:中英文模板请见下页引入标点处理的层次化汉语长句句法分析方法李幸宗成庆中国科学院自动化所模式识别国家重点实验室北京100080E-mail :摘 要:在分析汉语标点符号用法和句法功能的基础上,本文提出了面向汉语长句的层次化句法分析方法。关键字 :人工智能、自然语言处理
5、、句法分析A Hierarchical Parsing Approach with Punctuation Processing for Long Chinese SentencesXing Li and Chengqing ZongNational Laboratory of Pattern Recognition, Institute of Automation,Chinese Academy of Sciences, Beijing 100080, ChinaE-mail :Abstract: Based on the analysis of the usage and the synt
6、actic function of Chinese punctuations, this paper proposes a new hierarchical approach to parsing the long Chinese sentences.Keywords: artificial intelligence, natural language processing, parsing1 引言句法分析算法的时间复杂度和句子长度密切相关,在不采用启发式策略处理的前提下,典型句法分析算法的时间复杂度都近似于句子长度的三次方1 。2 引入标点处理的层次化长句句法分析方法2.1 层次句法分析方法
7、首先对包含“分割”标点的长句进行分割,然后对分割成的各个子句单元分别独立地进行句法分析,从而获得最终整句的最大概率的句法分析树。长句分割对这种类型的问题,我们提出了一种子树粘接操作的方法来处理,从而将并列的成分合并。图 4 显示了这种子树粘接的操作过程。A 2 'A 2 'A 1A 2PPA 2PBPCA 1A 2PBPCABCA图 4.子树粘接操作公式如下:x(t ) s( f(t ) ( 1)句子的分布情况如下表1 所示:表 1.测试句分布文学11621 12336.06参考文献路甬祥 .科学的历史经验与未来. 自然科学史研究 .1998,17 (3) :197206.La
8、fferty, J., A. McCallum and F. Pereira. 2001. Conditional random Fields: probabilistic models for segmentingand labeling sequence data A. Harry Q. Bovik. Proceedings of ICML. Massachusetts, USA. Pages 282-289.Alshawi, Hiyan, Srnivas Bangalore, and Shona Douglas. 1998a. Automatic Acquisition of Hiera
9、rchical Transduction Models for Machine Translation. In Proceedings of the 36 th Annual Meeting of the Associationfor Computational Linguistics (ACL).Pages 41-47.Alshawi, Hiyan, Srnivas Bangalore, and Shona Douglas. 1998b. Learning Phrase-based Head Transduction Models for Translation of Spoken Utte
10、rances. In Proceedings of the International Conference on Spoken Language Processing (ICSLP) . Sydney, Australia. Pages 2767-2770.Error-driven Combination ClassifiersFang Xu,Chengqing Zong,Xia WangNational Laboratory of Pattern Recognition, Institute of Automation,Chinese Academy of Sciences, Beijin
11、g 100080, ChinaE-mail :Abstract: This paper proposes a hybrid error-driven combination approach to chunking Chinese base noun phrase (Chinese base NP), which combines TBL (Transformation-based Learning) model and CRF (Conditional Random Field) model.Keywords: Chinese base NP chunking, hybrid classif
12、ier错误驱动的组合分类器方法徐方 宗成庆王霞中科院自动化化研究所模式识别国家重点实验室,北京,100080E-mail :摘 要:本文采用一种新的错误驱动的组合分类器方法来实现中文base NP 识别。本文对中文和英文base NP识别技术现状进行了简要分析和概述。关键字 :中文 base NP 识别、组合分类器1IntroductionChunking means extracting the non-overlapping segments from a stream of data. These segments are called chunks (Dirk and Satoshi,
13、 2003).2Task Description2.1 Data RepresentationRamshaw and Marcus (1995) gave mainly two kinds of base NPs representation the open/close bracketing and IOB tagging.Figure 1: Fusion data flowEquations should be placed on separate lines and numbered. Examples of equations are given below.x(t )s( f(t )
14、( 1)The test corpus contains 50k words. Each word contains two Chinese characters in average.Table 1 presents the best results for our experiments.Table 1: the Best Experiment ResultsmethodPRF1SVM88.68%87.08%87.87CRF89.42%87.46%88.43Combination90.58%89.35%89.96ReferencesLafferty, J., A. McCallum and
15、 F. Pereira. Conditional random Fields: probabilistic models for segmenting andlabelingsequence data A.HarryQ. Bovik.Proceedings of ICML.Massachusetts, USA,2001. Pages282-289.Alshawi,Hiyan,Srnivas Bangalore,andShona Douglas.1998a. AutomaticAcquisitionofHierarchicalthfor Computational Linguistics (ACL).Pages 41-47.Alshawi, Hiyan, Srnivas Banga
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025近距离沙石运输合同样本
- 网络安全设备配置与防护题库 (信息安全领域实战项目)
- 幼儿园课件-认识蔬菜
- 肺癌放疗饮食护理
- 人教版小学一年级数学下册期中试题
- 眩晕护理方案及护理常规
- 三角形全等的判定(复习)教学任务分析
- 视网膜毛细血管前小动脉阻塞的临床护理
- 山东省济宁市2025年高考模拟考试地理试题及答案(济宁三模)
- 浙江省宁波市镇海中学2025年5月第二次模拟考试语文试卷+答案
- 2024-2025统编版道德与法治六年级下册期末考试卷附答案 (共3套)
- 2025年辽宁省本溪市中考一模英语试题(原卷版+解析版)
- DeepSeek赋能设计行业:AI提示词生成与3D建模自动化
- 2025新能源汽车充电桩建设合同
- 2025年江苏省南通市如东县实验中学中考一模英语试题(原卷版+解析版)
- 馅料间管理制度
- 2025年消防知识培训
- 上海健康医学院《SpringSpringMVCMyBais》2023-2024学年第二学期期末试卷
- 马尔代夫旅游介绍
- 保险行业档案管理培训
- 无废城市知识培训课件
评论
0/150
提交评论