




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高丹 中国虚拟天文台研发团队,Chinese Virtual Observatory,大数据量交叉证认 算法研究,11/29-12/03,China-VO 2006, Guilin,2,内容,星表介绍 交叉证认的意义 现有的交叉证认工具 交叉证认概念 交叉证认方法比较 B-tree索引 HTM索引 HTM索引分区+kdtree 进一步工作,11/29-12/03,China-VO 2006, Guilin,3,星表,星表是包含天体信息(如赤经、赤纬、星等、流量)的二维数据表格 多波段:光学、红外、射电、X射线等 星表的每一行对应一个天体,不同星表的同一天体的共同属性是位置信息 赤经:0360度 赤纬:-9090度,11/29-12/03,China-VO 2006, Guilin,4,星表实例,11/29-12/03,China-VO 2006, Guilin,5,交叉证认的必要性,多波段数据急剧增长 革命性步骤:数据融合 联系桥梁:位置交叉证认,11/29-12/03,China-VO 2006, Guilin,6,交叉证认的意义,多波段数据融合,获得天体多波段信息 对天体的物理性质、演化规律获得更全面系统的认识 为进一步的统计分析、数据挖掘做准备 提取天体的参数越多,越有利于天体分类和测光红移的计算 增加了发现新天体的概率 LAMOST三大核心子课题之一 虚拟天文台数据融合必由之路,11/29-12/03,China-VO 2006, Guilin,7,现有的交叉证认工具,SIMBAD ALADIN NED MAST TOPCAT OpenSkyquery GVO-cross-match,11/29-12/03,China-VO 2006, Guilin,8,现有工具的优缺点,优点: 界面友好 数据资源丰富 缺点: 不能进行大样本的交叉证认 参数不能自由选择 交叉证认结果需要用户进一步加工 没有对结果进行分类 没给出交叉证认的概率 只能与特定的数据交叉证认,11/29-12/03,China-VO 2006, Guilin,9,交叉证认的概念,将不同星表或数据库中的源按位置属性将它们联系起来,在相同位置的源或一定误差半径范围内的源,被证认为是同一天体。,11/29-12/03,China-VO 2006, Guilin,10,证认的判断方法,有两个源分别在星表a、b中,它们的误差半径分别为r1,r2,它们的之间的球面距离为d。如果它们的关系满足 ,则认为它们是同一天体。,(1),11/29-12/03,China-VO 2006, Guilin,11,证认的判断方法(例子),2MASS:r1=0.1 ra=357.661036243116, decl=0.434507548194 SDSS:r2=0.1 ra=357.661059, decl=0.434484 d:0.000032746961 两个源满足(1)式,被证认为同一个天体,11/29-12/03,China-VO 2006, Guilin,12,索引,Indexing mechanisms used to speed up access to desired data.,11/29-12/03,China-VO 2006, Guilin,13,B-tree索引的交叉证认,为星表的ra,decl两列建B-tree索引 以小表为中心,在大表中遍历寻找证认源 以(1)式为判断 算法复杂度O(N*N),11/29-12/03,China-VO 2006, Guilin,14,B-tree索引的交叉证认(续),11/29-12/03,China-VO 2006, Guilin,15,B-tree索引方法优缺点,优点: 证认精度高 缺点: 内存限制,索引不好 速度慢,算法复杂度高,11/29-12/03,China-VO 2006, Guilin,16,HTM,The Spatial Index is a quad tree of spherical triangles. The tree is built in the following way: Start out with 8 triangles on the sphere using the 3 main circles to determine them. Then, every triangle can be decomposed into 4 new triangles by drawing main circles between midpoints of its edges,11/29-12/03,China-VO 2006, Guilin,17,HTM pcode,ra=45.0 , decl=66.0, level=14 N313330303330003,11/29-12/03,China-VO 2006, Guilin,18,HTM level,Level Area (arcmin2) Num Leaves 10 1.77E1 8,388,608 11 1.43E0 33,554,432 12 1.11E01 34,217,728 13 2.77E-1 536,870,912 14 6.92E-2 2,147,483,648 15 1.73E-2 8,589,934,592 20 1.69E-5 8,796,093,022,208 25 1.65E-8 9,007,199,254,740,922,11/29-12/03,China-VO 2006, Guilin,19,HTM索引的交叉证认,由星表的精度选取一定的HTM级数 由星表的ra,decl计算出HTM pcode值 两个B-tree索引 一个空间索引 N*N遍历 自然连接 省去(1)式判断,要求两个星表级数一样,即精度差不多,11/29-12/03,China-VO 2006, Guilin,20,HTM索引的交叉证认(续),11/29-12/03,China-VO 2006, Guilin,21,HTM索引方法优缺点,优点: 索引好,空间索引解决了内存限制问题 缺点: 速度慢,没有解决算法复杂度问题 认证精度低 漏源概率高 大量一对多、多对一混杂 要求两个表精度差不多,11/29-12/03,China-VO 2006, Guilin,22,HTM索引分区+kdtree的交叉证认,以小表为中心,把HTM索引当作分区 对每个分区的大表,把ra、decl作为参数建kdtree 对每个分区内的每个源,在kdtree中找最近邻 用(1)式证认判断 HTM级数比星表精度低,漏源可能性小,11/29-12/03,China-VO 2006, Guilin,23,HTM索引分区+kdtree方法优缺点,优点: 索引好,空间索引解决了内存限制问题 分区,算法复杂度降低,速度快 证认精度高 缺点: HTM级数难确定,11/29-12/03,China-VO 2006, Guilin,24,进一步工作,进一步改进和优化算法 尝试其他索引算法,如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 班组安全教育培训资料课件
- 2025年临沂平邑县部分事业单位公开招聘教师(17名)考前自测高频考点模拟试题完整答案详解
- 2025内蒙古赤峰市红山区“绿色通道”引进教师94人考前自测高频考点模拟试题及答案详解参考
- 2025年甘肃省嘉峪关市第五中学招聘公益性岗位人员考前自测高频考点模拟试题及一套答案详解
- 2025贵州医科大学附属乌当医院招聘合同制员工6人考前自测高频考点模拟试题附答案详解
- 2025广西贵港桂平市江口中心卫生院招聘3人模拟试卷附答案详解
- 2025年河北邯郸馆陶县公开招聘(选聘)辅助性岗位工作人员13名模拟试卷有完整答案详解
- 急性液气胸的临床路径优化-洞察与解读
- 2025年潍坊经济开发区公开招聘部属公费师范毕业生(1人)考前自测高频考点模拟试题及答案详解(典优)
- 2025年丽水市直事业单位公开选聘人员24人模拟试卷及答案详解(历年真题)
- Ice-O-Matic CIM登峰系列制冰机培训手册
- 《穴位埋线疗法》课件
- 【大型集装箱船舶港口断缆事故预防应急处理及案例探析7500字(论文)】
- 发展汉语-初级读写-第一课-你好
- 律师事务所人事管理制度
- 高中英语完形填空高频词汇300个
- 2023-2025年世纪公园综合养护项目招标文件
- 脑梗塞并出血护理查房
- 男朋友男德守则100条
- 医院感染科室院感管理委员会会议记录
- 鲁班锁制作技术
评论
0/150
提交评论