天文学领域的e-Science应用——虚拟天文台.pdf
技 术 e-Science 应用 e-Science APPLICATION 本图片由作者提供 天文学作为一个古老而又神秘的学科,伴随最近十几年来天文望远镜和终端 设备技术的发展、天文观测数据速度的成倍增长,科学家面对海量数据发现新天体 新问题的传统研究方式也将面临着新变革。虚拟天文台的概念于2002年在美国被提 出,该概念的诞生正是基于e-Science技术的应用。 14 e-Science 2009年 APPLICATION e-Science 应用 天文学领域的e-Science应用 ——虚拟天文台 杨阳 崔辰州 中国科学院国家天文台,北京 100012 摘 要: 作为e-Science应用的天文学领域,虚拟天文台是数据密集型的在线天文学 研究和教育环境,它利用先进的信息技术实现对天文信息的无缝和统一访 问。上世纪九十年代末提出的虚拟天文台的概念满足了由于天文学领域数据 雪崩所带来的挑战。本文简要地介绍了全世界VO项目的国际虚拟天文台联盟 的状况,着重说明了中国虚拟天文台的体系结构、数据访问系统以及各种各 样的服务。 关键词: e-Science;天文学;网格;虚拟天文台 Virtual Observatory: the e-Science Implementation in Astronomy Yang Yang, Cui Chenzhou National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012,China Abstract: Virtual Observatory (VO), the e-Science implementation in Astronomy, is a data intensive online astronomical research and education environment, taking advantages of advanced information technologies to achieve seamless and uniform access to astronomical information. The concept of VO was introduced in late of 1990s to meet challenges brought up with data avalanche in astronomy. In the paper, current status of International Virtual Observatory Alliance from world wide VO projects are reviewed, a detail introduction of architecture, data access system and various services of Chinese Virtual Observatory is given. Keywords: e-Science; Astronomy; Grid; Virtual Observatory e-Science 总第五期 15 技 术 e-Science 应用 e-Science APPLICATION 1. 引言 美国、欧洲、日本、加拿大、英 于中国科研信息化的大潮之中。 国、印度、法国等纷纷提出了自 这样,China-VO就获得了两个外 虚拟天文台的概念于2002 己的虚拟天文台计划。中国于 力的带动:一方面它的服务目标 年在美国被提出,该概念的诞生 2002年成立了中国虚拟天文台 与LAMOST以及相关的科学目标紧 是基于e-Science技术的应用。 (China Virtual Observatory, 密联系,为中国天文学家建立了 e-Science由英国在2000年提出, China-VO),并于同年加入 一个便捷高效的天文资源访问平 是为了应对当时各学科研究领域 IVOA。目前,IVOA的成员国已达 台,定位明确、清晰;另一方面 所面临问题的空前复杂化,利用 16个国家。 它的发展也将得到国内e-Science 新一代网络技术(Internet)和广 域分布式高性能计算环境(Grid) 相关项目的支持。 2. 虚拟天文台的体系结构 2003年,China-VO的系统 设计第一次得到完整的阐述 [3] , 建立的一种全新科学研究模式, 即在信息化基础设施支持下的 中国虚拟天文台最大的特 2004年,崔辰州和赵永恒提出了 科学研究活动。此后,该理念便 点是:它是伴随国家重大科学工 China-VO的体系结构 [4] ,至此, 席卷世界各科研领域,大家都试 程大天区面积多目标光纤光谱天 China-VO的概念框架已经形成。 [2] 图用它来解决本学科在研究过程 文望远镜(LAMOST) 项目成长 在这个概念框架中,China-VO类 中遇到的种种难题。天文学作为 起来的,LAMOST是目前光谱获取 比于网格的层次结构设计了自己 一个古老而又神秘的学科,伴随 率最高的天文望远镜,届时将产 的层次结构(见图1)。图中, 最近十几年来天文望远镜和终端 生海量的数据。如何完成一个完 China-VO被定义了四层结构,从 设备技术的发展、天文观测数据 整的“从数据到科学”的网络化 下至上依次为构造层、资源层、 速度的成倍增长,科学家面对海 协同工作平台是非常重要的一个 汇集层和用户层。构造层包括各 量数据发现新天体新问题的传统 课题,因此,LAMOST的这些现实 种数据资源、计算资源、网络资 研究方式也将面临着新变革。 需求刺激了China-VO的创立和发 源和存储资源等。各种数据资源 e-Science的产生对于天文学领域 展。此外,China-VO的发展也处 在虚拟天文台这样一个数据密集 来说十分及时,也 促进了虚拟天文台 的诞生。2002年6 月,国际虚拟天文 台联盟(IVOA) [1] 正式成立,它的使 命在于推进国际合 作与协作,建设能 够综合利用各国天 文台数据的、完整 的、能协同工作的 虚拟天文台,开 发、配置必要的工 具、系统,建立相 应的组织结构。 16 图1 中国虚拟天文台体系结构 e-Science 2009年 APPLICATION e-Science 应用 型在线研究平台中占有非常关键 Resource Framework,它通过一 作为Web服务交互的结果而保存。 的作用,是VO成功运作的基础和 个隐含的资源模式为在Web服务 因此,伴随网格技术体系的不断 前提。它主要包括星表、星图、 之间创造有状态的资源定义了一 变迁,虚拟天文台也会处于不断的 光谱、时序数据、计数测量数 个系统。该架构定义了使用Web服 变化之中。可以说虚拟天文台的建 据、模拟数据、多媒体数据、天 务来访问有状态资源的一系列规 立和实现需要网格技术的支持,同 文文献等。资源层是以网格为代 范,包括Web服务资源特性(WS- 时,虚拟天文台也将为网格技术的 表的中间件为基础,配合其它系 Resource Properties)、Web服 发展提供最好的试验床。我们还可 统服务工具,利用标准的数据模 务资源生命周期(WS-Resource 以看出,China-VO的体系结构是一 型和服务模型,通过抽象化实现 Lifetime)、Web服务基本故障 个庞大的虚拟天文台范例,完全实 统一的数据访问和计算访问等功 (WS-Base Faults)和Web服务服 现这样一个大型的系统也会存在很 能。汇集层提供具有天文特色的 务组(WS-Service Group)规范。 多客观的困难,比如它所依托的网 各种服务,如数据处理、数据挖 这些新的规范在于使数据的值通 格中间件技术尚不成熟,牵涉面 掘、统计分析、可视化等应用服 过Web服务交互得以持久化,并且 广,特别是涉及IVOA的很多互操作 务。用户层是整个体系的最高 层,包括VO客户端和VO门户,直 接与虚拟天文台用户接触,用户 层的基本职能是用户任务提交和 处理结果返回,主要功能包括用 户登录、身份认证、VO资源浏 览、任务编制和提交、结果显 示、数据下载等。物理上,整个 系统是分布式的,在网络环境下 实现;逻辑上,通过网格等中间 件技术实现一个统一的整体。 由此我们可以很明显地看出 网格技术将承载着中国虚拟天文 台成长与发展,并且网格的研究 目标从资源的角度上来看和虚拟 天文台的目标是一致的,那就是 通过Internet架构实现最大限度 的网络资源共享。因此,它就自 然而然地在虚拟天文台的研究中 得到了广泛的应用。由于网格技 术作为一种较新的技术,也同样 处于一种探索阶段,其体系结构 在短短几年时间内也有所变迁, 从一开始的OGSA架构转向了WSRF 架构。WSRF的全称是Web Service e-Science 总第五期 图2 虚拟天文台数据访问系统体系结构 17 技 术 e-Science 应用 e-Science APPLICATION 协议并不成熟甚至尚未出现,以及 网格系统为基础环境,利用 的转换工具,没有一行执行代 系统开发者多数欠缺网格技术以及 OGSA-DAI [7]提供的基本数据访问 码,而是用XSLT实现了VOTable 天文背景知识等。中国虚拟天文台 服务,结合国际虚拟天文台联盟 和OpenOffice表格文档格式的相 在不能一口气完成一个大系统的研 (IVOA)制定的数据访问服务规 互转换。这个转换工具可以让 究与开发的情况下,选择了在这个 范和本项目的实际需求,以Web OpenOffice也能够浏览和编辑 框架指导下进行小项目的应用开发 Service和Grid Service的形式实 VOTable格式的天文星表数据。 作为中国虚拟天文台发展的方向。 现对异地异构数据库系统、文件 在VOTable浏览工具还比较缺乏 系统数据的访问功能。VO-DAS体 的时候,这样一个小小的插件有 系结构 [8]如图2所示。VO-DAS系统 助于天文学家从天文数据网站下 主要分成两个部分:DAS和Data 载了VOTable格式的数据以后迅 世界各国天文数据中心的数 Node。DAS是一个基于Web服务资 速浏览和编辑它们,还可以借助 据存储主要有三个特点:首先, 源架构(简称WSRF)的任务管理 OpenOffice将VOTable格式的数据 数据的分布性使天文学家对它们 服务。一方面它是一个用户作业 文件转换成自己需要的文本格式, 的访问变得更加复杂,对来自不 调度和管理服务,另一方面它管 以便于自己编写的程序的读取。 同数据库的数据进行交叉证认花 理Data Node,保证用户的数据查 同一年,China-VO发布了 费的时间较长;其次,数据的异 询请求找到正确的Data Node,找 VOImpat [10],VOImpat适合进行快 构性使得用户必须熟悉不同数据 到正确的数据资源。Data Node是 速的星空位置查找和主要星表的 库的操作方法,是非常耗时耗力 一个基于OGSA-DAI WSRF中间件的 联合查询。它支持DSS的图片检 的过程;最后,天文学产生的海 数据资源节点。数据(星表,图 索,只要给出天空的坐标就可以 量数据使得天文学家基于这些数 像或光谱)都通过Data Node提供 快速导入DSS的剪裁图像。同时, 据难以完成得更加精确或有新的 给DAS服务。数据的拥有者不需要 为了能够获得天体的更多信息, 发现,且存储管理的成本高。 了解DAS和Data Node之间的通讯 VOImpat还可以借助SkyPortal 那么如何提供给天文学家一个统 方法,只要按照要求将自己的数 (JDL数据挖掘原型中一个数据访 一访问这些异地异构的数据资源 据配置到一个就近的Data Node之 问模块)查询USNO、2MASS、NVSS 的方案,是虚拟天文台的一个重 下即可发布到DAS服务上。 等不同观测波段的主要巡天星 3. 虚拟天文台数据访问 要课题。因此,我们设计了数据 访问服务系统(VO-DAS) [5] 。该 表,将查询到的星表数据和图像 4. 虚拟天文台服务 系统要实现数据节点的自动资源 数据结合,提供每个天体的综合 信息。此外,在要求不高的情况 发现,能够统一访问异地异构的 这几年来,中国虚拟天文台 下,VOImpat还可以浏览本地FITS 天文数据库,支持天文数据的交 紧随计算机技术和网格技术日新月 格式的图像文件以及VOTable格式 叉证认或联合查询,能够访问不 异的变化,把天文应用产品的研究 的星表文件,并具有一定的图像 同类型的数据资源,包括星表数 与开发作为自身的发展方向。团队 处理能力。 据、图像数据和光谱数据,支持 经过多年来的努力,目前已经开发 2006年,China-VO又发布 尽可能多的数据访问量以及数据 完成并向国内外用户发布了一系列 了SkyMouse,一个桌面天文信息 结果的多种存储格式。 实用的工具和服务。 搜索工具,它可以通过鼠标选取 VO-DAS是一个建立在网格技 2005年,China-VO发布了 屏幕上的词组,从多个天文信息 术基础之上的异地异构天文数据 OpenOffice用VOTable转换插件 数据库中查找对应名称的天体数 访问平台。它以Globus Toolkit[6] V O F i l t e r [9]。 这 是 一 个 非 常 小 据 、 图 像 和 相 关 文 献 [11]。 该 工 18 e-Science 2009年 APPLICATION e-Science 应用 具可以让天文学家在阅读文献的 时候快速浏览某个感兴趣的天体 的数据信息,简单而实用。它同 时还可以成为天文爱好者的小工 具,了解更多的天体知识。该软 件客户端界面如图5所示,由图可 知它集成了Simbad、NED、VizieR Catalogue等多个天文数据服务。 2007年又完成了FitHAS [12]开 发。FitHAS是一个批量读取FITS 文件头并导入数据库的工具,主 界面如图4所示。对于历史观测遗 留下来的成千上万的FITS文件, 图3 SkyMouse的客户端 由于以前没有用数据库进行管 理,如果需要从中找到有用的内 容是非常困难的。FitHAS会自动读 取一个文件夹中的所有FITS文件 头信息,将它们装载到指定的数 据库中,图5所示为装载后的数据 库内容。这样,如果需要查找某 个特定天体相关的FITS文件,可 以直接利用数据库以特定查询条 件进行查询,找到相关的FITS文 件的相对存储位置。该工具对于 整理和管理FITS文件有很大的帮 图4 FitHAS主界面 助,从而从数据收集的角度支持 了天文资源共享。 5. 结论及展望 虚拟天文台的建设与发展, 为e-Science在天文学领域的应 用提供了一个很好的试验田。中 国虚拟天文台的产生正是由于国 际e-Science的大浪潮以及国内 LAMOST现实需求的驱动才得以 在短短的几年内迅速成长,开 图5 FITHAS数据库查看 e-Science 总第五期 发了一系列的工具服务,为天文 19 技 术 e-Science 应用 e-Science APPLICATION 学家的科学研究工作方式提供了 即“与国际虚拟天文台联盟标准 做。因此,我们也将在原有的工 便捷高效的手段。但是中国虚拟 兼容原则”、“以网格为基础架 作基础之上,不断地利用本土 天文台在很长时间内要保持可持 构原则”、“开放的软件、廉价 的优势为其注入新生的活力, 续的发展,正如赵永恒研究员所 的硬件原则”、“在战争中学习 并着力加强与国际方面的合作 说的要坚持“四项基本原则”, 战争原则”,还有很多工作需要 与交流。 参考文献: [1] IVOA.国际虚拟天文台联盟. http://www.ivoa.net. VOFilter:Bridging Virtual Observatory and Industrial [2] Y.H.Zhao.LAMOST project and its scientific goals. O±ce Applications.Chinese Journal of Astronomy and Publications of the Yunnan Observatory,1999,12:1-7. Astrophysics,2006,6:379-386. [3] 崔辰州.中国虚拟天文台系统设计. PhD thesis.中国科 [10] D.Wang,Y.H.Zhao.VO-IMPAT:Image Processing and 学院研究生院, 2003. Analysis Toolkit for the Virtual Observatory of China.Publ. [4] C.Z.Cui,Y.H.Zhao.Architecture of Chinese Virtual Nat. Astron.Obs.China,2006,3:295-303. Observatory. Astronomical Research and Technololgy. [11] C.Cui,H.Sun,H.Zhao.SkyMouse,An Integrated On- Publications of National Astronomical Observatories of China line Astronomical Information Access System.The Virtual (ISSN 1672-7673),2004,1(2):140-151. Observatory in Action:New Science,New Technology,and [5] 刘超,田海俊,高丹,等.异地异构天文数据资源的统一 Next Generation Facilities. 26th meeting of the IAU. Special 访问.天文技术与方法, 2007. Session 3,17-18,21-22 August,2006 in Prague,Czech [6] Globus Toolkit.http://www.globus.org. Republic,SPS3,#55,3,2006,8. [7] OGSA-DAI.http://www.ogsadai.org.uk. [12] Cui C. Z.,Li W.,Yu C.,Xu Z.,Zhao Y.H..Search and [8] 刘超. 基于虚拟天文台的数据挖掘技术及其在银河系晕 Location of FITS Data Files. Astronomical Research 结构研究中的应用. PhD thesis.中国科学院研究生院, 2003. and Technology. Publications of National Astronomical [9] C.Z.Cui,M.Dolensky,P.Quinn,Y.H.Zhao,F.Genova. Observatories of China,2007. 收稿时间:2009年4月3日 作者信息 杨阳 国家天文台,硕士,助理研究员,研究方向为虚拟天文台、天文信息技 术。 崔辰州 国家天文台,博士,副研究员,研究方向为虚拟天文台、天文信息技 术。 20 e-Science 2009年

天文学领域的e-Science应用——虚拟天文台.pdf




