镜像合作、加深了解-BHL总部与BHL-China座谈成功举行
交流、共享、镜像合作、互通有无,生物多样性遗产图书馆项目(Biodiversity Heritage Library,以下简称BHL)自成立之初就一直身体力行实践着这一原则。日前,受中科院生物多样性委员会邀请,BHL项目总负责人Thomas Garnett、美国密苏里植物园生物信息学中心主任兼BHL项目技术负责人Christopher D. Freeland、技术指导Philipe Cryer、美国伍兹霍尔海洋研究所图书馆馆长Catherine N. Norton女士一行前来中国,一行与BHL-China工作组就项目进展、技术细节和合作方式等问题进行了座谈。中科院动物所纪力强研究员参加了此次座谈。
BHL-China工作组组长崔金钟博士对Thomas Gamett一行的到来表示热烈欢迎。Thomas Gamett以“生物多样性遗产图书馆-全球视野”为题率先向与会者介绍了BHL项目的产生背景、成员组成、远期规划和当前进展。他在报告中强调,虽然BHL由许多特定领域的图书馆组成,但其决不仅仅是一个单纯的数字图书馆项目。BHL以成员间的彼此信任与相互支持为合作基础,以生物分类学、系统学、进化生物学、生态学以及野生生物资源管理与保护等为学科基础,致力于在全球范围内保护与共享生物多样性相关的文献资源,并为相关领域、项目和人士提供服务。BHL-China工作组技术负责人许哲平博士向与会者详细展示了BHL-China的体系架构和建设情况。目前,BHL-China的主体架构已经基本搭建完成,相应的文献收集、图书扫描、词条提取工作也在有条不紊的开展。截止到2009年年底,BHL-China站点已累计收集图书225册;页码:127,021页;名称-页码词条记录:中文名-页码记录:130,910个;拉丁名-页码词条:129,105个。与会者,尤其是BHL项目总部方面对BHL-China节点的工作进展惊叹不已,均表示无论从平台搭建的技术水平、数据积累的质量数量还是从总体框架的宏观把握和未来发展的长期规划上,BHL-China 都大大超出了他们的预期。接下来,美国伍兹霍尔海洋研究所图书馆馆长Catherine Norton女士从自己的实际经验出发,生动描绘了其与Internet Archive (Internet Archive(archive.org)互联网档案馆,成立于1996年,由Alexa创始人Brewster Kahle创办,是一个Wayback machine公益性质的计划。Internet Archive定期收录永久保存全球网站可抓取信息-刘凤红注)合作的整套文献扫描工作流程,她表示,IA成熟的技术、专业的仪器以及丰富的经验为高质保真的还原一些年代久远的历史文献提供了保障。(BHL-China目前也正在与IA协商具体的合作事宜-刘凤红注。)Catherine Norton还系统介绍了BHL几个主要成员国和地区的著作权法律法规和通用的Creative Commons(知识共享)协议,并与与会者探讨了与相关出版社、机构和版权持有者可能的合作方式。BHL-China工作组表示,她的很多观点开启了项目组在争取版权许可方面的新思路,会为BHL-China以后开展相关的业务起到很好的借鉴作用。
平台搭建、数据存储、功能扩展是BHL项目的具体工作主线,这些工作离不开软、硬件建设和技术支持。BHL项目技术部总负责人Chris Freeland先生以文献选择-数据发布共享-后期扩展服务的工作流程为切入点,深入浅出地讲解了各个工作节点上的潜在问题、采取的技术措施以及实施效果。由于BHL项目同时有多个国家和地区的多家机构参与,不可避免地存在文献重复、标识混乱的问题,所以文献选择和去重处理是在文献扫描和数字化之前的首当其冲的重要环节。BHL目前通过采用以通用标识符模糊搭配为基础的去重工具和串联不同机构文献列表的方法解决该问题,并已在BHL-欧洲节点施行。对采集的数据采用通用标准进行标准化处理是文献采集环节的核心工作,Freeland先生在报告中强调了采用通用数据标准的重要性并对数据标准做了介绍。值得指出的是,BHL在功能扩展和服务方面做了大量的探索和尝试,包括:通过物种名称服务可以从多达5100万个物种名中或精确或模糊检索特定物种,并为物种名进行校正等;通过开放URL实现BHL文献引用的链接功能,并建立一个用户友好型的Citebank。在BHL站点展示环节,Freeland先生提到,目前,BHL平均每天收到8000余次的页面浏览量,生命大百科全书(EOL)中有约52万的物种与BHL相应页面进行了链接。云存储和计算技术、全球合作共享模式以及开源软件等的应用为这些功能和服务提供了良好的后台保障。此外,Freeland先生还简要介绍了BHL与IA之间以及BHL不同成员之间的数据共享以及镜像合作方式。随着项目的继续深入、数据海量存储需求的增加、用户访问量的持续上涨、对外服务的不断扩展,硬件的匹配会显得格外重要。技术指导Philipe Cryer先生在报告中详细分析并解答了BHL项目硬件资源建设的诸多问题。
座谈期间,Thomas Garnett一行由崔金钟主任和许哲平博士带领,参观了中科院植物所图书馆和文献信息中心网络部。许哲平博士现场讲解了目前植物所的文献储存现状以及网络部建设情况。
报告环节结束后,BHL与BHL-China工作组成员就具体的图书数字化工作流程、数据共享方式以及其他相关的技术细节进行了深入而热烈的交流。并在座谈会上就以后的交流方式和交流时间达成一致意见。双方都表示,这次会谈加深了对对方工作的了解,富有成效。BHL-China工作组成员更表示,通过该座谈,深化了对项目的理解,开拓了思路,增强了对项目成功持续开展的信心,。BHL总部方面还表示,会尽力争取安排BHL-China工作组赴美进行工作交流。(相信随着项目的开展,会有更多后续报道呈现。)
中科院生物多样性委员会办公室邵青博士全程出席了此次座谈。


