ABBYY与图书馆合作案例之一

ABBYY识别服务器为立陶宛国家图书馆(the National Library of Lithuania)开启新生,使网络获取过刊成为可能

“3个月完成50000册期刊,质量之高、花费的气力之少、付出的努力之小,成本之低以及时间之短,都超出预期!”
- Edvinas Ragutskis,“INFO-TEC”项目经理

立陶宛国家图书馆倨保存立陶宛文化遗产而傲,并且是欧洲图书馆TELplus项目的参与者之一。 TELplus由欧盟委员会资助,是“数字图书馆领域”欧盟数字内容计划的从属项目。这一项目旨在识别超过2000万页的不同语言的资料,使图书馆数据可通过开放式应用程序接口(OAI)获取,通过搜索结果的优化展示提出交互适用性(交互的适用性,包括系统界面是否适用)问题,并在语义互操作性包括多语言搜索和检索方面进行改进。作为该项目的一部分,1940年以前的立陶宛期刊档案需要在图书馆的门户网站上(www.epaveldas.lt)发布。

2008年春,INFO-TEC与ABBYY当地伙伴Affecto - Lietuva州立大学合作,中标执行这个项目。 “该项目的目标是建立一个基于档案馆,图书馆和博物馆为的文化遗产内容数据库”, INFO-TEC的Edvinas Ragutskis评论到。数以千计的过期报纸和杂志将被OCR并实现可搜索。如此重要和庞大的项目需要一个可靠的软件供应商提供服务,INFO-TEC知道ABBYY的OCR技术可以满足需要,因为他们有与ABBYY FormReader合作的良好的工作经验。

许多期刊十分易碎,因为我们得到的源TIFFs相当难以阅读。这是可以理解的,因为字体和语言都已有70-100年的历史“,E.Ragutskis继续说到,“我们的品质基准为95%,但尽管如此,ABBYY强大的OCR功能提供了比预期还要好的结果”。

这些成绩的确非常突出:
•INFO-TEC只用了立陶宛国家图书馆初步预算的1/4;
•识别和核查工作比预期的更容易;
•ABBYY识别服务器提供灵活的工作分配和优先处理顺序;
•结果比要求的时间传输得还要快

感谢ABBYY识别服务器和TEC与Affecto的经验,50000册历史期刊得以重生并上传到“电子遗产”门户网站,在那里这些资料可以很容易地通过关键字进行查询,并提供清晰地可读访问。因此,伟大的遗产得以永存!

刘凤红编译自http://www.abbyy.com/Default.aspx?DN=1e336d53-ea3d-4a2a-b376-7cc5962c05d5