bibliomaniac 发表于 2009-5-13 23:11:20

《四部丛刊》电子版瑕疵举例


《四部丛刊》电子版不尽如人意的地方,对那些经常使用的人来说,想必不是什么新闻,电子化不彻底的问题早已经有网友提出过,不过还没见有网友发帖举例子,这里试举几个,虽然未必正确,但给偶尔用一用这个软件的网友提个醒,不要太信赖其文本,最好能核对原文图像,也许不是白费时间。因为只是一时兴起,为了写这个帖子的目的,从“初编”集部几本书的序文中临时找了几个例子,并不是为了全面清算这个软件的错误,也没有这个能力。抛砖引玉,也许有网友愿意做这个工作也说不定。

问题之一:电子化脱页或舛页
《唐丞相曲江张先生文集·序》中连续三页见下,中间一页显然是舛入的正文页:


   

原来应该占据这一页位置的序文页是脱漏了,还是和这里的正文页错位了,我没有细查,脱漏的序文内容见下二页:

bibliomaniac 发表于 2009-5-13 23:21:46

问题之二:电子化不彻底
也就是“文本页面”中保留原文图像,没有数字化,因而全文检索是检索不到的,这个问题在《文渊阁四库全书》电子版也见过(《广东通志》),但《四部丛刊》似乎要严重得多,尤其是在“续编”“三编”中,有不少行草字的序文完全没有数字化,初编也许相对认真一些,但文本中保留原文图像的还是不少,见下图:



原书文字漶漫难辨,有些也许情有可原,不过这种问题很多都可以参考《文渊阁四库全书》电子版解决,因为《四库》已经完全数字化,即使《四库》不收的书,也可以参考其他版本解决,不至于在文本页面中留下那么多刺眼的图片“补丁”,《四部》的电子化人马还真是懒了一点。有些字并不难认,却也保留图像而没有数字化,如下面的“若”字:

bibliomaniac 发表于 2009-5-13 23:30:47

问题之三:电子化讹字
电子化不彻底,用户一目了然,可以自己参考其他版本解决;电子版讹字的问题却不容易发现,因而更需要警惕,如下页加框的“高”字实为“尊”字:


又如下面加框标出的文字,对照原文图像,“史”实为“使”,“卬”为“即”,“去”为“吉”,如果参考《四库》电子版,这些问题本来都可以避免的:

页: [1]
查看完整版本: 《四部丛刊》电子版瑕疵举例