Gossudar 发表于 2006-4-7 17:55:42

发布:The Unknown Rilke, translated by Franz Wright。并讨论电子书制作

http://www.myrilke.com/bilder/unknown.jpg
The Unknown Rilke (Field Translation Series) (Paperback)
by Rainer Maria Rilke, Franz Wright (Translator)
Paperback: 176 pages
Publisher: Oberlin College Press; Exp edition (March 1991)
ISBN: 0932440568
Product Dimensions: 7.5 x 5.0 x 0.5 inches
Price: $12.95
http://www.amazon.com/gp/product/0932440568/102-5748729-2564103
下载地址:
ftp://dasha.kmip.net/The_Unknown_Rilke,_translated_by_Franz_Wright.rar
或者留下Email,Dasha负责传递。

Franz Wright
弗朗茨·莱特
http://www.myrilke.com/bilder/wright.jpg
Franz Wright, the son of the poet James Wright, was born in Vienna in 1953 and grew up in the Northwest, the Midwest, and northern California. His most recent works include Ill Lit: Selected & New Poems and an expanded edition of translations entitled The Unknown Rilke. He has been the recipient of two National Endowment for the Arts grants, a Whiting Fellowship, and the PEN/Voelcker Award for Poetry, among other honors. He lives in Waltham, Massachusetts, with his wife, Elizabeth.\"
Poetry Books by Franz Wright: Tapping the White Cane of Solitude (1976); The Earth Without You (1980); 8 Poems (1981); The One Whose Eyes Open When You Close Your Eyes (1982); Going North in Winter (1986); Entry in an Unknown Hand (1989); And Still the Hand Will Sleep in Its Glass Ship (1991); Midnight Postscript (1992); The Night World & the Word Night (1993); Rorschach Test (1995); Ill Lit: Selected & New Poems (1998); Knell (1999).
Translations by Franz Wright: Jarmila. Flies: 10 Prose Poems by Erica Pedretti (1976); The Life of Mary (poems by Rainer Maria Rilke, 1981); The Unknown Rilke (1983); No Siege Is Absolute (poems by René Char, 1984); The Unknown Rilke: Expanded Edition (1991).

傻按:虽然Dasha阅读的英文作品还不够丰富,但Rilke的英译本Dasha恐怕已经至少阅读了50%,积攒了80%,所以,基于Dasha对德语的阅读,针对里尔克的诸家英译本,Dasha觉得只有Franz Wright能够表述里尔克的真髓。


讨论:
Dasha制作此书,扫描以后,乃藉由Abbyy FineReader v7.0 Professional Multilanguage软件OCR、校对,最后保存成“图片+文本”的“双层PDF”,旨在便于检索、拷贝,又保持纸本原貌以备核查稽考。

Dasha以为,制作eBook,如果仅仅就是OCR成文本,弄成TXT、EXE之类的,校对的质量是无法令人相信的(国内权威报社皆有大量校对人员,仍不能保证全部低于万分之三的差错),乃至无法作为资料援引,这么制作的电子书累己又无益于大家。进一步说某网站的所谓古籍精校,电脑GBK字库依然无法还原原始文字,于是弄出些“XX和OO”,恐怕使用时还得重新翻检纸本,脱裤子放屁也。电子图书区别于纸本,最主要的就应该是检索便捷,但仅仅检索便捷,还是不够的,使用中还需要准确性。没有了准确,检索的结果也很可疑的。因此,Dasha目前追求的就是这种“图片+文本”的“双层PDF”,万方、CNKI已经在大规模使用的这种方式。

Dasha又想,如果能够找到Abbyy FineReader 这样制作西文的中文软件,本论坛迄今209347名会众,选择精品一个人精心制作一本,那可就是20万种啊!谁有这样的软件?Readiris可以识别汉字制作双层PDF,但识别和输出之间无法校对,清华“文通鉴”Dasha迄今无缘试用,不知性能。

也许时代真的比以往浮躁了,没有人肯像叶圣陶先生那样青灯枯影爬梳出《十三经索引》。其实,制作这样文本的过程,也是提升自己学养的一个方法,如有可能,Dasha愿意这样做。感兴趣的同道书友,你们以为呢?

长歌-废墟 发表于 2006-4-7 23:28:45

  我想要制作好的电子书,必须对所制作的内容有比较好的理解,这样在校对中碰上问题才能解决。我在电子书制作设计方面确实不行,但是对自己所长部分愿意负责校对,兄如愿意所有二十世纪的物理或数学史以及相关的英语著作,我都愿意负责校对工作,以及制作符合版面要求的索引,以作为对兄提议的小小支持。若有兄弟愿意支持本提议的,一律以威望支持,最少三个威望起,视质量与内容多少上限可至10个威望。

robertchrs 发表于 2006-4-7 23:57:07

制作电子书太累,耗时太长,制作索引太繁琐,总之,一个字“累”。偶对英文著作一直有“抵触”心理,不过,用到小弟之处喊就是了。

musicmadman 发表于 2006-4-8 00:55:49

**** Hidden Message *****

Gossudar 发表于 2006-4-8 09:33:35

长歌兄的意见Dasha把脚都举起来赞成,Dasha曾说过不喜欢钱氏藏书,原因也在与此,制作者不通书的内容,自然校对就极其吃力。不过“所有二十世纪的物理或数学史以及相关的英语著作”是否能够找到可靠的纸本或者图片档,恐怕还需要兄来搜罗。这样的书,最终进入“藏书交流”,Dasha个人以为,才是大功德。Dasha甚至想过,如果谁能编写一个通用的电子词典接口(不是Babylon),几个人弄出一本不同语言、专业的电子词典,我们的学习工作一定会事半功倍的——比如Dasha想要德汉、德汉文学术语、德汉美术、德汉音乐、德汉神学……,可惜,这样的词典即或有纸本,制作成PDF后使用还是十分麻烦(比如Dasha试用过Pape的“古希腊-德语”词典的PDF)——而相关公司推出的所谓基于Dasha最喜欢的上海译文的新德汉词典而制作的“SinoTranz(TM) 德译通”,不过是挂了个羊头而已(也不曾听闻上海译文给谁授权制作电子词典)。

至于robertchrs兄说“累”,嘿嘿,恐怕所制作的电子书是robertchrs兄不喜欢的书,书多,好书不多,而遇到自己真正喜欢的好书就更不多啦,如果robertchrs遇到自己爱不释手的好书,没人逼你,你也会奉献的

musicmadman兄,Paperport不过是一个专业的“Windows资源管理器”而已,十分消耗系统资源,OCR制作电子书还需要其他相应软件的,别忘了Port不过是个“埠”而已:

  相信我们每个人在工作中都会遇到这样的情况,电脑里的各类文件越来越多,搜索起来费时费力;PDF文件虽好,却眼睁睁看着不能复制文字。最近,小编在市场上看到一款非常实用的软件—paperport,它能最大限度的提升文档管理的效率,现在小编我就和大家一起分享一下这款软件。

  其实说起paperport,还是非常有来头的,它可是美国大名鼎鼎的scansoft公司(现更名为nuance)的软件精品,目前在全球注册用户达到了1500万,以前小编接触的都是paperport的英文版,而这次见到的可是标准的简体中文版哦。

  从paperport的定位来看,这是一款集成式个人办公型软件,从办公应用的角度出发设计,非常贴近公司以及个人的实际应用。

  首先,PaperPort软件在界面设计上比较简洁、朴素,各种图标让人看上去通俗易懂,只要略懂电脑的人士都能够顺畅的操作。

  PaperPort拥有比较强大的文件管理能力,在文件管理的风格上趋近于WINDOWS操作系统,在文件格式、新建文件、删除文件、复制、粘贴等一系列常用的操作上都能很好的跟WINDOWS系统的操作方法重合。并且还拥有自己独特的风格,例如PaperPort拥有自己的MAX图像文件格式,显示文件时都是以图标的形式,复制时遇到相同名字的文件能让两个文件相比较选择,能在各种文件上加标识等。

  PaperPort的搜索能力过人,我们知道Windows自带的搜索功能虽然也有全文检索功能,但只是局限在office文档,而paperport的全文检索则支持包括文字、图像在内的所有文档的全文检索,而且paperport可以建立全文检索库,支持精确检索和模糊搜索,对查看的文件上内容显示HitInfo方式。从这点上看,可以减轻户查找文件的时间,大大提高用户的工作效率。

  对于很多电脑初学者来说,paperport的还是一个简单易用的photoshop。paperport的图像编辑功能,能实现对比度、色彩、亮度的调整,而且界面十分直观。

  全面支持PDF文档也是paperport的一大特色,PDF文档是由Adobe公司开发的一种电子文档格式,它能够完整地保留源文档中的所有字体、格式、颜色和图形,并且具有跨平台、可以加密等众多优秀特性。现在许多报纸、杂志、小说都采用了PDF文档作为其专用保存的电子书籍格式,它已经成为全世界电子文档公开的事实标准。而利用paperport,不仅能浏览PDF文档,还能对文档进行合并、拆分、编辑修改、添加标注等等操作,方便了用户的使用。

  在PaperPort界面中,小编还发现为了方便用户使用,在界面最下端还集成了一排常用软件的小图标,比如word、写字板、outlook等等,能实现直接拖拽支持任意改变工具栏的形状、内容,对常用的小图标还支持属性设置,大大的方便了用户的操作。

  看来paperport无疑是我们在文档管理过程中的“得力助手”,无论是从转换录入到编辑处理,从存储查询再到应用输出,paperport都能很好的满足用户的需求,使更多人体验到“轻松文档管理”带来的乐趣!

长歌-废墟 发表于 2006-4-8 09:48:42

引用第4楼Gossudar于2006-04-08 09:33发表的“”:
长歌兄的意见Dasha把脚都举起来赞成,Dasha曾说过不喜欢钱氏藏书,原因也在与此,制作者不通书的内容,自然校对就极其吃力。不过“所有二十世纪的物理或数学史以及相关的英语著作”是否能够找到可靠的纸本或者图片档,恐怕还需要兄来搜罗。这样的书,最终进入“藏书交流”,Dasha个人以为,才是大功德。Dasha甚至想过,如果谁能编写一个通用的电子词典接口(不是Babylon),几个人弄出一本不同语言、专业的电子词典,我们的学习工作一定会事半功倍的——比如Dasha想要德汉、德汉文学术语、德汉美术、德汉音乐、德汉神学……,可惜,这样的词典即或有纸本,制作成PDF后使用还是十分麻烦(比如Dasha试用过Pape的“古希腊-德语”词典的PDF)——而相关公司推出的所谓基于Dasha最喜欢的上海译文的新德汉词典而制作的“SinoTranz(TM) 德译通”,不过是挂了个羊头而已(也不曾听闻上海译文给谁授权制作电子词典)。

至于robertchrs兄说“累”,嘿嘿,恐怕所制作的电子书是robertchrs兄不喜欢的书,书多,好书不多,而遇到自己真正喜欢的好书就更不多啦,如果robertchrs遇到自己爱不释手的好书,没人逼你,你也会奉献的

musicmadman兄,Paperport不过是一个专业的“Windows资源管理器”而已,十分消耗系统资源,OCR制作电子书还需要其他相应软件的,别忘了Port不过是个“埠”而已:
.......
我正在netlibrary上下一本极其不错的书,写书的都是这方面专家,甚至有"爱因斯坦文本计划"的前主编,但可惜太厚了,有将近3000页,我正在努力.
另:对于一本合格的电子书的工序我都不知道,兄详细说说了,比如,开始是不是先ocr,ocr成什么格式?然后该干什么?不好意思,我对这方面的概念极其模糊.

Gossudar 发表于 2006-4-8 10:26:07

长歌兄,如果说OCR的话,多种西文OCR软件的准确度也都属于伯仲之间,如果OCR后导出TXT、DOC之类的可编辑文本,使用是方便了,但比如物理的图示、插图……就只能忽略了,兄不妨下载一下Dasha提供的PDF,您会发现,打开后是一个图片PDF,与将超星的PDG转成的PDF没有什么区别,都是原书的扫描,但是,接下来兄选择文本工具,就会发现,那图像上的文字是可以拷贝的,或者“搜索”,会发现能够搜索出每一句图书的的话。使用中,如果觉得拷贝出的文本可疑,或者需要订正,嘿嘿,图片在那里!罪证在那里!

所以,Dasha倡议制作电子书要弄成“图片+文本”的PDF。这样的文本,比如金石类的古籍(当然,目前需要特殊字库),既可以全文检索便于条分屡析,又可以援引原始图像字字有根据,像天人兄那样专业人士,恐怕最喜欢这种电子书吧。

Dasha不是做学问的人,但Dasha是个“较真”的同志,能因为玩《三国志IV》和《孔明传》买中华书局的《三国志》重读,能因为玩《信长之野望》而搜罗日本战国史资料(包括日文的)。嘿嘿……

疯言疯语 发表于 2006-4-8 10:30:03

扫描版PDF格式的电子书,除体积大之外,应该是效果最好的!

Gossudar 发表于 2006-4-8 10:31:21

用Abbyy来打开兄下载的3000多页,自动分析版面,然后手动修订,自动OCR后,软件还有校对功能,机器校对后,兄不妨开始阅读(在Abbyy里),修改其中的讹误,书自己通读完了,保存为“图片+文本”或者“文本+图片”的PDF(注意设置图片的输出线数),则在自己的学习之余,也就顺手制作了一本方便众人的电子书啦。

长歌-废墟 发表于 2006-4-8 10:43:22

  我试了一下,明白兄的意思了,就是作成能自由粘帖搜索的格式,好的我试试,但那个netlibrary似乎有下载限制,而且我的英语水平还没到和汉语那么高的水平 ,要一段时间了。 我先去找兄推荐的Abbyy软件。
另:麻烦兄推荐个德语输入法软件,我最近可能要用

天人合一 发表于 2006-4-8 10:53:36

引用第6楼Gossudar于2006-04-08 10:26发表的“”:
既可以全文检索便于条分屡析,又可以援引原始图像字字有根据


诚然!不过一般来说,这样的一本书大概就要耗费差不多3-5个月吧(还要在技术熟练的基础上)。

疯言疯语 发表于 2006-4-8 10:55:25

http://www.hw99.com/product/top.gif
同类其他产品
请选择 全能文本王 文本王文豪5300 文本王文豪6800 文友560 文本王软件版 文侠M16 文友680 文本王文豪7600
当前产品:文本王文豪7600


http://www.hw99.com/product/image/060111.jpg

http://www.hw99.com/product/penu01.gif


http://www.hw99.com/product/penu02.gif


http://www.hw99.com/product/penu03.gif

[ 市场建议价 ]
文本王7600:

疯言疯语 发表于 2006-4-8 11:02:00

http://www.wintone.com.cn/pub/img/logo.gif
http://www.wintone.com.cn/pub/img/banner.gif
http://www.wintone.com.cn/pub/img/banner_r.gif
http://www.wintone.com.cn/pub/img/menu_1.gif
http://www.wintone.com.cn/pub/img/menu_2.gif
首?页
http://www.wintone.com.cn/pub/img/menu_4.gif
公司介绍
http://www.wintone.com.cn/pub/img/menu_4.gif
新闻报道
http://www.wintone.com.cn/pub/img/menu_4.gif
产品信息
http://www.wintone.com.cn/pub/img/menu_4.gif
行业应用
http://www.wintone.com.cn/pub/img/menu_4.gif
渠道信息
http://www.wintone.com.cn/pub/img/menu_4.gif
服务与支持
http://www.wintone.com.cn/pub/img/menu_4.gif
文通论坛
http://www.wintone.com.cn/pub/img/menu_5.gif
站内搜索:


产品线简介


文通公司产品


代理产品


在线订购


http://www.wintone.com.cn/pub/img/point20.gif
您的位置:
产品信息

文通公司产品
http://www.wintone.com.cn/pub/img/ch_title3.gif

????文通鉴——文档管理系统

点击
9859

http://www.wintone.com.cn/pub/img/point16.gif
返回上级
    文通鉴是北京文通信息技术有限公司针对企业和个人用户推出的一款软硬件结合,具有卓越文档管理功能的新产品。该产品融合了文通信息顶尖的TH一OCR技术及美国Scansoft公司先进的文档管理理念轻松实现了“文档录入、文档编辑、文档存储、文档应用”四个环节的电子文档管理流程。全面提升电子文档的应用效率,及时为用户解决了电子文档“检索不便、应用率低”的矛盾,为人们创造了一个轻松快乐的办公环境。
http://www.wintone.com.cn/upload/product/pic_534185.jpg
【产品功能】
http://www.wintone.com.cn/upload/product/pic_534186.jpg
超强识别 超值享受
   在录入阶段,内置强大的TH一OCR技术,可以轻松、准确的识别中文简繁体、英、日、韩文等多种文字、以及百余种汉字字体。
大缩略图清晰浏览
http://www.wintone.com.cn/upload/product/pic_534187.jpg
   满足我们在打开文档之前进行预览的需要。Windows系统只能提供图像文件的预览。而只要打开文通鉴的界面我们就能看到几乎所有文档的预览模式,就连一些压缩文件也可以进行预览,从而让用户从视觉角度更加便捷的对多种文档进行操作。
http://www.wintone.com.cn/upload/product/pic_534188.jpg
全文检索省时省力
   文通鉴支持文档的关键字检索甚至智能全文检索。因此用户对JPG、TIFF这样的图像文档中包含的文字同样能够进行检索。而且系统还会按照匹配程度以及文档的类型自动排序显示结果,帮您立即找到目标文档。
MAIL发送及时准确
http://www.wintone.com.cn/upload/product/pic_534189.jpg
   您可以对生成的文件进行添加彩色标记、标签及标注等操作,无需打印与传真,只需e-mail便可进行数字式的检查和审批。
http://www.wintone.com.cn/upload/product/pic_534190.jpg
多种格式任意转换
   强大的软件功能支持TXT、PDF、JPEG、EXCEL、WORO等多种文件格式间的相互转换。另外内置的PDF生成器.可以将各种格式的文档转化为PDF文件或双层PDF格式。所谓双层PDF就是上层是图像,下层是隐藏文字的PDF格式。利用这种文件格式,用户就可以对PDF文档进行正常的操作,同时安全共享网络文件。
图文表格轻松修整
http://www.wintone.com.cn/upload/product/pic_534191.jpg
   文通鉴能自动识别文字中的表格字段,并轻松实现在计算机上填写。另外文通鉴中的Paperport软件自带PDF浏览器,可直接在该界面下简单快捷的进行操作。从而让您提交一份完美的表格。
http://www.wintone.com.cn/upload/product/pic_534192.jpg
网页管理方便快捷
   利用文件条上的多种网络服务功能的快捷方式,实现网页抓取功能,随时保存重要信息,简单方便的利用网络资源为我们服务。
一键WORD简单方便
http://www.wintone.com.cn/upload/product/pic_534193.jpg
   轻松实现一键进入word程序,并直接进行扫描识别,无需文件的保存、复制、粘贴以及文件格式的转化等繁琐程序,简单实用。
【应用行业】
  ◆ 政府、机关、银行、证券、保险、中小型企业、教育行业、文字工作者、个人SOHO
【适用范围】
  ◆ 各类书刊、报纸、公文、宣传页、打印稿等
【硬件系统需求】
  ◆ CPU:Pentium III MMX以上
  ◆ 内   存:258M以上
  ◆ 硬盘空间:30OM以上
  ◆ 接   口:USB
【软件系统需求】
  ◆ 支持简体中文版的 Windows 2000 / XP
http://www.wintone.com.cn/upload/product/pic_534194.jpg
【扫描仪规格】
  ◆ 48位先进色彩增强技术
  ◆ 彩色CCD 轻巧省空间
  ◆ USB2.0接口 即插即用
  ◆ 1200 × 2400 dpi光学分辨率
媒体参考报价:
  文通鉴(卓越版):2980元
  文通鉴(精英版):2180元

http://www.wintone.com.cn/pub/img/bg_9.gif

Copyright 2005
北京文通信息技术有限公司
咨询及技术服务热线:800-810-0190
电话:010-62800286 传真:010-62800256 email:
wintone@wintone.com.cn
地址:北京市海淀区北四环西路9号银谷大厦1605室 邮编:100080
京ICP备05014581号

Gossudar 发表于 2006-4-8 15:01:53

汉王的版式还原功能极其恶劣,超星的“全息文本”就是用汉王文本王还原的。

清华的OCR准确度不错,但“文通鉴”Dasha一直没有“试用”过,遑论“使用” 其所谓的快速全文检索,是Paperport的功能,目的是在大量文档(文本PDF、DOC……)中检索自己所需的关键词。

其实,Dasha这里没有说另外一个问题,就是汉语的新书电子版问题。除却个别古籍的影印本外,我国的出版系统已经完全电子化,其发排印刷之前的*.ps文件,通称“印前文件”,版式与文字,与印刷出的纸本是一致的。这个PS文件,保存、转换为PDF是很容易的(比如北京出版社、创世卓越的那些随书配套PDF)。剩下的,就是我们要问候一下“版权法”的令堂大人了。想啊,如果宋朝有我们这样的版权法,恐怕有水井处只有水桶,而不会有柳三变的词啦。

长歌-废墟 发表于 2006-4-8 15:05:42

引用第13楼Gossudar于2006-04-08 15:01发表的“”:
汉王的版式还原功能极其恶劣,超星的“全息文本”就是用汉王文本王还原的。

清华的OCR准确度不错,但“文通鉴”Dasha一直没有“试用”过,遑论“使用” 其所谓的快速全文检索,是Paperport的功能,目的是在大量文档(文本PDF、DOC……)中检索自己所需的关键词。

其实,Dasha这里没有说另外一个问题,就是汉语的新书电子版问题。除却个别古籍的影印本外,我国的出版系统已经完全电子化,其发排印刷之前的*.ps文件,通称“印前文件”,版式与文字,与印刷出的纸本是一致的。这个PS文件,保存、转换为PDF是很容易的(比如北京出版社、创世卓越的那些随书配套PDF)。剩下的,就是我们要问候一下“版权法”的令堂大人了。想啊,如果宋朝有我们这样的版权法,恐怕有水井处只有水桶,而不会有柳三变的词啦。
哈,是的ps文件转化为pdf很容易的,da兄说的好,柳永也要受累啊^_^

Gossudar 发表于 2006-4-8 15:12:06

引用第9楼长歌-废墟于2006-04-08 10:43发表的“”:
  我试了一下,明白兄的意思了,就是作成能自由粘帖搜索的格式,好的我试试,但那个netlibrary似乎有下载限制,而且我的英语水平还没到和汉语那么高的水平 ,要一段时间了。 我先去找兄推荐的Abbyy软件。
另:麻烦兄推荐个德语输入法软件,我最近可能要用

长歌兄,Abbyy在驴上很容易找到,Dasha个人的使用经验,7.0要优于8.0。可惜啊,祖鲁文都能识别,就是汉字不带(但有相应SDK库,无处下载)。

德语不需要特殊输入法,使用Windows XP,在“控制面板”→“区域和语言选项”→“语言”→“详细信息”→“添加...”里选择“德语(德国)”即可,只是英语德语之间的“Y”和“Z”键是相反的,“

Gossudar 发表于 2006-4-8 15:17:24

送长歌兄一份德语键盘分布图

长歌-废墟 发表于 2006-4-8 15:44:49

引用第15楼Gossudar于2006-04-08 15:12发表的“”:


长歌兄,Abbyy在驴上很容易找到,Dasha个人的使用经验,7.0要优于8.0。可惜啊,祖鲁文都能识别,就是汉字不带(但有相应SDK库,无处下载)。

德语不需要特殊输入法,使用Windows XP,在“控制面板”→“区域和语言选项”→“语言”→“详细信息”→“添加...”里选择“德语(德国)”即可,只是英语德语之间的“Y”和“Z”键是相反的,“

hero8151 发表于 2006-4-9 21:22:20

请传到hero8151@126.com,谢谢

gxxg 发表于 2006-4-11 00:24:00

好贴! 支持!
页: [1]
查看完整版本: 发布:The Unknown Rilke, translated by Franz Wright。并讨论电子书制作