TXT文件打开出现乱码怎么办?
本帖最后由 许春梅 于 2024-4-17 21:16 编辑用记事本打开《道藏》TXT版里的文件,绝大多数出现的是乱码,不可读。用写字板和 Office Word 2003 来打开也一样,不管怎么选择编码。
不不知道有没有什么简单软件能自动选择合适的代码?或者我再安装一个什么代码软件或字体?
附件是三个乱码样本文件和二合正常可打开文件。
目测这是zlib下载的,我这打开也是这样 查原书的图像版,文字应可靠些。 本帖最后由 YLtree 于 2024-4-16 19:01 编辑
没有一一下载,下载看了第一个,原因是:ansi编码的不支持中文,建议使用(Windows)UTF-8 应该是以GBK方式读取了UTF-8编码的中文 本帖最后由 cocowind 于 2024-4-16 21:19 编辑
鬼笔环肽 发表于 2024-4-16 20:39
应该是以GBK方式读取了UTF-8编码的中文
可能是下载过程中默认使用了UTF-8去解码和传输、原先用GBK编码的文本。不可逆,恢复不了
直接还原你这个版本,没找到办法。
这有个
道藏_繁体_TXT版
https://www.lanzouj.com/b0dpgzz7c
用你这三个样本的名字试看,里面的的TXT都是正常的
cloudsky 发表于 2024-4-17 10:37
直接还原你这个版本,没找到办法。
这有个
感谢!不过,我下的是简体版。从可以打开的部分文件看,也是简体的。
许春梅 发表于 2024-4-17 20:05
感谢!不过,我下的是简体版。从可以打开的部分文件看,也是简体的。
能不能发一个可以打开的文件上来?也许可以参考。
应该可以改正的,很多年前搞过,现在想不起来怎么搞了。 我以前也有过,发现用记事本打开是乱码,用wps打开是正常的。你如果有wps可以试一下。 看了下,显示正常的文件是有bom头的,不正常的文件没有bom头。有时间再测试看看加上bom头会怎么样。 agent124 发表于 2024-4-17 21:39
看了下,显示正常的文件是有bom头的,不正常的文件没有bom头。有时间再测试看看加上bom头会怎么样。 ...
百字碑.txt 洞玄子.txt 这两个能看的,是普通的不带BOM的UTF-8编码。
UTF-8的BOM是"EF BB BF",这两个能正常显示的,没有BOM。
许春梅 发表于 2024-4-17 20:05
感谢!不过,我下的是简体版。从可以打开的部分文件看,也是简体的。
如果只是想看简体版,前面那个链接里也有这本的简体版CHM,但我没下载验证。
cloudsky 发表于 2024-4-18 09:11
百字碑.txt 洞玄子.txt 这两个能看的,是普通的不带BOM的UTF-8编码。
UTF-8的BOM是"EF BB BF",这两个能 ...
我使用Mozilla Universal Charset Detector检测,乱码的文件检测不出编码,没有乱码的能检测出是UTF-8。因为没有bom就检测不出编码,所以以为能看的是有bom的。倒是没用二进制编辑器看过。
试了所有codepage的编解码组合,还是搞不出正常的文字,所以想是否加上bom会有用,这个还没试
应该是编码格式乱了
换个编码格式试试呢 如果是旧编码GBK的话,大概率不可逆。
找其他网站的另外下载吧 cloudsky 发表于 2024-4-18 09:12
如果只是想看简体版,前面那个链接里也有这本的简体版CHM,但我没下载验证。
...
下载了。感谢书友提供!
页:
[1]