找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 550|回复: 21

[【书香茶座】] TXT文件打开出现乱码怎么办?

[复制链接]
发表于 2024-4-16 13:10:46 | 显示全部楼层 |阅读模式
本帖最后由 许春梅 于 2024-4-17 21:16 编辑

用记事本打开《道藏》TXT版里的文件,绝大多数出现的是乱码,不可读。用写字板和 Office Word 2003 来打开也一样,不管怎么选择编码。

不不知道有没有什么简单软件能自动选择合适的代码?或者我再安装一个什么代码软件或字体?


附件是三个乱码样本文件和二合正常可打开文件。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-4-16 16:03:20 | 显示全部楼层
目测这是zlib下载的,我这打开也是这样
回复

使用道具 举报

发表于 2024-4-16 18:00:41 | 显示全部楼层
查原书的图像版,文字应可靠些。
回复

使用道具 举报

发表于 2024-4-16 18:58:50 | 显示全部楼层
本帖最后由 YLtree 于 2024-4-16 19:01 编辑

没有一一下载,下载看了第一个,原因是:ansi编码的不支持中文,建议使用(Windows)UTF-8

点评

用UTF-8打开也是乱码。  发表于 2024-4-16 21:45

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-4-16 20:39:04 | 显示全部楼层
应该是以GBK方式读取了UTF-8编码的中文
回复

使用道具 举报

发表于 2024-4-16 21:11:37 | 显示全部楼层
本帖最后由 cocowind 于 2024-4-16 21:19 编辑
鬼笔环肽 发表于 2024-4-16 20:39
应该是以GBK方式读取了UTF-8编码的中文

可能是下载过程中默认使用了UTF-8去解码和传输、原先用GBK编码的文本。不可逆,恢复不了

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-4-17 10:37:08 | 显示全部楼层
直接还原你这个版本,没找到办法。

这有个

道藏_繁体_TXT版

https://www.lanzouj.com/b0dpgzz7c



用你这三个样本的名字试看,里面的的TXT都是正常的


回复

使用道具 举报

 楼主| 发表于 2024-4-17 20:05:21 | 显示全部楼层
cloudsky 发表于 2024-4-17 10:37
直接还原你这个版本,没找到办法。

这有个

感谢!不过,我下的是简体版。从可以打开的部分文件看,也是简体的。
回复

使用道具 举报

发表于 2024-4-17 20:13:49 | 显示全部楼层
许春梅 发表于 2024-4-17 20:05
感谢!不过,我下的是简体版。从可以打开的部分文件看,也是简体的。

能不能发一个可以打开的文件上来?也许可以参考。

点评

发在主题帖中了。  发表于 2024-4-17 21:17
可以的。稍等。  发表于 2024-4-17 21:09
回复

使用道具 举报

发表于 2024-4-17 20:35:17 来自手机 | 显示全部楼层
应该可以改正的,很多年前搞过,现在想不起来怎么搞了。
回复

使用道具 举报

发表于 2024-4-17 21:23:50 | 显示全部楼层
我以前也有过,发现用记事本打开是乱码,用wps打开是正常的。你如果有wps可以试一下。
回复

使用道具 举报

发表于 2024-4-17 21:39:21 | 显示全部楼层
看了下,显示正常的文件是有bom头的,不正常的文件没有bom头。有时间再测试看看加上bom头会怎么样。

评分

1

查看全部评分

回复

使用道具 举报

发表于 2024-4-18 09:11:05 | 显示全部楼层
agent124 发表于 2024-4-17 21:39
看了下,显示正常的文件是有bom头的,不正常的文件没有bom头。有时间再测试看看加上bom头会怎么样。 ...

百字碑.txt 洞玄子.txt 这两个能看的,是普通的不带BOM的UTF-8编码。

UTF-8的BOM是"EF BB BF",这两个能正常显示的,没有BOM。


回复

使用道具 举报

发表于 2024-4-18 09:12:17 | 显示全部楼层
许春梅 发表于 2024-4-17 20:05
感谢!不过,我下的是简体版。从可以打开的部分文件看,也是简体的。

如果只是想看简体版,前面那个链接里也有这本的简体版CHM,但我没下载验证。

回复

使用道具 举报

发表于 2024-4-18 11:15:18 | 显示全部楼层
cloudsky 发表于 2024-4-18 09:11
百字碑.txt 洞玄子.txt 这两个能看的,是普通的不带BOM的UTF-8编码。

UTF-8的BOM是"EF BB BF",这两个能 ...

我使用Mozilla Universal Charset Detector检测,乱码的文件检测不出编码,没有乱码的能检测出是UTF-8。因为没有bom就检测不出编码,所以以为能看的是有bom的。倒是没用二进制编辑器看过。

试了所有codepage的编解码组合,还是搞不出正常的文字,所以想是否加上bom会有用,这个还没试
回复

使用道具 举报

发表于 2024-4-19 08:19:14 | 显示全部楼层
应该是编码格式乱了
回复

使用道具 举报

发表于 2024-4-19 10:08:33 | 显示全部楼层
换个编码格式试试呢
回复

使用道具 举报

发表于 2024-4-20 21:47:52 | 显示全部楼层
如果是旧编码GBK的话,大概率不可逆。

找其他网站的另外下载吧
回复

使用道具 举报

 楼主| 发表于 2024-4-21 07:34:33 | 显示全部楼层
cloudsky 发表于 2024-4-18 09:12
如果只是想看简体版,前面那个链接里也有这本的简体版CHM,但我没下载验证。

...

下载了。感谢书友提供!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-11-15 21:32 , Processed in 0.277563 second(s), 27 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表