找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 2107|回复: 3

[【解决】] 有关网页文字复制整行显示的问题

[复制链接]
发表于 2006-8-3 15:40:23 | 显示全部楼层 |阅读模式
朋友们也许遇到过类似的问题,就是把网页上的文字复制到文本或WORD上面,常常出现文字并没有整行显示,而是每行按照网页上的字数排列着,要不就是不满一行,要不就是一行多,看起来象是分段一样的,请高手能否告知一个方法解决这个问题。
回复

使用道具 举报

发表于 2006-8-3 16:06:36 | 显示全部楼层
我以前是这样处理的。
1、复制到Word上;
2、找出分段的规律,用替换命令。例如:
(1)两个以上回车
将“^p^p^p^p”替换成“$$”,将“^p^p^p”替换成“$$”,将“^p^p”替换成“$$”。这里“$$”是留着作为分段符号的。
(2)换行只有一个回车,但每段前有中文空格或西文空格
将“[中文空格或西文空格]^p”替换成“$$”。
(3)换行只有一个回车,也没有其他特征
将“。^p”替换成“。$$”,将“?^p”替换成“?$$”,将“!^p”替换成“!$$”。粗略看一下哪行特短,加上“$$”。
(4)将“^p”替换成“”,再将“$$”替换成“^p”或“^p^p”或“   ^p”等。

举一反三,可以处理标题行。或许有更好的办法。我以前是用这个笨办法整理网上下载的武侠小说的。
回复

使用道具 举报

发表于 2006-8-3 17:09:51 | 显示全部楼层
基本上没什么好的处理方式.  
只能用类似 bookish 的方法进行正则表达式替换.
回复

使用道具 举报

 楼主| 发表于 2011-2-11 22:10:31 | 显示全部楼层
首先非常感谢bookish 朋友的指点,也感谢孔南 朋友的参与!

这里本人转告club.excelhome.net上面tangqingfu朋友的处理方法:

是有些不太好判断,下面方法请楼主参考(可能会有些误判断,请楼主自行修改):
操作方法:
选择要替换的内容,按下Ctrl+H组合键,打开“替换”对话框,勾选“使用通配符”
查找内容:   
([!.:?"\!\)])^13{1,}
替换为:
\1
相关解释及说明:
([!.:?"\!\)])^13{1,}表示查找所有以非英文句号、冒号、、问号、感叹句、右括号或反引号为结尾、硬回车符号为标志的段落。找到后将其硬回车符号(段落标记)标志删除。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-11-22 07:19 , Processed in 0.185181 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表