在线咨询
eetop公众号 创芯大讲堂 创芯人才网
切换到宽版

EETOP 创芯网论坛 (原名:电子顶级开发网)

手机号码,快捷登录

手机号码,快捷登录

找回密码

  登录   注册  

快捷导航
搜帖子
查看: 2717|回复: 2

[讨论] Python处理Word文档

[复制链接]
发表于 2021-1-9 13:40:06 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

x
本帖最后由 hamandu 于 2021-1-9 13:42 编辑

最近用Python处理Word文档,无意中发现一个小小的问题,不清楚是怎么回事儿。哪位大牛帮忙看看,谢谢
import win32com.client as win32
from win32com.client import constants


x = 'D:\\work\\Python\\_myPython\\example1.docx'
wd_app = win32.gencache.EnsureDispatch('Word.Application')
wd_app.Visible = 0
wd_app.DisplayAlerts = 0
new_doc = wd_app.Documents.Open(x)
for a in range(new_doc.Paragraphs.Count):
    text = new_doc.Paragraphs(a+1).Range.Text
    style = str(new_doc.Paragraphs(a+1).Range.Style)
    print('{} => {}'.format(style, text))
    print('{} => {}'.format(text, style))

执行结果很奇怪,只要text在前面就没输出,在后面就正常输出。我用的是Pycharm和Python 3.9.1,安装了win32com的包
下面是输出结果(要处理的Word文档内容可以随便写)
标题 1 => 标题1
=> 标题 1
正文 => 正文1
=> 正文
正文 => 圆点1
=> 正文
正文 => 圆点2
=> 正文
正文 => 编号1
=> 正文
正文 => 编号2
=> 正文
正文 => 编号3
=> 正文
正文 =>
=> 正文

 楼主| 发表于 2021-1-9 21:46:22 | 显示全部楼层
Word文档的内容大致如图
图片.png
发表于 2021-1-21 11:27:54 | 显示全部楼层
可以试着转成html格式进行处理
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐 上一条 /2 下一条

小黑屋| 关于我们| 联系我们| 在线咨询| 隐私声明| EETOP 创芯网
( 京ICP备:10050787号 京公网安备:11010502037710 )

GMT+8, 2024-5-1 19:33 , Processed in 0.019092 second(s), 7 queries , Gzip On, Redis On.

eetop公众号 创芯大讲堂 创芯人才网
快速回复 返回顶部 返回列表