上海高端网站制作公司,镇江网站关键字优化公司,做软装找图片的网站,网站建设需要注册42类吗想写一个读取doc文档中表格数据#xff0c;来对文档进行重命名。经查资料#xff0c;py-docx无法读取doc文档#xff0c;原因是这种是旧格式。所以#xff0c;采用pywin32来进行读取。 import win32com.client as win32word win32.gencache.EnsureDispatch(Word.Applicati… 想写一个读取doc文档中表格数据来对文档进行重命名。经查资料py-docx无法读取doc文档原因是这种是旧格式。所以采用pywin32来进行读取。 import win32com.client as win32word win32.gencache.EnsureDispatch(Word.Application,)word.Visible 0Ndoc word.Documents.Add()doc word.Documents.Open(file_path)for t in doc.Tables:for row in t.Rows:for cell in row.Cells:print(cell.Range.Text)一运行结果都是一个框一个框 以为是编码出了问题在网上找了原因gbk/utf-8/utf-16甚至iso-8859-1各种encode/decode发现能输出一些字符。无奈一decode都是无果。 各种网站解析无果我跑去问“文心一言”居然能翻出来。说明是解析出问题但是咋都找不到原因。 检查代码跟其他人写的也一样这时只能怀疑编译环境了。目前我的版本是3.9但是这步没办法排查。我只能试试输出到其他地方是什么结果了。 我直接把文件名给改了结果看到了这样的错误。 看到输出文字我很高兴并且留意到\r\x07这个字符复制到网上一搜果然看到同样的问题。原来是出现这些转义符号输出异常了。只要把它们删除即可。
print(cell.Range.Text.replace(\r\x07, )) 总算是可以了一个小小的问题折腾的一天果然是生蔬了。同时也感慨人工智能的进步写程序提高效率肉眼可见