Python后端获取页面传过来的word文档读取
diqing
= request
.FILES.get('diqing_file') # 敌情通报
# open无法直接打开docx文件,将文件转回为字节流的格式传给document类识别
diqing
= io
.BytesIO(diqing
.read())
# 引用Document类接收docx文件字节流
file
= docx
.Document(diqing
)
# 设置空字符串,用来接收段落信息
diqing_txt
=''
# 设置空列表,将字段信息放入列表,以便切割去掉末尾的时间等信息
diqing_txt_list
=[]
# 循环文件段落,获取内容
for p
in file
.paragraphs
:
#
print('***',p
.text
)
if p
.text
!='':
diqing_txt_list
.append(p
.text
)
for i
in diqing_txt_list
[:-3]:
diqing_txt
+=i
#
print(diqing_txt
)
# 关闭
IO流
diqing
.close()