Python :解析 word 文档(前程无忧简历)

2018-09-04 17:41:56 +08:00
 wuwei007

From:<�� ���@51Job ���> Subject: Resume MIME-Version:1.0 X-51JOB-FLAG:EhireExport_20180816_20532488 Content-Type:multipart/related;boundary="--boundary_0_9ed30801b0c180c69b3c5d74fede848e"

----boundary_0_9ed30801b0c180c69b3c5d74fede848e Content-Type:text/html;charset="gb2312" Content-Transfer-Encoding:base64

PGh0bWw+PGJvZHk+PHRhYmxlIHdpZHRoPSc3MDInIGhlaWdodD0nNjInIGJvcmRlcj0nMCcgYWxp Z249J2NlbnRlcicgY2VsbHBhZGRpbmc9JzAnIGNlbGxzcGFjaW5nPScwJz48dHI+PHRkIHdpZHRo PSc2MiUnIGhlaWdodD0nNTAnIGFsaWduPSdsZWZ0JyB2YWxpZ249J2JvdHRvbScgY2xhc3M9J3Rv

打开变成这样了

1817 次点击
所在节点    问与答
4 条回复
ClutchBear
2018-09-04 18:06:13 +08:00
51job 其实是 mht 文件,
找一个解析 mht 的就行.

猎聘和智联的 word 其实是 html, 改名成 html,直接就可以解析
ClutchBear
2018-09-04 18:17:17 +08:00
https://github.com/Modified/MHTifier/blob/master/mhtifier.py
根据这个改一下,就可以解析 51job 的 word
wuwei007
2018-09-05 09:47:07 +08:00
@ClutchBear 有没有方法判断 用户上传文件是什么类型?
ClutchBear
2018-09-07 09:32:54 +08:00
@wuwei007 我以前在小猎头公司(俩码农), 只写过简历的解析.
没有写过让用户上传. 没有相关经验.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/486087

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX