如何去掉 markdown 的各种语法符号,提取出其中的内容?

2016-11-17 13:16:53 +08:00
 cheyo

要给博客文章做一个简单的全文搜索功能。需要对博客的 markdown 文本建立索引。如何去掉 markdown 的各种语法符号,只留下内容?

这个是要用 Markdown 解析器吗?当前博客是基于 python 开发的, markdown 解析器是 Mistune 。

谢谢

4379 次点击
所在节点    Markdown
3 条回复
SourceMan
2016-11-17 14:11:21 +08:00
转换成 HTML ,再 HTML.replace(/<\/?[^>]*>/g,'')
huntzhan
2016-11-17 18:45:03 +08:00
owt5008137
2016-11-17 22:21:10 +08:00
讲道理 markdown 可以内嵌 html 。所以默默赞同下 1L

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/321156

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX