C# 中解决 「Regex 中的点号会匹配 CR」这个问题的最佳实践是什么?

2021-07-21 11:42:17 +08:00
 AndyAO

.默认不匹配 LF,在类 Unix 上就意味着不匹配 NewLine,这个机制是很好用的,但 Windows 上 NewLine 是 CRLF,那么这个机制用起来就不怎么方便了。

例如,从字符串中提取 MarkDown 标题行做文件名,那么使用^# (.+)提取的内容后面就跟上了额外的 CR,还要通过 trim 来去除。

在 Python 3 上这个问题是不存在的,因为字符串默认的换行是 LF,从文件中读取字符串时会自动转换将 NewLine 转换为 CRLF,而写入时又会改回去,从而在绝大多数场景下解决了这个问题。

C# 好像没有这个机制,那么解决这种问题的最佳实践是什么呢?

538 次点击
所在节点    问与答
2 条回复
ho121
2021-07-21 12:31:00 +08:00
^# ([^\r]+)

这样?
AndyAO
2021-07-21 15:47:28 +08:00
@ho121 这种方式也许可以吧,还没有测试,但是兼容性估计会很差,因为 Windows 平台上也不是所有的文件都是 CRLF 。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/790801

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX