有多少人知道 match 的参数不能是字符串

2017-07-16 02:58:48 +08:00
 autoxbc

很多人会这么写字符串匹配,结果似乎也对

'abcde'.match('cd')
// Array ["cd"]

实际这是错的,或者说某些情况是错的,来个例子

// 匹配京东全站
if( location.hostname.match('.jd.com') )
// 反例
'www.xjd.com'.match('.jd.com')
// Array ["xjd.com"]

道理很简单,match 的参数必须是正则,如果不是,会被隐式转换为正则。

因为是隐式转换,写的人可能没注意到,转换的结果可能和预期的不一致。

这里 dot 应该是纯字符串的一部分,被转换成了通配符。

new RegExp('.jd.com')
->   /.jd.com/ 

坑的是匹配结果放宽而不是收窄,所以调试不会出错,但是边界不对了。


应对方法是用 indexOf

'www.xjd.com'.indexOf('.jd.com') !== -1
// false

但是写起来有点长,多出 7 个字符(算上空格),我一般这么写

!!( 'www.xjd.com'.indexOf('.jd.com')+1 )
// false

因为基本都是写在 if 语句里的,所以不用显示转换

if( location.hostname.indexOf('.jd.com')+1 )

当然也可以用 match 加手动转义,但是太丑了

'www.xjd.com'.match('\\.jd\\.com')
// null
'www.xjd.com'.match(/\.jd\.com/)
// null

大家有什么好的方法说一下

3641 次点击
所在节点    JavaScript
23 条回复
Athrob
2017-07-16 04:58:19 +08:00
知道是正则,转义挺好的。
autoxbc
2017-07-16 05:10:41 +08:00
@Athrob 转义破坏了字符串的可读性,尤其是长 url 字符串转义后看着难受
ericls
2017-07-16 05:11:15 +08:00
有什么理由不用 `.includes` 的吗?

`'www.xjd.com'.includes('jd.com')`
bumz
2017-07-16 05:13:02 +08:00
隐式转换太坑爹
Athrob
2017-07-16 05:17:18 +08:00
@autoxbc #2 有道理
LioMore
2017-07-16 05:58:59 +08:00
有点好笑
rogerchen
2017-07-16 11:25:18 +08:00
raw string 被楼主吃掉了
autoxbc
2017-07-16 15:34:03 +08:00
@rogerchen 请详细说一下,没有看懂
shuirong1997
2017-07-16 17:43:54 +08:00
之前在群里见到有人提出这个坑... 当时还真没想到...
iyangyuan
2017-07-16 18:10:19 +08:00
这…不看文档,不深究,单纯无脑看方法名,也能感觉到参数不是字符串
nino
2017-07-16 18:24:36 +08:00
从来不知道 match 还能传字符串
autoxbc
2017-07-16 20:30:43 +08:00
@iyangyuan
@nino
这可不是我编的,有人就是传字符串,教程也这么写
http://www.w3school.com.cn/jsref/jsref_match.asp
TJT
2017-07-16 20:32:46 +08:00
原来 match 还能传字符串
TJT
2017-07-16 20:33:48 +08:00
@autoxbc 回 12 楼
TJT
2017-07-16 20:36:36 +08:00
不小心按了 cmd + enter,
https://www.w3schools.com/jsref/jsref_match.asp
https://developer.mozilla.org/en/docs/Web/JavaScript/Reference/Global_Objects/String/match

都没有说可以传字符串的,MDN 的会说明有隐式转换。
autoxbc
2017-07-16 20:46:18 +08:00
@TJT 是个野路子用法
CRVV
2017-07-16 23:02:21 +08:00
1. match 的参数可以是字符串,字符串会被转成正则表达式然后匹配。用字符串表示正则表达式是很常见的用法,很多语言不像 JavaScript 一样有专门的正则表达式类型。这个帖子的标题就是错的
2. match 在几乎所有语言里都是正则表达式匹配,不是子串搜索,我真不知道你们是怎么能造出来把 match 当 find 的用法
3. w3schools 是著名的垃圾网站,不知道你们为什么不看正经的文档,还是中文的。
https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/match
autoxbc
2017-07-17 00:07:26 +08:00
@CRVV 您太激动了,观点有点偏颇

1. js 里有些方法就是支持多种类型参数的,比如 replace。对于不支持多类型参数的方法,强行使用非标准输入,并期望(或者根本不知道)隐式转换与预想的一致,这就造成混淆,很容易暗藏 bug,并提高维护成本。您是否认为可以随意使用 js 的灵活性,并在工业环境使用一些魔法代码?

2. match 是什么是由 match 的行为决定的,不是某些人认为的。当正确使用,match 就是可以充当 find 的角色,这甚至不能算作使用副作用。起码比 func && func() 这种要规范多了。要注意的是,includes 也是 ES6 才出现的,之前基本都是用 indexOf(str) !== -1。match 作为 find,不仅简单而且符合语义。

3. 我举了 w3schools 的例子,是为说明误用的普遍性,不是否定 w3schools 的价值,也不同意您否定其价值的观点。如果可以随意甩鄙视链,是否可以说 W3C 的文档更正经? MDN 的逼格就不够了? ECMA 也有更详实的文档,这些都是多层次教程的一部分,没有谁是垃圾。
araraloren
2017-07-17 09:32:56 +08:00
@autoxbc w3school.com.cn 这是个盗版教程网站吧!
445141126
2017-07-17 12:57:29 +08:00
string.search 也是

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/375660

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX