什么是正则表达式_如何在javascript中使用正则【教程】

正则表达式是JavaScript处理字符串的基础设施,本质是描述文本模式的字符序列,支持字面量和构造函数两种创建方式,常用于搜索、替换、提取和校验。

正则表达式不是“高级技巧”,而是 JavaScript 中处理字符串的基础设施——只要你要做搜索、替换、提取或校验(比如邮箱、手机号、URL),绕不开它。

正则表达式是什么:别被术语吓住,它就是“带通配符的字符串模板”

它本质是一串描述文本模式的字符,比如 /\d{3}-\d{4}/

表示“三位数字 + 一个短横线 + 四位数字”。JavaScript 把它当作一种独立的数据类型(RegExp 对象),既可字面量写法(/pattern/flags),也可构造函数(new RegExp('pattern', 'flags'))。

常见误区是以为正则必须复杂才有用。其实最常用的是:/\s+/(匹配多个空白)、/^\w+@\w+\.\w+$/(简单邮箱校验)、/[aeiou]/gi(找所有元音字母)。

  • 字面量写法里,斜杠 / 是定界符,不能省;反斜杠要双写(如 \\d 在字符串中才是 \d
  • new RegExp() 时,模式是字符串,所以反斜杠得写成 '\\d' —— 这是新手最容易漏掉的转义层级
  • 标志(flags)如 g(全局)、i(忽略大小写)、m(多行)必须写在末尾,且不能重复

test()exec():判断是否存在 vs 拿出匹配结果

test() 最轻量,只返回 truefalse,适合表单校验等布尔判断场景;exec() 返回匹配详情(包括 indexinput、捕获组),但要注意:带 g 标志时,它会“记住”上次位置,连续调用可能返回不同结果。

  • /cat/.test('concatenate')true
  • /a(b)c/.exec('abc')['abc', 'b'](第二个元素是第一个捕获组)
  • const r = /a/g; r.exec('aa'); r.exec('aa') 第二次返回 null,因为 lastIndex 已移到末尾

String.prototype.replace() 里怎么用正则:别只传字符串

直接传字符串替换,只能换第一次;传正则才能真正控制范围和逻辑。关键是第二个参数:可以是字符串(支持 $1 引用捕获组),也可以是函数(接收匹配项、分组、索引、原字符串)。

  • '2025-04-05'.replace(/(\d{4})-(\d{2})-(\d{2})/, '$2/$3/$1')'04/05/2025'
  • 'price: $19.99'.replace(/\$(\d+\.\d+)/, (_, num) => `¥${(num * 7.2).toFixed(2)}`)
  • 忘记加 g 标志?'aaa'.replace(/a/, 'b') 只变第一个,而 /a/g 才全变

容易被忽略的坑:Unicode、先行断言、还有那个 lastIndex

中文、emoji 等 Unicode 字符在正则里默认按码点处理,/./uu 标志才能正确匹配一个 emoji;(?=...) 这类先行断言不消耗字符,但浏览器兼容性要注意(IE 完全不支持);而 lastIndex 这个属性,只对带 gy 的正则生效,且手动改它极易引发隐性 bug。

  • /?‍?/.test('?‍?')false,必须写成 /?‍?/u
  • /(?(后行断言)在 Safari 16.4 之前不支持
  • const r = /a/g; r.lastIndex = 5; 'xxxaaa'.replace(r, 'b') 会从第 5 位开始找,跳过前面的 a

正则真正的难点不在语法本身,而在“你是否意识到当前问题需要用它解”以及“是否记得那些影响行为的标志和状态”。写完一个正则,先用 .test() 验证边界 case,再看 .exec() 返回结构,比直接塞进 replace() 更稳妥。