第二节.正则表达式

it2024-02-22 86

正则表达式概念基本概念及操作基本概念基本操作归纳定义正则表达式的代数定律相等定义代数定律正则表达式的拓展

正则表达式概念

一个正则表达式描述了一个定义在某个字母表 $\Sigma$ 上的字符串的集合+一个描述空串的 $\epsilon$ 。字符串的这种集合称为一种语言。

选择：两个字符串集合

R

和

S

的并集，记

R ∣ S

，

\{x|x \in R 或 x \in S\}

连接：记

R S

，包含前面集合的任一元素后接上后面集合的任一元素形成的所有字符串，

\{xy|x \in R 且 y \in S \}

闭包：集合

R

的柯林闭包，集合与自身连接零或多次形成的集合取并集，记作

R^*

，定义为

\bigcup_{i = 0}^\infty R^i

对给定的字符集 $\Sigma = \{c1,c2,\dots,cn\}$ 归纳定义：

空串

\epsilon

是正则表达式，表示仅含空串的集合，该语言只含空串。对于任意

\in \Sigma

，

c

是正则表达式，表示尽包含

c

的集合，仅串

c

如果

M

和

N

是正则表达式，则以下也是正则表达式选择：

M|N = \{M,N\}

连接：

\{mn|m \in M, n \in N\}

闭包：

M^* = \{\epsilon,M,MM,MMM,\dots\}

优先级：括号、闭包、连接、选择、左结合

如果两个正则表达式 $r$ 和 $s$ 表示相同的语言

称为

r

和

s

等价如：

a ∣ b = b ∣ a

r ∣ s = s ∣ r

r ∣ (s ∣ t) = (r ∣ s) ∣ t

r (s t) = (r s) t

r (s ∣ t) = r s ∣ r t, (s ∣ t) r = s r ∣ t r

\epsilon r = r\epsilon = r

r^* = (r|\epsilon)^*

r^{**} = r^*

多种针对RE的拓展，以增强RE描述字符串的能力

+：一个或多个实例，e+ == 一个或多个e？：零个或一个实例，e？ == 零个或一个e字符类 [abc] == a|b|c连接：第一个和最后一个符号，中间连词符：[a-c] == a|b|c 转义如：使用\*表示*

最新回复(0)