- 이 기사는 두 정규 표현식(regexes)의 차이와 교집합을 계산하는 방법에 대해 논의합니다.
- 저자는 α < β = false, α = β = true, α > β = false, α & β = α ^ β = ∅, α - β = ∅ 등의 방정식과 결과를 제공하여 과정을 보여줍니다.
- 또한 이 기사에는 다음과 같은 정규 표현식 문법에 대한 간략한 소개가 포함되어 있습니다:
- '.'는 어떤 단일 문자와도 일치
- 'xy'는 연결: x와 그 다음에 y와 일치
- 'x|y'는 대체: x 또는 y와 일치
- 'x*'는 클린 스타: x를 0번 이상 일치
- '(xyz)'는 그룹화: xyz를 단일 항목으로 취급
- '()'는 빈 정규 표현식으로 빈 문자열과 일치
- 'x+'는 클린 플러스: x를 1번 이상 일치
- 'x?'는 선택적: 선택적으로 x와 일치
- 'x{n}'는 거듭제곱: x를 n번 자신에게 연결
- 'x{m,n}'는 반복: x를 m번에서 n번까지 자신에게 연결
- '[a-z0-9]'는 그룹화: 그룹 내의 어떤 단일 문자와도 일치
- '[^a-z0-9]'는 부정 그룹화: 그룹 내의 문자가 아닌 어떤 단일 문자와도 일치
- '\c'는 이스케이프: 특수 문자 c와 일치
- '\u001a'는 유니코드 이스케이프: 해당 UTF-16 문자와 일치
- 'a, b, c'는 모든 기타 문자가 자신과 일치합니다.
- 이 기사에서는 앵커, 제로 너비 주장, 후방 참조, 하위 그룹 추출, 검색 또는 부분 일치, 행동을 변경하는 기타 플래그와 같은 지원되지 않는 기능에 대해서도 언급합니다.
- 자세한 정보를 위해 저자는 'antimirov'의 GitHub 페이지를 참조하라고 언급합니다.
- 이 기사의 저자는 트위터와 마스토돈에서 @d6로 알려진 Eiríkr Åsheim입니다.