정규 표현식

· 11년 전 · 2179 · 1
정규 표현식은 웹 프로그래밍을 할 때 문자열을 정교하게 처리하기 위해 필요합니다.

먼저, 정규 표현식에서 사용되는 패턴 문자 몇 가지를 소개하면 아래와 같습니다.


+ -> '+' 표시 바로 앞의 문자열(문자)이 한 번 이상 존재하는 것을 의미함

^ -> '^' 표시 뒤의 문자열(문자)로 시작되는 것을 의미함

[ ] -> '[ ]' 로 둘러쌓인 문자열(문자) 중에서 하나의 문자를 의미함

[^ ] -> '[ ]' 패턴의 문자열(문자)을 제외한 나머지 문자열(문자)을 의미함

{ } -> '{ }' 앞의 문자열(문자)이 '{ }' 안의 숫자가 나타내는 갯수만큼 존재하는 것을 의미함


[[:digit:]] -> 하나의 숫자(0 에서 9 까지) 를 의미함

[[:alpha:]] -> 하나의 영문자(a 에서 Z 까지) 를 의미함

[[:alnum:]] -> 하나의 숫자(0 에서 9 까지) 또는 영문자(a 에서 Z 까지) 를 의미함

[[:space:]] -> 하나의 공백 문자(blank) 를 의미함


위 패턴 문자를 사용한 정규 표현식이 어떻게 사용되는지 살펴보기 전에, 위와 같은 패턴 문자로 나타내어진 정규 표현식을 사용하기 위해 필요한 함수가 있는데, ereg() 함수가 있습니다.

ereg() 함수는 일반적으로 두 개의 인자를 취하는데, 첫 번째 인자는 패턴 문자로 나타내어진 정규 표현식이 오며 두 번째 인자는 그 정규 표현식에 의해 검색될 대상 문자열이 옵니다.

이렇게 ereg() 함수 내의 두 번째 인자인 검색 대상 문자열에서 첫 번째 인자인 정규 표현식의 패턴이 존재할 경우 ereg() 함수는 true 값을 반환하며 그렇지 않을 경우에는 false 값을 반환하게 됩니다.

그럼, ereg() 함수를 사용하여 위 패턴 문자로 나타내어진 정규 표현식이 어떻게 사용되는지 몇 가지 예제를 살펴보겠습니다.

<?
$string = "mizzle PHP 2002";

# '+' 패턴 검사

if(ereg("iz+", $string)) {
  echo("지정된 패턴과 일치합니다.<br>"); # 실행 라인
} else {
  echo("지정된 패턴과 일치하지 않습니다.<br>");
}

# '^' 패턴 검사

if(ereg("^mi", $string)) {
  echo("지정된 패턴과 일치합니다.<br>"); # 실행 라인
} else {
  echo("지정된 패턴과 일치하지 않습니다.<br>");
}

# '[ ]' 패턴 검사

if(ereg("[si]m", $string)) {
  echo("지정된 패턴과 일치합니다.<br>");
} else {
  echo("지정된 패턴과 일치하지 않습니다.<br>"); # 실행 라인
}

# '[[:digit:]]' 패턴 검사

if(ereg("[[:digit:]]{4}", $string)) {
  echo("지정된 패턴과 일치합니다.<br>"); # 실행 라인
} else {
  echo("지정된 패턴과 일치하지 않습니다.<br>");
}

# '[[:alpha]]' 패턴 검사

if(ereg("[[:alpha:]]{7}", $string)) {
  echo("지정된 패턴과 일치합니다.<br>");
} else {
  echo("지정된 패턴과 일치하지 않습니다.<br>"); # 실행 라인
}

# '[[:space]]' 패턴 검사

if(ereg("[[:space:]]{2}", $string)) {
  echo("지정된 패턴과 일치합니다.<br>");
} else {
  echo("지정된 패턴과 일치하지 않습니다.<br>"); # 실행 라인
}
?>

위 예제를 실행하게 되면, 위 예제 코드의 주석("#실행 라인")으로 표기한 라인이 실행되는 것을 볼 수 있습니다.

위 예제 중 몇 가지만 살펴보면,

'+' 패턴 검사 코드의 경우, "iz" 문자열이 한 번 이상 존재해야 함을 의미하는 iz+ 패턴이 "mizzle PHP 2002" 문자열에 존재하기 때문에 비교 조건식에 일치하는 결과가 출력됩니다.

'[ ]' 패턴 검사 코드의 경우, "sm" 또는 "im" 문자열이 존재해야 함을 의미하는 [si]m 패턴이 "mizzle PHP 2002" 문자열에 존재하지 않기 때문에 비교 조건식에 일치하지 않는 결과가 출력됩니다.

'[[:digit:]]' 패턴 검사 코드의 경우, 연속되는 숫자 4개의 문자가 존재해야 함을 의미하는 [[:digit:]]{4} 패턴이 "mizzle PHP 2002" 문자열에 존재하기 때문에 비교 조건식에 일치하는 결과가 출력됩니다.

이상, 정규 표현식의 기초에 대해서 살펴보았습니다.
|

댓글 1개

http://regex101.com/ 와 같은 정규표현식 테스트터를 이용해 확인하면서 작업하시면 더욱 편리합니다~
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

+
제목 글쓴이 날짜 조회
11년 전 조회 2,279
11년 전 조회 3,156
11년 전 조회 2,201
11년 전 조회 2,274
11년 전 조회 3,981
11년 전 조회 3,591
11년 전 조회 2,472
11년 전 조회 3,007
11년 전 조회 2,520
11년 전 조회 2,445
11년 전 조회 2,635
11년 전 조회 3,216
11년 전 조회 2,206
11년 전 조회 3,272
11년 전 조회 3,498
11년 전 조회 2,154
11년 전 조회 2,307
11년 전 조회 2,021
11년 전 조회 2,988
11년 전 조회 2,892
11년 전 조회 2,347
11년 전 조회 2,229
11년 전 조회 1,965
11년 전 조회 2,431
11년 전 조회 2,809
11년 전 조회 1,880
11년 전 조회 2,068
11년 전 조회 2,220
11년 전 조회 2,212
11년 전 조회 2,411
11년 전 조회 3,916
11년 전 조회 3,609
11년 전 조회 3,058
11년 전 조회 2,736
11년 전 조회 2,662
11년 전 조회 3,655
11년 전 조회 2,899
11년 전 조회 4,084
11년 전 조회 4,895
11년 전 조회 5,053
11년 전 조회 5,089
11년 전 조회 5,229
11년 전 조회 3,708
11년 전 조회 1.9만
11년 전 조회 2,681
11년 전 조회 2,397
11년 전 조회 2,393
11년 전 조회 2,170
11년 전 조회 2,332
11년 전 조회 2,180
11년 전 조회 1,972
11년 전 조회 2,392
11년 전 조회 2,107
11년 전 조회 2,040
11년 전 조회 2,328
11년 전 조회 2,224
11년 전 조회 2,010
11년 전 조회 2,184
11년 전 조회 2,189
11년 전 조회 2,167
11년 전 조회 2,294
11년 전 조회 1,891
11년 전 조회 1,980
11년 전 조회 2,134
11년 전 조회 2,012
11년 전 조회 2,055
11년 전 조회 1,980
11년 전 조회 1,921
11년 전 조회 1,996
11년 전 조회 2,640
11년 전 조회 1,953
11년 전 조회 2,269
11년 전 조회 2,139
11년 전 조회 1,911
11년 전 조회 1,919
11년 전 조회 2,014
11년 전 조회 1,975
11년 전 조회 2,553
11년 전 조회 5,444
11년 전 조회 2,497
11년 전 조회 2,245
11년 전 조회 2,672
11년 전 조회 8,855
11년 전 조회 2,409
11년 전 조회 3,633
11년 전 조회 2,434
11년 전 조회 2,377
11년 전 조회 2,699
11년 전 조회 2,165
11년 전 조회 2,156
11년 전 조회 2,167
11년 전 조회 2,222
11년 전 조회 2,847
11년 전 조회 2,226
11년 전 조회 2,467
11년 전 조회 2,285
11년 전 조회 5,962
11년 전 조회 1,986
11년 전 조회 2,388
11년 전 조회 2,781