쉬어가는 페이지 > 정규표현식은 왜 알아야 하고 필요한가? > 개발강좌

개발강좌

프로그램 강좌 :
1. 유창화님의 썸네일, 정규표현식, 이미지관련 강좌
2. Sphinx 검색엔진을 이용한 도로명 주소 검색 시스템 구축

쉬어가는 페이지 > 정규표현식은 왜 알아야 하고 필요한가? 정보

정규표현식 쉬어가는 페이지 > 정규표현식은 왜 알아야 하고 필요한가?

본문

정규표현식을 모르거나 사용안한다고 하여도 프로그램을 하는 데는 전혀 지장이 없습니다.
클래스를 모른다고 프로그램이 안되지 않는 것처럼, 정규표현식도 그렇습니다.
프로그램은 문법 과 제어구조만 알아도 다 만들수 있습니다.

단, 생산성과 효율성의 문제에서 다른 것들을 익히고 알아야 할 필요가 있습니다.

많이 쓰는 부분을 정리해서 함수로 만들고,
그런 함수들을 모아서 새로운 기능 정의와 함께 클래스를 만들고,
또 그런 클래스를 모아서 또 새로운 여러가지 추가와 함께 패키지 형태로 만들고........

이렇게 하는 이유는 매번 반복하는 부분들에 대해서 빠르고 쉽게 재사용하여 생산성과 효율성을 높이기 위해서라고 저는 개인 적으로 생각합니다.
물론, 부가적으로 성능 개선과 같은 잇점도 발생 할수도 있습니다.

각설하고. 

아래와 같은 정규표현식을 사용하는 문제가 있습니다.
문제 > 입력받은 문자열에서 알파벳 소문자 중 하나가 포함되어 있다면 그것을 출력하라.

풀이>
<?php

$string = '12345j6789';

if (preg_match("/[a-z]/", $string, $matches)) {

    echo $matches[0];
}
else {

    echo $string . ' 에서 알파벳 소문자가 발견되지 않았습니다.';
}

?>

이것을 정규 표현식을 사용하지 않고 구현하라 라고 한다면........
아주 간단한 정규 표현식임에도 불구하고, 이런 문제를 평소에 접해보지 않은 사람이라면 잠시 헤멜 수도 있습니다.
방법이야 여러가지가 있겠지만 저는 다음 두가지 방식으로 한번 풀어봤습니다.

1. php 의 문자열 특성을 이용한 풀이
<?php

$string = '12345j6789';

$string_length = strlen($string);
$range = range('a', 'z');

$find = '';
$k = 0;
while($k < $string_length){

    if (in_array($string[$k], $range)) {

        $find = $string[$k];
        break;
    }

    $k++;
}

if (!empty($find)) {

    echo $find;
}
else {

    echo $string . ' 에서 알파벳 소문자가 발견되지 않았습니다.';
}

?>

2. php 의 substr 을 이용한 풀이
<?php

$string = '12345j6789';

$string_length = strlen($string);
$range = range('a', 'z');

$find = '';
$k = 0;
while($k < $string_length){

    if (in_array(substr($string, $k, 1), $range)) {

        $find = substr($string, $k, 1);
        break;
    }

    $k++;
}

if (!empty($find)) {

    echo $find;
}
else {

    echo $string . ' 에서 알파벳 소문자가 발견되지 않았습니다.';
}

?>

보시는 바와 같이 프로그램이 다소 복잡해졌습니다.
알파벳 소문자 하나를 찾기 위해서, 정규표현식으로는 간단하게 패턴만 만들어줌으로서 그과정을 모두 대신했지만,
정규표현식을 사용하지 않으면, 알파벳 소문자를 찾기 위한 과정이 처리과정에 포함되어야 합니다.


이렇게 간단한 것도 이정도 차이가 나는데
이전 내용에서 예제로 들었던 

<?php

$strings = Array();
$strings[] = 'DBCKDGHK@i-boss.co.kr";

foreach($strings as $string){

    //이메일은 @ 를 기준으로 아이디와 서버로 구분된다. 아이디에는 @ 와 . 은 올수 없으며 4자이상이다. 서버에는 알파벳 소문자와 숫자 - .으로 3 자 이상으로 구성 되어있다.
    if (preg_match('/^[^@.]{4,}@[0-9a-z-.]{3,}$/', $string, $matches)) {

        echo '<font color="blue">' . $string . ' 은 정상적인 이메일입니다.</font><br />' . PHP_EOL;
    }
    else {

        echo '<font color="red">' . $string . ' 은 정상적인 이메일이 아닙니다.</font><br />' . PHP_EOL;
    }
}

?>

이런 것을 정규표현식을 사용하지 않고 직접 구현하려면, 음......
이것만으로도 적지 않은 양의 라인수를 가진 프로그램이 된다는 것은 직감적으로도 알수 있습니다.



아무튼.......
제 말의 요지는 프로그램 이란 자체도 일일이 손으로 계산하고 처리하던 것을 생산성 과 효율성을 위해 만들어진 것처럼
프로그램 내에서도 생산성과 효율성은 배제 할수 없는 부분 이라는 것입니다.

그중에 이 정규표현식은 특히나 더 큰 생산성과 효율성을 제시하기 때문에, 반드시 알고 있어야 할 프로그램적인 소양 같은 것이라고 저는 생각합니다.



이상, 정규표현식을 왜 알아야 하고 필요한지 저의 생각이었습니다.
감사합니다.
추천
4

댓글 14개

정규식을 좀 배우다 보니까
꼭 프로그램 뿐만 아니라 문서라던가 검색할때도 엄청 유용하겠더라구요...
열심히 공부해서 자유자재로 쓸 수 있게 되었으면 좋겠네요...
좋은 강좌 감사합니다 ^^
그누보드 소스 분석하다가 정규표현식나오면 일단 뒤로 미뤄두곤 했었는데, 이제야 들여다 보내요.
좋은 강의 감사합니다.
전체 103
개발강좌 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT