리자

UTF-8 한글 TEST

$str = "한글 abc 123 사랑합니다.";

$str = preg_replace("#\r|\n#", " ", trim($str));
$len = strlen($str);

$i = 0;
$k = 0;
while ($i < $len) {
    if (preg_match('/^[\x20]/xs', $str)) {
        echo $str[0];
        $n = 1;
    }
    else if (preg_match('/^[\x30-\x39\x41-\x5a\x61-\x7a]/xs', $str)) {
        echo $str[0];
        $n = 1;
    }
    else if (preg_match('/^[\xc0-\\xdf][\x80-\xbf]/xs', $str)) {
        echo $str[0].$str[1];
        $n = 2;
    }
    else if (preg_match('/^[\xe0-\\xef][\x80-\xbf]{2}/xs', $str)) {
        echo $str[0].$str[1].$str[2];
        $n = 3;
    }
    else if (preg_match('/^[\xf0-\\xf7][\x80-\xbf]{3}/xs', $str)) {
        echo $str[0].$str[1].$str[2].$str[3];
        $n = 4;
    }
    else {
        $n = 1;
    }

    $str = substr($str, $n);
    $i += $n;

    //echo $i; echo "<br>";

    if ($k++ > 10000) break;
}

[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]
|

댓글 1개

http://kr.php.net/manual/en/function.utf8-encode.php

bytes bits representation
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb

예를 들어 3바이트(한글 포함) UTF-8 의 경우

E0-EF 에 포함되고 뒤 이은 2바이트가 80-BF 에 포함되면 UTF-8 한글임
댓글을 작성하시려면 로그인이 필요합니다. 로그인

개발자팁

개발과 관련된 유용한 정보를 공유하세요. 질문은 QA에서 해주시기 바랍니다.

+
분류 제목 글쓴이 날짜 조회
JavaScript 15년 전 조회 2,375
기타 15년 전 조회 1,723
기타 15년 전 조회 1,658
기타 15년 전 조회 2,994
기타 15년 전 조회 1,779
기타 15년 전 조회 2,082
기타 15년 전 조회 2,319
JavaScript
[JavaScript]
15년 전 조회 2,132
jQuery 15년 전 조회 3,390
정규표현식 15년 전 조회 5,133
JavaScript 15년 전 조회 4,019
기타 15년 전 조회 1,685
JavaScript 15년 전 조회 3,229
PHP 15년 전 조회 3,590
JavaScript 15년 전 조회 2,837
PHP 15년 전 조회 6,701
jQuery 15년 전 조회 3,763
jQuery 15년 전 조회 7,853
jQuery 15년 전 조회 5,544
기타 15년 전 조회 2,823
기타 15년 전 조회 1,887
기타 15년 전 조회 2,456
JavaScript 15년 전 조회 2,857
기타 15년 전 조회 2,527
기타 15년 전 조회 1,955
jQuery 15년 전 조회 2,556
기타 15년 전 조회 1,842
기타 15년 전 조회 1,850
JavaScript 15년 전 조회 1,934
기타 15년 전 조회 1,839
🐛 버그신고