cut_str 함수에서 UTF-8을 위한 마지막 글자 처리
common.lib.php 파일 내부의 cut_str() 함수를 일단 한번 수정해봤습니다.
제가 이쪽분야로는 워낙 지식이 짧은 관계로, 첨부된 그림파일 정도의 테스트를 해보고 올립니다.
고수님들께서 한번 검토해보시고 오류가 있으면 댓글을 가차없이 달아주시기 바랍니다. ^^;
4바이트는 사용되는 일이 거의 없다라고 하던데, 그냥 넣었습니다. (ㅡ.ㅡ;)a
그리고, 중간문자가 깨질 수 있는 상황에 대해서는 고려하지 않았습니다.
참고로, 그림의 문자들은... 다른나라 글자하고는 별로 친하지 않은 관계로 무슨 내용인지는 모릅니다. ㅡ.ㅡ;
function cut_str($str, $len, $suffix="…")
{
global $g4;
$s = substr($str, 0, $len);
$cnt = 0; // 마지막 글자에서 잘린 후 남겨진 바이트 수
$s_len = strlen($s);
// UTF-8 마지막 글자 깨짐 처리
if (strtoupper($g4['charset']) == 'UTF-8') {
for ($i=0; $i<$s_len; $i++) {
$oc = ord($s[$i]);
if ( ($oc & 0xF8) == 0xF0 ) // 4byte
{
if ($i+4 >= $s_len) { $cnt = ($s_len-$i)%4; break; }
else $i+=3;
}
else if ( ($oc & 0xF0) == 0xE0 ) // 3byte
{
if ($i+3 >= $s_len) { $cnt = ($s_len-$i)%3; break; }
else $i+=2;
}
else if ( ($oc & 0xE0) == 0xC0 ) // 2byte
{
if ($i+2 >= $s_len) { $cnt = ($s_len-$i)%2; break; }
else $i++;
}
else // 1byte
$cnt = 0;
}
if ($cnt)
$s = substr($s, 0, $s_len - $cnt);
}
else // EUC-KR, 마지막 글자 깨짐 처리
{
for ($i=0; $i<$s_len; $i++) {
$oc = ord($s[$i]);
if ( $oc > 0x7F )
{
if ($i+2 >= $s_len ) { $cnt = ($s_len-$i)%2; break; }
else $i++;
}
else
$cnt = 0;
}
if ($cnt)
$s = substr($s, 0, $s_len - $cnt);
}
if (strlen($s) >= strlen($str))
$suffix = "";
return $s . $suffix;
}
제가 이쪽분야로는 워낙 지식이 짧은 관계로, 첨부된 그림파일 정도의 테스트를 해보고 올립니다.
고수님들께서 한번 검토해보시고 오류가 있으면 댓글을 가차없이 달아주시기 바랍니다. ^^;
4바이트는 사용되는 일이 거의 없다라고 하던데, 그냥 넣었습니다. (ㅡ.ㅡ;)a
그리고, 중간문자가 깨질 수 있는 상황에 대해서는 고려하지 않았습니다.
참고로, 그림의 문자들은... 다른나라 글자하고는 별로 친하지 않은 관계로 무슨 내용인지는 모릅니다. ㅡ.ㅡ;
function cut_str($str, $len, $suffix="…")
{
global $g4;
$s = substr($str, 0, $len);
$cnt = 0; // 마지막 글자에서 잘린 후 남겨진 바이트 수
$s_len = strlen($s);
// UTF-8 마지막 글자 깨짐 처리
if (strtoupper($g4['charset']) == 'UTF-8') {
for ($i=0; $i<$s_len; $i++) {
$oc = ord($s[$i]);
if ( ($oc & 0xF8) == 0xF0 ) // 4byte
{
if ($i+4 >= $s_len) { $cnt = ($s_len-$i)%4; break; }
else $i+=3;
}
else if ( ($oc & 0xF0) == 0xE0 ) // 3byte
{
if ($i+3 >= $s_len) { $cnt = ($s_len-$i)%3; break; }
else $i+=2;
}
else if ( ($oc & 0xE0) == 0xC0 ) // 2byte
{
if ($i+2 >= $s_len) { $cnt = ($s_len-$i)%2; break; }
else $i++;
}
else // 1byte
$cnt = 0;
}
if ($cnt)
$s = substr($s, 0, $s_len - $cnt);
}
else // EUC-KR, 마지막 글자 깨짐 처리
{
for ($i=0; $i<$s_len; $i++) {
$oc = ord($s[$i]);
if ( $oc > 0x7F )
{
if ($i+2 >= $s_len ) { $cnt = ($s_len-$i)%2; break; }
else $i++;
}
else
$cnt = 0;
}
if ($cnt)
$s = substr($s, 0, $s_len - $cnt);
}
if (strlen($s) >= strlen($str))
$suffix = "";
return $s . $suffix;
}
첨부파일
|
댓글을 작성하시려면 로그인이 필요합니다.
로그인
댓글 15개
녀석이 자꾸만 귀찮게해서...
이 기회에 천상재회님께 입양을... d(ㅡ.ㅡ;)
목록에 저 이미지 잔상이 움직입니다......호호호~~**
놀랠 노자라고 쳐다보고 있습니다......
UTF-8 이라서 혹시 문제가 있어서 첨부한 파일이 뿌려짐과 동시에 위에 리스트가 뿌려지고 기타등등 나불나불~ 어쩌구 하는 문제때문에 그렇게 출력되는 줄 알고 한 말이었습니다.