문자열 자르기 질문드립니다.

안녕하세요
이리저리 찾아보고 고민도 해보고 고심도 해보고 생각도 해보고 해봤지만,
생각처럼 안되어 고수님들의 도움좀 얻고자 글을 남김니다 불쌍한 초보 도와주신다 생각해주세요 ^^

아래 소스는 보시면 알겠지만 긴 문자열을 잘라서 배열로 만드는 소스입니다.

function splitString($str,$size) {
$len = strlen($str);

if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%2 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
}
else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}


이 소스를 적용하여 만들었는데 각 잘리는 부분마다 한글이 깨지는 부분이 발생하더라구요.
UTF-8 환경이라 그런가 해서 소스 검색을 해보았습니다.
그랬더니 UTF-8 환경에서 한글 문자열 자르기가 있더라구요.
하.지.만. 제목 추출하듯 앞에서 부터 몇글자만 추출하는 소스 밖에는..

제가 찾은 UTF-8 한글 자르기 소스입니다.

function strcut_utf8($str, $len, $checkmb=false, $tail='...'){
preg_match_all('/[\xEA-\xED][\x80-\xFF]{2}|./', $str, $match);
$m = $match[0];
$slen = strlen($str);
$tlen = strlen($tail);
$mlen = count($m);

if ($slen <= $len) return $str;
if (!$checkmb && $mlen <= $len) return $str;
$ret = array();
$count = 0;
for ($i=0; $i < $len; $i++){
$count += ($checkmb && strlen($m[$i]) > 1)?2:1;
if ($count + $tlen > $len) break;
$ret[] = $m[$i];
}
return join('', $ret).$tail;
}

이 두개를 잘 조합시켜 UTF-8 환경에서도 한글이 안짤리고 배열로 저장되게 만들려고 일주일간 고민해봤는데
제 허접한 실력으로는 무리가 있더라구요..
어떻게 보면 "밥을 떠서 먹여주세요" 일수도 있지만 정말 안되어 글을 남김니다.
도움좀 부탁드립니다.
감사합니다.
즐거운 하루 보내세요~<div class='small'>[이 게시물은 관리자님에 의해 2011-10-31 17:16:08 PHP & HTML에서 이동 됨]</div>
|

댓글 2개

mbstring 에 관해서 찾아보심이 어떠실까요.
곰곰히 생각해 보았습니다..
UTF-8 하고 euc-kr 하고 뭐가 다른지...
euc-kr 은 한글을 2byte로 인식하고, utf-8은 3byte로 인식을 합니다.
그래서 소스중간부분을 수정했습니다.

function splitString($str,$size) {
$len = strlen($str);

if($size >= $len) return array($str);
$rtn = array();
$flag = 0;
$start = 0;
$end = $size-1;
for($i=0;$i<$len;$i++) {
if(ord($m[$i]) > 127) $flag++;
if($end == $i) {
if($flag%3 == 1) {
array_push($rtn,substr($str,$start,$size-1));
$start += $size - 1;
} else if($flag%3 == 2) {
array_push($rtn,substr($str,$start,$size-2));
$start += $size - 2;
} else {
array_push($rtn,substr($str,$start,$size));
$start += $size;
}
$end = $start + $size - 1;
}
}
if($len>=$start) {
array_push($rtn,substr($str,$start,$len-$start));
}
return $rtn;
}

일단은 잘 되는거 같습니다.
보시고 의견 있으신분 의견 부탁드립니다.
댓글을 작성하시려면 로그인이 필요합니다.

프로그램

태그 필터 (최대 3개) 전체 개발자 소스 기타 mysql 팁자료실 javascript php linux flash 정규표현식 jquery node.js mobile 웹서버 os 프로그램 강좌 썸네일 이미지관련 도로명주소 그누보드5 기획자 견적서 계약서 기획서 마케팅 제안서 seo 통계 서식 통계자료 퍼블리셔 html css 반응형 웹접근성 퍼블리싱 표준화 반응형웹 홈페이지기초 부트스트랩 angularjs 포럼 스크린리더 센스리더 개발자톡 개발자팁 퍼블리셔톡 퍼블리셔팁 기획자톡 기획자팁 프로그램강좌 퍼블리싱강좌
+
제목 글쓴이 날짜 조회
14년 전 조회 831
14년 전 조회 859
14년 전 조회 1,138
14년 전 조회 1,141
14년 전 조회 1,360
14년 전 조회 1,048
14년 전 조회 923
14년 전 조회 859
14년 전 조회 780
14년 전 조회 801
14년 전 조회 971
14년 전 조회 2,174
14년 전 조회 844
14년 전 조회 1,181
14년 전 조회 2,341
14년 전 조회 1,434
14년 전 조회 1,182
14년 전 조회 4,917
14년 전 조회 2,134
14년 전 조회 965
14년 전 조회 858
14년 전 조회 811
14년 전 조회 724
14년 전 조회 1,990
14년 전 조회 3,301
14년 전 조회 793
14년 전 조회 1,035
14년 전 조회 1,962
14년 전 조회 825
14년 전 조회 1,485
14년 전 조회 1,830
14년 전 조회 1.1만
14년 전 조회 1,390
14년 전 조회 1,194
14년 전 조회 1,911
14년 전 조회 1,934
14년 전 조회 1,127
14년 전 조회 1,219
14년 전 조회 1,037
14년 전 조회 2,657
14년 전 조회 797
14년 전 조회 964
14년 전 조회 2,014
14년 전 조회 2,291
14년 전 조회 735
14년 전 조회 1,160
14년 전 조회 904
14년 전 조회 967
14년 전 조회 1,157
14년 전 조회 986
14년 전 조회 882
14년 전 조회 714
14년 전 조회 701
14년 전 조회 957
14년 전 조회 1,065
14년 전 조회 862
14년 전 조회 898
14년 전 조회 2,682
14년 전 조회 1,175
14년 전 조회 1,332
14년 전 조회 1,306
14년 전 조회 1,793
14년 전 조회 2,207
14년 전 조회 885
14년 전 조회 1,006
14년 전 조회 2,016
14년 전 조회 1,032
14년 전 조회 2,360
14년 전 조회 833
14년 전 조회 1,061
14년 전 조회 1,171
14년 전 조회 2,241
14년 전 조회 1,068
14년 전 조회 3,444
14년 전 조회 1,195
14년 전 조회 715
14년 전 조회 1,092
14년 전 조회 901
14년 전 조회 1,664
14년 전 조회 773
14년 전 조회 881
14년 전 조회 926
14년 전 조회 979
14년 전 조회 1,214
14년 전 조회 1,255
14년 전 조회 1,885
14년 전 조회 898
14년 전 조회 1,353
14년 전 조회 3,141
14년 전 조회 1,069
14년 전 조회 1,030
14년 전 조회 1,418
14년 전 조회 1,404
14년 전 조회 2,259
14년 전 조회 1,467
14년 전 조회 836
14년 전 조회 811
14년 전 조회 693
14년 전 조회 925
14년 전 조회 2,434