그누보드 utf-8로 전환하기 > 그누3 팁자료실

그누3 팁자료실

그누보드 utf-8로 전환하기 정보

그누호환 그누보드 utf-8로 전환하기

첨부파일

gnu3-utf8.tgz (878.4K) 98회 다운로드 2005-04-22 01:18:33

본문

별것도 아닐지도 모르는데, 나름대로 고민한 사안을 조심스럽게 이야기 해 봅니다. 팁이라기 보다는 넉두리에 가깝습니다.
전에 모를 때는 별 생각없이, 예전에는 제로보드, 요즘에는 그누보드를 단순히 사용했었는데, euc-kr이라는 문자셋이 ksc5601 완성형 한글코드의 망령이라는 사실을 알게 된 후,  '웹 표준의 url 처리 문자 인코딩 방식은 utf-8이다'는 사실을 알게 된 후, 사용자들에게 한글로 된 url을 엑스박스 없이 보기 위해서는 인터넷 익스폴러러 옵션 중 'url을 항상 utf-8로 보냄'이라는 옵션을 풀어야 한다는 찜찜한 말을 더이상 하기 싫어서, utf-8로의 전환을 무식하게 추구해 봤습니다.
솔직히 당장 절실히 필요한 것은 아니지만, ksc5601에 기반한 euc-kr이라는 코드를 지금까지도 써야 하는 것에 나름대로 분노를 느꼈기 때문입니다.
제가 관리하는 서버의 mysql, apache, php 등의 기본 문자셋을 모두 utf-8로 설정하고, 그누보드의 소스를 모두 utf-8로 컨버트하고, 그누보드 소스내의 'euc-kr' 문자열을 모두 'utf-8'로 수정해서, 시험삼아 제가 관리하는 사이트(photo.sungshin.hs.kr)를 새로 구축하면서 적용해 보았습니다.(링크한 사이트에 오셔서 ie의 메뉴 중 '보기'-'인코딩'을 확인해 보시면 utf-8인식하고 있을 겁니다.)
그 과정에서, 원래 워낙 아는 것이 없었기에 수많은 시행착오를 격었지만, 지금 제가 새로 구축한 사이트는, 한글로 된 화일을 다운로드 할때 화일명이 임의의 영문자열 화일명으로 바뀌어 받아지는 문제 빼놓고, 아직까지 다른 큰 문제를 발견하지 못했습니다. 제가 사용하는 네이버 메일로의 메일 전송도 문제 없이 잘 됩니다.
제가 알기로는 우리나라 사람들도 많이 쓰는 구굴의 gmail도 utf-8로 문자를 처리한다고 알고 있습니다.
혹시, 컴퓨터를 그냥 취미로 찝쩍거리 듯 해왔던, 역사를 전공하고, 현재 역사를 가르치며 살고 있는 사람이 맨땅에 해딩하듯이 수정한 그누보드 소스를 필요로 하신다면 제 메일로 연락주세요. 여러분들과 함께 고민해 보고 싶습니다. 추후에 여러사람들이 시험해 봐서 별다른 문제가 발견되지 않고, 위에 제가 언급한 문제(한글화일명을 가진 화일의 다운로드 문제)를 여러분들의 도움으로 해결하게 되어, 좀더 완성도 높은 상태가 된다면, 문제가 되지 않는 다면, 이곳 어딘가에 쑥쓰럽지만 공개해 보겠습니다.

[2005.03.11 추가]
제가 변환한 그누 보드 화일을 원하는 분들이 있을 것같아서 부족하지만 그냥 윗글에 첨부했습니다.
그누보드 3.41를 utf-8로 나름대로 무식하게 화일 하나 하나 컨버트한 것입니다. 무식함의 승리라고 나름대로 의미를 부여합니다.

[2005.04.22 추가]
그사이 그누보드가 3.42로 약간 버젼업 되었기에 추가된 내용을 반영해서 다시 올렸습니다.
제 개인 홈(jundol.sungshin.hs.kr)의 공개 자료실에도 같은 화일을 올려났습니다.
추천
0

댓글 전체

참고로 아파치2에서는 디폴트가 udf-8이며 mysql4.0이상부터 udf-8이 기본캐릭셋입니다.
php5에서도 아마 udf-8이 디폴트가 아닐까 생각되는군요..
그냥 메타태크에 해당 캐릭셋옵션을 udf-8로 정의해주고..
editplus에서 모든 파일을 열어 케릭샛관련 문다를 치환해주고 저장할때 udf-8로 해준뒤..

해당 아파치서버에서 캐릭셋을 udf로 지정해주고,
해당 mysql 서버에서 케릭셋을 udf로 지정해주고,
php에 관련 옵션을 검사해주시면 끝납니다.

이런 방법은 서버를 처음 세팅할때 가능하며..

udf-8로 넘어가는 문제는 다름아닌 기존의 데이터가 있을경우 발생합니다.
처음이라면 전혀 문제 될껏이 없습니다.

기존의 디비를 udf-8로 넘길때 쓰는것이 iconv 를 이용한 컨버팅작업입니다.

그다지 어렵거나 하진않고 캐릭셋타입의 개념이 생소해서 그런거겠죠..

수고하셨네요..
저는 뭐 현저하게 머가 좋다는 점을 모르고 있습니다.
하지만 저같은 경우 중국어 일본어를 모두 알고 있습니다.
개인용 홈페이지를 만들면 중국인 일본인 들이 모두 들어올수있고 모두 자신의 민족언어로 글을 남길수 가 있다면
저에겐 더 없는 크나큰 학습이고 배려입니다.
만일 utf8로 고쳐진다면 이런기능을 그누보드로 쉽게 해결할수가 있습니다.
조준연 님 정말로 고맙습니다.
원하던 것을 이렇게 사심없이 베풀어 주셔서......
근데 제가 욕심이 있어서 이렇게 노가다 말고 간단한 프로그램으로 iconv모듈을 이용하여 돌구는 방법을 알고 싶은데.
어느 고수님이 도와주심이......
다소 생소한 느낌입니다..^^...잘 몰라서 질문드립니다..
저 같은 경우는 모든필요구성파일에 ksc5601/euc-kr를 쓰고있고 인덱스메타에도
CONTENT="KSC_5601"로 지정하고 있는데요...

유니코드로 변환시 좋은점이뭔지요??...아니 차이점이 어떤건지요??...
너무궁금해서 이곳에서 질문하게 되네요..^^

현저하게 뭐가 좋다라는게 있으면 저도 바꿔 볼라구요..
하우투 님 정말 대단하십니다. 저도 하우투님이 실현한 것을 꿈꾸었으나 전 php에 대해서 거의 아무것도 모르는, 능력은 없으면서 꿈만 꾸는 사학도이기에 그냥 단순하게 작업할 수 밖에 없었습니다. 앞으로 그누보드가 화면 출력과 관계되는 문자열들을 따로 만들어진 각 언어별 NLS 같은 화일에 정의 된 값을 받아서 처리하는 방향으로 바뀌어, 각 언어 전문가들이 자발적으로 참여하여 다양한 외국어를 지원하는 국제적인 프로그램으로 발전했으면 좋겠다라고 생각합니다.
넉두리를 좀 보태면, 단순 노가다에 해당하는 하찮은 결과를 가지고 이렇게 글을 올리게 된 것은, 이러한 문제(컴퓨터 상에서 문자를 처리하는 방식과 관련한 문제)에 대하여 얼떨결에 관심을 가지게 되면서, 이리 저리 정보 검색을 해본 결과, 다들 너무 이러한 문제에 대하여 별 고민없이, 기존에 남들이 하던 대로, 안정과 호환성이라는 미명 아래, 주변 여건이 충분히 성숙되었는데도 불구하고, 과거의 악습을 따라하는 것같다는 안타까운 생각이 저를 밀었기 때문입니다. 우리 민족 문화를 담는 그릇이라고 할 수 있는 한글 문자 처리를, 충분히 능력도 되는 개발자들이 너무 안이하게  처리하여, 우리 민족 문화의 가능성과 외부의 다른 문화와 어깨를 나란히 하며 소통할 수 있는 가능성을 스스로 축소시키고 있다는 안타까운 생각이 들었습니다. 국제적 표준이며,나름대로 우리 한글을 온전히 표현할 수 있는 방식을 외면하며, 우리만의 구닥다리 관습을 고집하는 현실이 매우 안타깝게 느껴졋습니다. 편리한 통일과 화합의 길을 놔두고, 우물 안에서만 통하는 관습을 고집하는 것은, 나름대로 진보와 혁신을 그 기본으로 한다고 할 수 있는 이쪽 동네 사람들과 어울리지 않는다고 생각합니다.
넘 장황했습니다. 죄송합니다.
제가 변환한 그누 보드 화일을 원하는 분들이 있을 것같아서 부족하지만 그냥 윗글에 첨부했습니다.
그누보드 3.41를 utf-8로 나름대로 무식하게 화일 하나 하나 컨버트한 것입니다. 무식함의 승리라고 나름대로 의미를 부여합니다.
저도 노정현 님과 같은 고민을 하고 여기 저기 뒤적이며 방법을 궁리하다 차라리 그냥 궁리하고 찾아 해매는 시간에 꼼지락 꼼지락 하나 하나 무식하게 바꾸는게 낫겠다는 생각으로 에디트플러스로 화일 하나 하나 컨버트 했습니다.
처음에는 서버 상에서 libiconv로 변환 작업을 했었는데, zip.sql 화일 컨버트 중에 용량이 넘 커서 그런지 변환 중에 제 수준에서는 알 수 없는 이유로 변환이 중단되어 그냥 pc 상에서 에디트플러스로 변환했습니다.
모든 화일에 대하여 변환 작업을 하지 않아도 될지도 모르지만, 전 그냥 무식하게 다 변환 했습니다.
아마 head.sub.php 화일의 content 항목을 utf-8로 바꾸는 등 몇몇 화일의 문자 셋 관련 항목만 수정해도, 그누보드 소스가, 아스키 코드나 utf-8 코드나 코드 값이 같은 영문 라틴 계열을 문자로 대부분 구성되어 있기에 작동을 할 것으로 생각됩니다. 그러나 이 경우 euc-kr 코드로 된 한글 메세지 등은 깨져서 출력될 것입니다. 전 그래서 무식하게 모든 화일을 다 일일이 다 변환 했습니다.
문자셋을 변경하자면 모든 파일을 모두 utf8 로 변경하여야 합니까?
그럴려면 한두개 파일도 아니고 몇백개 가 되는 파일을 모두 utf8로 변경해서 다시 저장하자면 큰 노가다가 아닙니까?
저는 초보라 머 프로그램을 돌려서 변경시키는 방법을 모르고 있습니다.
고수 님들 알면 알려 주실수 없습니까?
디비에는 글자가 깨져보여도 제데로 유니코드 형태로 저장된게 맞습니다. 불러오면 정상으로 나옵니다.
제가 그누보드를 유니코드 버전으로 만들었는데 재밌습니다. 저같은 분이 또 계시다니..^^
저같은 경우는 스킨과 문자셋도 구분을 하였습니다. 스킨을 선택하듯이 문자셋도 선택이 가능하게 말이죠... 문자셋만 변경하면 영어 중국어 일본어 한국어 게시판이 자연스럽게 됩니다. 물론 글작성시 동시에 다국어 입력도 가능합니다.
글쎄요..과연 제대로 들어가는감요? 저는 mysql 4.1.8 로 세팅해 본적이 있는데..(윈도우 환경)
그누보드를 설치후에 한글이 제대로 사용 되길래 안심하려다가. phpmyadmin 으로 확인시 디비에 글자가 깨져들어가는걸 확인했습니다.x???? 이런식으로 들어가더군요..
그런 한글 문제때문에 어쩔수 없이 4.0 버전으로 다시 세팅하는 수밖에 없었는데.. 그 문제는 어떻게 해결하셨는지?
좀전에 저도 확인 차 시험해 봤는데,제 계정의 로케일이 ko_KR.UTF-8인 상태에서 apache2와 php5의 설정 화일에서 기본 문자셋을 지정하지 않았은데 위 사이트는 그대로 작동했읍니다. 아마 apache2나 php5는 이 문제로 특별히 설정할 것이 없는 것같습니다.
참고로, 전 mysql 4.1x-server같은 경우, 제가 freebsd 5.3을 사용하기에 ports라는 시스템을 이용하여 컴파일해서 설치 했는데, 해당 포트에 가서 'make install clean WITH_CHARSET=utf8'이라고 입력하여 설치 했습니다.
꼭 해야 하는 지는 저도 잘 모르겟고, 전 그냥 앞으로 무조건 utf-8로 간다는 신념으로 mysql 4.1x와 apache2, php5를 설치할 때 기본 문자셋을 utf-8로 설정하고 작업했습니다.
전 freebsd 5.3 기반으로 작업했는데, 아마 요즘의 리눅스나 유닉스 들은 다 utf-8을 충분히 잘 지원하는 것으로 알고 있습니다.
전체 1,026
그누3 팁자료실 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1402호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT