UTF-8 과 UTF-8 + BOM 에 대해 간단하게 설명해 주세요. 정보
UTF-8 과 UTF-8 + BOM 에 대해 간단하게 설명해 주세요.
본문
ㅠㅠ
왜?
UTF-8 + BOM 형식으로 저장이 되는걸까요?
요즘 UTF-8 파일 형식 관련의 20% 이상이 UTF-8 + BOM 과 관련된 문의입니다.
누가 속 시원히 해결좀 해주세요. ㅜㅜ
추천
0
0
댓글 6개
유닉스/리눅스는 nobom
윈도우는bom이 기본형식인것 같던데
왜 그런지는 저도 잘;;;
윈도우는bom이 기본형식인것 같던데
왜 그런지는 저도 잘;;;

파일형식헤더차이 라고해야하나.
원래 문자셋을 헤더에 지정하게되어있는데 utf-8이 표준이 되면서 utf-8은 안써야되거든요.
안쓰면 utf-8 쓰면 utf-8 + bom (byte order mark) 이 됩니다.
에디터는 bom을 무시하는데 서버는 bom을 인식해서 에러문자로 보고 오류를 발생시킵니다.
원래 문자셋을 헤더에 지정하게되어있는데 utf-8이 표준이 되면서 utf-8은 안써야되거든요.
안쓰면 utf-8 쓰면 utf-8 + bom (byte order mark) 이 됩니다.
에디터는 bom을 무시하는데 서버는 bom을 인식해서 에러문자로 보고 오류를 발생시킵니다.

드림위버나, 울트라에디트, ftp 프로그램중 일부가 utf-8에 강제로 BOM을 붙이는것 같습니다.
에디터나 ftp 프로그램 옵션 기본값을 바꿔야 하는데. 흠..
에디터나 ftp 프로그램 옵션 기본값을 바꿔야 하는데. 흠..

윈도우 기본 내장 메모장이 무조건 BOM을 넣는게 문제죠 ㅠㅠ

UTF-8 + BOM 은 해당 페이지안 첫머리에 UTF-8로 인식하라는 표식이 저장되기때문에
파일내에 자료가 영문만 있는경우에도 ANSI 로 변경되지않고 UTF-8 그대로 유지됩니다.
파일내에 자료가 영문만 있는경우에도 ANSI 로 변경되지않고 UTF-8 그대로 유지됩니다.

위키백과의 BOM 항목입니다. http://j.mp/xZ4hkp