문서를
UTF-8로 저장하는 과정에서 뭔가 꼬여서 문서가 온전하게 저장되지 못하면 이렇게 된다. 문서를 UTF-8로 저장할 때, UTF-8에서 유효하지 않은 바이트나 byte sequence는 이 �로 대체된다. 따라서 이 문자는 정상적인 경우에는 절대 출력되지 않는다. 쉽게 말해
오류 문자.
제대로 저장되지 못한 UTF-8 문서를 EUC-KR나 EUC-CN으로 읽으면
占쏙옙,
锟斤拷 등이 출력된다.
유니코드에서만 사용되는 인코딩이기 때문에
EUC-KR(완성형)이나 EUC-CN(간체자),
Shift_JIS(일본어) 등의
MBCS 인코딩이나, Windows-1252(서유럽어) 등의
ANSI 인코딩에서는 이 문자를 표시하거나 저장할 수 없으며, 따라서 물음표(?) 내지는 언더바(_)로 바뀌어서 표시되거나 저장된다.