분류
1. 개요
%20
| (
| %28
| :
| %3A
| [
| %5B
| `
| %60
| |
!
| %21
| )
| %29
| ;
| %3B
| %5C
| {
| %7B
| |
"
| %22
| *
| %2A
| <
| %3C
| ]
| %5D
| |
| %7C
|
#
| %23
| +
| %2B
| =
| %3D
| ^
| %5E
| }
| %7D
|
$
| %24
| ,
| %2C
| >
| %3E
| _
| %5F
| ~
| %7E
|
%25
| -
| %2D
| ?
| %3F
| .
| .
| .
| .
| |
&
| %26
| .
| %2E
| @
| %40
| .
| .
| .
| .
|
'
| %27
| /
| %2F
| .
| .
| .
| .
| .
| .
|
퍼센트 인코딩이라고도하며, URL encoding에 사용된다. 그 정체는 %뒤에 아스키 코드의 hex(16진수)값을 붙여준 것. URL은 스페이스(space)를 포함할 수 없기 때문에, 스페이스는 %20으로 대체되는 것이 보통이다. 인코딩 형식에 %가 들어가기 때문에 퍼센트 인코딩이라고도 한다.
아스키 문자가 이미 다른 용도로 쓰이고 있어서 % 문자 뒤에 코드값을 넣어서 우회하거나, 아스키 코드 이외의 문자가 쓰일 때 아스키 문자로 돌려 쓰기 위하여 이런 방식이 사용된다.
이런 퍼센트 인코딩은 어떠한 문자 코드에도 대응시킬 수 있으나 점점 국제 표준인 UTF-8에 대응시키는 것으로 통일되는 추세이다. 과거 국내 웹 사이트에서 EUC-KR을 주로 사용하던 시절에는 한글 파일명을 찾지 못하는 경우가 많았으며, 이 때문에 'URL 경로를 UTF-8로 보내기'의 체크를 해제하라거나, 파일명을 영숫자만으로 적으라거나 하는 말들이 많이 보였다. 현재는 대부분 UTF-8로 통일하거나 아니면 서버 측에서 자동으로 변환해서 전송하기 때문에 아무래도 큰 문제는 없다.
다만 퍼센트 인코딩은 국제화 도메인 네임(IDN)의 대체 표기로는 쓰이지 않는다. IDN의 대체 표기는 퓨니코드(Punycode)라는 걸 이용해서 돌려 표기한다. 자세한 내용은 국제화 도메인 네임 문서 참고.
2. 유니코드 문자의 URL escape code
위 표는 ASCII 코드 문자를 URL encoding한 것이다. 유니코드 문자의 경우 일반적으로 UTF-8 방식을 따른다. (ASCII 문자는 UTF-8과 호환이 된다.)
크롬이나 파이어폭스에서 주소창이 위와 같이 나타난다고 하면 URL encoding 과정은 아래와 같다.
http://namu.wiki/w/나무위키 크롬이나 파이어폭스에서 주소창이 위와 같이 나타난다고 하면 URL encoding 과정은 아래와 같다.
글자
| 유니코드
| UTF-8
| URL escape code
|
나
| U+B098
| EB 82 98
| %EB%82%98
|
무
| U+BB34
| EB AC B4
| %EB%AC%B4
|
위
| U+C704
| EC 9C 84
| %EC%9C%84
|
키
| U+D0A4
| ED 82 A4
| %ED%82%A4
|
참고로 한글은 UTF-8 기준으로 3바이트를 할당하기 때문에 위와 같이 글자 마디 하나당 %XX패턴이 세 번씩 나타난다.
인코딩 결과는 아래와 같이 나온다.
http://namu.wiki/w/%EB%82%98%EB%AC%B4%EC%9C%84%ED%82%A4 PC 브라우저 중 인터넷 익스플로러와 마이크로소프트 엣지는 퍼센트 인코딩된 주소를 표시한다. 모바일 브라우저 중 삼성 인터넷은 13.2.1.70 버전부터 퍼센트 인코딩만 지원한다. 이전 버전에서는 주소 표시줄에만 인코딩되지 않은 주소를 표시하고 링크를 길게 눌렀을 때 나타나는 메뉴에서는 퍼센트 인코딩된 주소를 표시한다.
3. 나무위키의 URL escape code
나무위키에서는 링크를 만들 때 항목명에 들어간 특수문자를 URL escape code로 풀어줄 필요가 없다. 단, # 기호는 특별처리한다.
MORE & MORE (
도대체 왜?인구단 (
오히려 URL escape code를 사용했을 때 문제가 생긴다.
MORE & MORE (
나무위키에서 위 링크를 클릭하면
엔진이 다른 나무위키 미러에서는 위 링크가 대체로 정상 작동한다. (이름에 &가 들어간 항목은 빼고.)
해시 기호는 URL anchor를 연결하기 위해 쓰이므로 페이지 이름에 # 문자가 포함된 경우는
MORE & MORE (
[[MORE & MORE]])도대체 왜?인구단 (
[[도대체 왜?인구단]])오히려 URL escape code를 사용했을 때 문제가 생긴다.
MORE & MORE (
[[MORE%20%26%20MORE|MORE & MORE]])나무위키에서 위 링크를 클릭하면
MORE%20%26%20MORE항목으로 연결을 시도하다가 실패할 것이다. 이러한 현상이 일어나는 이유는 문서 작성/수정 시점인 2015년 6월 현재 나무위키의 엔진이 링크의 항목명에 포함된 %를 %25로 치환하여 인식하기 때문인 것으로 추정된다(주소창에는 ".../MORE%2520%2526%2520MORE"로 나온다).엔진이 다른 나무위키 미러에서는 위 링크가 대체로 정상 작동한다. (이름에 &가 들어간 항목은 빼고.)
해시 기호는 URL anchor를 연결하기 위해 쓰이므로 페이지 이름에 # 문자가 포함된 경우는
[[C#]]와 같은 식이 아닌 [[C\#]]을 쓴다. 모니위키의 경우에는 URL escape code를 이용하여 [[C%23|C#]]으로 써야 한다.3.1. GOTO
[[%47%4F%54%4F|GOTO]]처럼 URL escape code로 풀어주는 방법은 사용할 수 없다. 앞서 언급한, 나무위키 엔진이 %를 %25로 치환하는 문제가 있기 때문.
[1] 리그베다 위키는 모니위키 기반이었고, 모니위키에서 대괄호 두 개짜리는 원래 매크로 문법인데, 미디어위키식 링크를 도입하면서 매크로 문법과 같이 쓸 수 없는 경우가 생겼기 때문이다. 이 때문에 GOTO항목으로 가기 위해 대괄호 두 개짜리 링크를 걸면 GOTO 매크로가 작동하는 문제가 발생했고... 더 이상의 자세한 설명은 생략한다.[2] 이 문법 변경으로 인해
[문서], [문서|출력], [[wiki:"문서" 출력]], [[wiki:"문서]], [["문서"]]는 모두 막혔다.[3] 이 문법 변경으로 인해 [문서], [문서|출력], [[wiki:"문서" 출력]], [[wiki:"문서]], [["문서"]]는 모두 막혔다.