UCS2,4와 UTF-8,16,32

1. UTF

2. UTF-8의 λ™μž‘λ°©λ²•

1. UTF?

1-1) UTF?

UTFλŠ” 16λΉ„νŠΈ μœ λ‹ˆμ½”λ“œ λ¬Έμžλ“€μ„ 7λΉ„νŠΈ λ˜λŠ” 8λΉ„νŠΈ 문자둜 λ³€ν™˜ν•˜κΈ° μœ„ν•œ λ°©λ²•μž„.

UTF-8은 μœ λ‹ˆμ½”λ“œλ₯Ό 8λΉ„νŠΈ 문자둜 λ³€κ²½ν•˜λŠ” κ±°μž„.

μœ λ‹ˆμ½”λ“œλž€? 각각의 λ‹€λ₯Έ λ‚˜λΌλ₯Ό μ‹œμŠ€ν…œμ˜ ν˜Έν™˜μ„± 및 ν™•μž₯성에 문제λ₯Ό μΌμœΌν‚€λŠ” κ΄€κ³„λ‘œ

이λ₯Ό ν•˜λ‚˜μ˜ 문자인 μœ λ‹ˆμ½”λ“œλ‘œ ν†΅ν•©μ‹œμΌœ ν‘œν˜„ν•˜λŠ” 방법 쀑에 ν•œ κ°€μ§€μž„.

1-2) UTF μš©μ–΄μ˜ 이해

μœ λ‹ˆμ½”λ“œ κ΄€λ ¨ λ¬Έμ„œλ₯Ό 읽닀보면 κ°€μž₯ 많이 λ§ˆμ£ΌμΉ˜λŠ” μš©μ–΄λ“€μ΄

UCS-2, UCS-4, UTF-8, UTF-16, UTF-32 λ“±κ³Ό 같은 λ‹¨μ–΄λ“€μž„.

1-3) κΈ°λ³Έ μ–Έμ–΄νŒ BMP(Basic multilingual plane)

μœ λ‹ˆμ½”λ“œμ—μ„œ ν˜„μž¬ 17개의 μ–Έμ–΄νŒμ„ μ‚¬μš©ν•  수 있음.

λͺ¨λ‘ κ·Έλ£Ή 00에 포함.

2. UTF-8의 λ™μž‘λ°©λ²•

DNSλ₯Ό 찾을 경우 ν΄λΌμ΄μ–ΈνŠΈμ—μ„œ utf-8둜 인코딩 λ˜μ–΄ μ„œλ²„μ˜ IPμ£Όμ†Œλ₯Ό 찾아감.

κ·ΈλŸ¬λ‚˜ νŠΉμ •ν•œ μ‚¬μ΄νŠΈμΈ 경우 UTF-8을 μ§€μ›ν•˜μ§€ λͺ»ν•  μˆ˜λ„ 있고 μ„œλ²„μ— 접속 λͺ»ν•  μˆ˜λ„ 있음.