International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
IANA
UTF-8 UTF-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A1A5

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󡥀
E1940
󡥁
E1941
󡥂
E1942
󡥃
E1943
󡥄
E1944
󡥅
E1945
󡥆
E1946
󡥇
E1947
󡥈
E1948
󡥉
E1949
󡥊
E194A
󡥋
E194B
󡥌
E194C
󡥍
E194D
󡥎
E194E
󡥏
E194F
80
90
󡥐
E1950
󡥑
E1951
󡥒
E1952
󡥓
E1953
󡥔
E1954
󡥕
E1955
󡥖
E1956
󡥗
E1957
󡥘
E1958
󡥙
E1959
󡥚
E195A
󡥛
E195B
󡥜
E195C
󡥝
E195D
󡥞
E195E
󡥟
E195F
90
A0
󡥠
E1960
󡥡
E1961
󡥢
E1962
󡥣
E1963
󡥤
E1964
󡥥
E1965
󡥦
E1966
󡥧
E1967
󡥨
E1968
󡥩
E1969
󡥪
E196A
󡥫
E196B
󡥬
E196C
󡥭
E196D
󡥮
E196E
󡥯
E196F
A0
B0
󡥰
E1970
󡥱
E1971
󡥲
E1972
󡥳
E1973
󡥴
E1974
󡥵
E1975
󡥶
E1976
󡥷
E1977
󡥸
E1978
󡥹
E1979
󡥺
E197A
󡥻
E197B
󡥼
E197C
󡥽
E197D
󡥾
E197E
󡥿
E197F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]