International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
IANA
UTF-8 UTF-8


Codepage Layout

Currently showing the codepage starting with the bytes F1A08C

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
񠌀
60300
񠌁
60301
񠌂
60302
񠌃
60303
񠌄
60304
񠌅
60305
񠌆
60306
񠌇
60307
񠌈
60308
񠌉
60309
񠌊
6030A
񠌋
6030B
񠌌
6030C
񠌍
6030D
񠌎
6030E
񠌏
6030F
80
90
񠌐
60310
񠌑
60311
񠌒
60312
񠌓
60313
񠌔
60314
񠌕
60315
񠌖
60316
񠌗
60317
񠌘
60318
񠌙
60319
񠌚
6031A
񠌛
6031B
񠌜
6031C
񠌝
6031D
񠌞
6031E
񠌟
6031F
90
A0
񠌠
60320
񠌡
60321
񠌢
60322
񠌣
60323
񠌤
60324
񠌥
60325
񠌦
60326
񠌧
60327
񠌨
60328
񠌩
60329
񠌪
6032A
񠌫
6032B
񠌬
6032C
񠌭
6032D
񠌮
6032E
񠌯
6032F
A0
B0
񠌰
60330
񠌱
60331
񠌲
60332
񠌳
60333
񠌴
60334
񠌵
60335
񠌶
60336
񠌷
60337
񠌸
60338
񠌹
60339
񠌺
6033A
񠌻
6033B
񠌼
6033C
񠌽
6033D
񠌾
6033E
񠌿
6033F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]