International Components for Unicode

ICU Home
  · ICU Home
ICU4C Demos
  · Converter Explorer
  · Collation Demo
  · Segments
  · IDNA
  · Locale Explorer
  · Normalization Browser
  · Regular Expressions
  · String Compare
  · Transforms
  · Unicode Browser
ICU4J Demos
  · Demo Page
Tools
 

Related Websites

Unicode Consortium

Common Locale Data

 

 
ICU  >  Demo  >  Converter Explorer  > 

UTF-8

Select a standard to view:











Related Topics
 
 · Converter Explorer Help 
 · ICU Charset Information 
 

List of Converter Aliases
Internal
Converter Name
IANA
UTF-8 UTF-8


Codepage Layout

Currently showing the codepage starting with the bytes F3A28D

  000102030405060708090A0B0C0D0E0F 
00                                 00
10                                 10
20                                 20
30                                 30
40                                 40
50                                 50
60                                 60
70                                 70
80
󢍀
E2340
󢍁
E2341
󢍂
E2342
󢍃
E2343
󢍄
E2344
󢍅
E2345
󢍆
E2346
󢍇
E2347
󢍈
E2348
󢍉
E2349
󢍊
E234A
󢍋
E234B
󢍌
E234C
󢍍
E234D
󢍎
E234E
󢍏
E234F
80
90
󢍐
E2350
󢍑
E2351
󢍒
E2352
󢍓
E2353
󢍔
E2354
󢍕
E2355
󢍖
E2356
󢍗
E2357
󢍘
E2358
󢍙
E2359
󢍚
E235A
󢍛
E235B
󢍜
E235C
󢍝
E235D
󢍞
E235E
󢍟
E235F
90
A0
󢍠
E2360
󢍡
E2361
󢍢
E2362
󢍣
E2363
󢍤
E2364
󢍥
E2365
󢍦
E2366
󢍧
E2367
󢍨
E2368
󢍩
E2369
󢍪
E236A
󢍫
E236B
󢍬
E236C
󢍭
E236D
󢍮
E236E
󢍯
E236F
A0
B0
󢍰
E2370
󢍱
E2371
󢍲
E2372
󢍳
E2373
󢍴
E2374
󢍵
E2375
󢍶
E2376
󢍷
E2377
󢍸
E2378
󢍹
E2379
󢍺
E237A
󢍻
E237B
󢍼
E237C
󢍽
E237D
󢍾
E237E
󢍿
E237F
B0
C0                                 C0
D0                                 D0
E0                                 E0
F0                                 F0
  000102030405060708090A0B0C0D0E0F 

Information About This Converter
Type of converterUCNV_UTF8
Minimum number of bytes per UChar1
Maximum number of bytes per UChar3
Substitution character\xEF\xBF\xBD
Is ASCII [\x20-\x7E] compatible?TRUE
Is ASCII [\u0020-\u007E] ambiguous?FALSE
Contains ambiguous aliases?FALSE
Always generates Unicode NFC?UNKNOWN
Contains BiDi characters?TRUE

List of Languages Representable By This Codepage
View Complete Set...

Set of Unicode Characters Representable By This Codepage

[^\uD800-\uDFFF]