]> Shamusworld >> Repos - ttedit/blob - src/charnames.cpp
d50cfa3f889f1485b2286965894eef21335d0347
[ttedit] / src / charnames.cpp
1 //
2 // CHARNAMES.CPP
3 //
4 // A header file that links Unicode character names to character numbers.
5 // by James Hammons
6 // (C) 2004 Underground Software
7 //
8 // JLH = James L. Hammons <jlhamm@acm.org>
9 //
10 // Who  When        What
11 // ---  ----------  -----------------------------------------------------------
12 // JLH  ??/??/200?  Created this file
13 //
14
15 unsigned char macStdNames[] = {
16   "\x06""notdef"
17   "\x05"".null"
18   "\x02""CR"
19   "\x05""space"
20   "\x06""exclam"
21   "\x08""quotedbl"
22   "\x0A""numbersign"
23   "\x06""dollar"
24   "\x07""percent"
25   "\x09""ampersand"
26   "\x0B""quotesingle"
27   "\x09""parenleft"
28   "\x0A""parenright"
29   "\x08""asterisk"
30   "\x04""plus"
31   "\x05""comma"
32   "\x06""hyphen"
33   "\x06""period"
34   "\x05""slash"
35   "\x04""zero"
36   "\x03""one"
37   "\x03""two"
38   "\x05""three"
39   "\x04""four"
40   "\x04""five"
41   "\x03""six"
42   "\x05""seven"
43   "\x05""eight"
44   "\x04""nine"
45   "\x05""colon"
46   "\x09""semicolon"
47   "\x04""less"
48   "\x05""equal"
49   "\x07""greater"
50   "\x08""question"
51   "\x02""at"
52   "\x01""A"
53   "\x01""B"
54   "\x01""C"
55   "\x01""D"
56   "\x01""E"
57   "\x01""F"
58   "\x01""G"
59   "\x01""H"
60   "\x01""I"
61   "\x01""J"
62   "\x01""K"
63   "\x01""L"
64   "\x01""M"
65   "\x01""N"
66   "\x01""O"
67   "\x01""P"
68   "\x01""Q"
69   "\x01""R"
70   "\x01""S"
71   "\x01""T"
72   "\x01""U"
73   "\x01""V"
74   "\x01""W"
75   "\x01""X"
76   "\x01""Y"
77   "\x01""Z"
78   "\x0B""bracketleft"
79   "\x09""backslash"
80   "\x0C""bracketright"
81   "\x0B""asciicircum"
82   "\x0A""underscore"
83   "\x05""grave"
84   "\x01""a"
85   "\x01""b"
86   "\x01""c"
87   "\x01""d"
88   "\x01""e"
89   "\x01""f"
90   "\x01""g"
91   "\x01""h"
92   "\x01""i"
93   "\x01""j"
94   "\x01""k"
95   "\x01""l"
96   "\x01""m"
97   "\x01""n"
98   "\x01""o"
99   "\x01""p"
100   "\x01""q"
101   "\x01""r"
102   "\x01""s"
103   "\x01""t"
104   "\x01""u"
105   "\x01""v"
106   "\x01""w"
107   "\x01""x"
108   "\x01""y"
109   "\x01""z"
110   "\x09""braceleft"
111   "\x03""bar"
112   "\x0A""braceright"
113   "\x0A""asciitilde"
114   "\x09""Adieresis"
115   "\x05""Aring"
116   "\x08""Ccedilla"
117   "\x06""Eacute"
118   "\x06""Ntilde"
119   "\x09""Odieresis"
120   "\x09""Udieresis"
121   "\x06""aacute"
122   "\x06""agrave"
123   "\x0B""acircumflex"
124   "\x09""adieresis"
125   "\x06""atilde"
126   "\x05""aring"
127   "\x08""ccedilla"
128   "\x06""eacute"
129   "\x06""egrave"
130   "\x0B""ecircumflex"
131   "\x09""edieresis"
132   "\x06""iacute"
133   "\x06""igrave"
134   "\x0B""icircumflex"
135   "\x09""idieresis"
136   "\x06""ntilde"
137   "\x06""oacute"
138   "\x06""ograve"
139   "\x0B""ocircumflex"
140   "\x09""odieresis"
141   "\x06""otilde"
142   "\x06""uacute"
143   "\x06""ugrave"
144   "\x0B""ucircumflex"
145   "\x09""udieresis"
146   "\x06""dagger"
147   "\x06""degree"
148   "\x04""cent"
149   "\x08""sterling"
150   "\x07""section"
151   "\x06""bullet"
152   "\x09""paragraph"
153   "\x0A""germandbls"
154   "\x0A""registered"
155   "\x09""copyright"
156   "\x09""trademark"
157   "\x05""acute"
158   "\x08""dieresis"
159   "\x08""notequal"
160   "\x02""AE"
161   "\x06""Oslash"
162   "\x08""infinity"
163   "\x09""plusminus"
164   "\x09""lessequal"
165   "\x0C""greaterequal"
166   "\x03""yen"
167   "\x03""mu1"
168   "\x0B""partialdiff"
169   "\x09""summation"
170   "\x07""product"
171   "\x02""pi"
172   "\x08""integral"
173   "\x0B""ordfeminine"
174   "\x0C""ordmasculine"
175   "\x03""Ohm"
176   "\x02""ae"
177   "\x06""oslash"
178   "\x0C""questiondown"
179   "\x0A""exclamdown"
180   "\x0A""logicalnot"
181   "\x07""radical"
182   "\x06""florin"
183   "\x0B""approxequal"
184   "\x09""increment"
185   "\x0D""guillemotleft"
186   "\x0E""guillemotright"
187   "\x08""ellipsis"
188   "\x07""nbspace"
189   "\x06""Agrave"
190   "\x06""Atilde"
191   "\x06""Otilde"
192   "\x02""OE"
193   "\x02""oe"
194   "\x06""endash"
195   "\x06""emdash"
196   "\x0C""quotedblleft"
197   "\x0D""quotedblright"
198   "\x09""quoteleft"
199   "\x0A""quoteright"
200   "\x06""divide"
201   "\x07""lozenge"
202   "\x09""ydieresis"
203   "\x09""Ydieresis"
204   "\x08""fraction"
205   "\x08""currency"
206   "\x0D""guilsinglleft"
207   "\x0E""guilsinglright"
208   "\x02""fi"
209   "\x02""fl"
210   "\x09""daggerdbl"
211   "\x0E""periodcentered"
212   "\x0E""quotesinglbase"
213   "\x0C""quotedblbase"
214   "\x0B""perthousand"
215   "\x0B""Acircumflex"
216   "\x0B""Ecircumflex"
217   "\x06""Aacute"
218   "\x09""Edieresis"
219   "\x06""Egrave"
220   "\x06""Iacute"
221   "\x0B""Icircumflex"
222   "\x09""Idieresis"
223   "\x06""Igrave"
224   "\x06""Oacute"
225   "\x0B""Ocircumflex"
226   "\x09""applelogo"
227   "\x06""Ograve"
228   "\x06""Uacute"
229   "\x0B""Ucircumflex"
230   "\x06""Ugrave"
231   "\x08""dotlessi"
232   "\x0A""circumflex"
233   "\x05""tilde"
234   "\x09""overscore"
235   "\x05""breve"
236   "\x09""dotaccent"
237   "\x04""ring"
238   "\x07""cedilla"
239   "\x0C""hungarumlaut"
240   "\x06""ogonek"
241   "\x05""caron"
242   "\x06""Lslash"
243   "\x06""lslash"
244   "\x06""Scaron"
245   "\x06""scaron"
246   "\x06""Zcaron"
247   "\x06""zcaron"
248   "\x09""brokenbar"
249   "\x03""Eth"
250   "\x03""eth"
251   "\x06""Yacute"
252   "\x06""yacute"
253   "\x05""Thorn"
254   "\x05""thorn"
255   "\x05""minus"
256   "\x08""multiply"
257   "\x0B""onesuperior"
258   "\x0B""twosuperior"
259   "\x0D""threesuperior"
260   "\x07""onehalf"
261   "\x0A""onequarter"
262   "\x0D""threequarters"
263   "\x05""franc"
264   "\x06""Gbreve"
265   "\x06""gbreve"
266   "\x04""Idot"
267   "\x08""Scedilla"
268   "\x08""scedilla"
269   "\x06""Cacute"
270   "\x06""cacute"
271   "\x06""Ccaron"
272   "\x06""ccaron"
273   "\x07""dmacron"
274 };
275
276 /*struct unicodeChar
277 {
278   int cNum;
279
280 };*/
281
282 unsigned char unicodeChars[] = {
283   "\x00\x20""space\0"
284   "\x00\x21""exclamation mark\0"
285   "\x00\x22""quotation mark\0"
286   "\x00\x23""number sign\0"
287
288 };
289
290 /*
291
292 0023    NUMBER SIGN
293         = pound sign, hash, crosshatch, octothorpe
294 0024    DOLLAR SIGN
295         = milreis, escudo
296         * glyph may have one or two vertical bars
297         * other currency symbol characters: 20A0-20AF
298         x (currency sign - 00A4)
299 0025    PERCENT SIGN
300         x (arabic percent sign - 066A)
301         x (per mille sign - 2030)
302         x (per ten thousand sign - 2031)
303 0026    AMPERSAND
304 0027    APOSTROPHE
305         = APOSTROPHE-QUOTE
306         = APL quote
307         * neutral (vertical) glyph having mixed usage
308         * preferred character for apostrophe is 2019
309         * preferred characters in English for paired quotation marks are 2018 & 2019
310         x (modifier letter prime - 02B9)
311         x (modifier letter apostrophe - 02BC)
312         x (modifier letter vertical line - 02C8)
313         x (combining acute accent - 0301)
314         x (prime - 2032)
315 0028    LEFT PARENTHESIS
316         = OPENING PARENTHESIS
317 0029    RIGHT PARENTHESIS
318         = CLOSING PARENTHESIS
319         * see discussion on semantics of paired bracketing characters
320 002A    ASTERISK
321         = star (on phone keypads)
322         x (arabic five pointed star - 066D)
323         x (asterisk operator - 2217)
324         x (heavy asterisk - 2731)
325 002B    PLUS SIGN
326 002C    COMMA
327         = decimal separator
328         x (arabic comma - 060C)
329         x (single low-9 quotation mark - 201A)
330         x (ideographic comma - 3001)
331 002D    HYPHEN-MINUS
332         = hyphen or minus sign
333         * used for either hyphen or minus sign
334         x (hyphen - 2010)
335         x (non-breaking hyphen - 2011)
336         x (figure dash - 2012)
337         x (en dash - 2013)
338         x (minus sign - 2212)
339 002E    FULL STOP
340         = PERIOD
341         = dot, decimal point
342         * may be rendered as a raised decimal point in old style numbers
343         x (arabic full stop - 06D4)
344         x (ideographic full stop - 3002)
345 002F    SOLIDUS
346         = SLASH
347         = virgule, shilling (British)
348         x (latin letter dental click - 01C0)
349         x (combining long solidus overlay - 0338)
350         x (fraction slash - 2044)
351         x (division slash - 2215)
352 0030    DIGIT ZERO
353 0031    DIGIT ONE
354 0032    DIGIT TWO
355 0033    DIGIT THREE
356 0034    DIGIT FOUR
357 0035    DIGIT FIVE
358 0036    DIGIT SIX
359 0037    DIGIT SEVEN
360 0038    DIGIT EIGHT
361 0039    DIGIT NINE
362 003A    COLON
363         x (armenian full stop - 0589)
364         x (hebrew punctuation sof pasuq - 05C3)
365         x (ratio - 2236)
366 003B    SEMICOLON
367         x (greek question mark - 037E)
368         x (arabic semicolon - 061B)
369 003C    LESS-THAN SIGN
370         x (single left-pointing angle quotation mark - 2039)
371         x (left-pointing angle bracket - 2329)
372         x (left angle bracket - 3008)
373 003D    EQUALS SIGN
374         * other related characters: 2241-2263
375         x (not equal to - 2260)
376         x (identical to - 2261)
377 003E    GREATER-THAN SIGN
378         x (single right-pointing angle quotation mark - 203A)
379         x (right-pointing angle bracket - 232A)
380         x (right angle bracket - 3009)
381 003F    QUESTION MARK
382         x (inverted question mark - 00BF)
383         x (greek question mark - 037E)
384         x (arabic question mark - 061F)
385         x (interrobang - 203D)
386         x (question exclamation mark - 2048)
387         x (exclamation question mark - 2049)
388 0040    COMMERCIAL AT
389 0041    LATIN CAPITAL LETTER A
390 0042    LATIN CAPITAL LETTER B
391         x (script capital b - 212C)
392 0043    LATIN CAPITAL LETTER C
393         x (double-struck capital c - 2102)
394         x (black-letter capital c - 212D)
395 0044    LATIN CAPITAL LETTER D
396 0045    LATIN CAPITAL LETTER E
397         x (euler constant - 2107)
398         x (script capital e - 2130)
399 0046    LATIN CAPITAL LETTER F
400         x (script capital f - 2131)
401         x (turned capital f - 2132)
402 0047    LATIN CAPITAL LETTER G
403 0048    LATIN CAPITAL LETTER H
404         x (script capital h - 210B)
405         x (black-letter capital h - 210C)
406         x (double-struck capital h - 210D)
407 0049    LATIN CAPITAL LETTER I
408         * Turkish and Azerbaijani use 0131 for lowercase
409         x (latin capital letter i with dot above - 0130)
410         x (cyrillic capital letter byelorussian-ukrainian i - 0406)
411         x (cyrillic letter palochka - 04C0)
412         x (script capital i - 2110)
413         x (black-letter capital i - 2111)
414         x (roman numeral one - 2160)
415 004A    LATIN CAPITAL LETTER J
416 004B    LATIN CAPITAL LETTER K
417         x (kelvin sign - 212A)
418 004C    LATIN CAPITAL LETTER L
419         x (script capital l - 2112)
420 004D    LATIN CAPITAL LETTER M
421         x (script capital m - 2133)
422 004E    LATIN CAPITAL LETTER N
423         x (double-struck capital n - 2115)
424 004F    LATIN CAPITAL LETTER O
425 0050    LATIN CAPITAL LETTER P
426         x (double-struck capital p - 2119)
427 0051    LATIN CAPITAL LETTER Q
428         x (double-struck capital q - 211A)
429 0052    LATIN CAPITAL LETTER R
430         x (script capital r - 211B)
431         x (black-letter capital r - 211C)
432         x (double-struck capital r - 211D)
433 0053    LATIN CAPITAL LETTER S
434 0054    LATIN CAPITAL LETTER T
435 0055    LATIN CAPITAL LETTER U
436 0056    LATIN CAPITAL LETTER V
437 0057    LATIN CAPITAL LETTER W
438 0058    LATIN CAPITAL LETTER X
439 0059    LATIN CAPITAL LETTER Y
440 005A    LATIN CAPITAL LETTER Z
441         x (double-struck capital z - 2124)
442         x (black-letter capital z - 2128)
443 005B    LEFT SQUARE BRACKET
444         = OPENING SQUARE BRACKET
445         * other bracket characters: 3008-301B
446 005C    REVERSE SOLIDUS
447         = BACKSLASH
448         x (set minus - 2216)
449 005D    RIGHT SQUARE BRACKET
450         = CLOSING SQUARE BRACKET
451 005E    CIRCUMFLEX ACCENT
452         * this is a spacing character
453         x (modifier letter up arrowhead - 02C4)
454         x (modifier letter circumflex accent - 02C6)
455         x (combining circumflex accent - 0302)
456         x (up arrowhead - 2303)
457 005F    LOW LINE
458         = SPACING UNDERSCORE
459         * this is a spacing character
460         x (modifier letter low macron - 02CD)
461         x (combining macron below - 0331)
462         x (combining low line - 0332)
463         x (double low line - 2017)
464 0060    GRAVE ACCENT
465         * this is a spacing character
466         x (modifier letter grave accent - 02CB)
467         x (combining grave accent - 0300)
468         x (reversed prime - 2035)
469 0061    LATIN SMALL LETTER A
470 0062    LATIN SMALL LETTER B
471 0063    LATIN SMALL LETTER C
472 0064    LATIN SMALL LETTER D
473 0065    LATIN SMALL LETTER E
474         x (estimated symbol - 212E)
475         x (script small e - 212F)
476 0066    LATIN SMALL LETTER F
477 0067    LATIN SMALL LETTER G
478         x (latin small letter script g - 0261)
479         x (script small g - 210A)
480 0068    LATIN SMALL LETTER H
481         x (cyrillic small letter shha - 04BB)
482         x (planck constant - 210E)
483 0069    LATIN SMALL LETTER I
484         * Turkish and Azerbaijani use 0130 for uppercase
485         x (latin small letter dotless i - 0131)
486 006A    LATIN SMALL LETTER J
487 006B    LATIN SMALL LETTER K
488 006C    LATIN SMALL LETTER L
489         x (script small l - 2113)
490 006D    LATIN SMALL LETTER M
491 006E    LATIN SMALL LETTER N
492         x (superscript latin small letter n - 207F)
493 006F    LATIN SMALL LETTER O
494         x (script small o - 2134)
495 0070    LATIN SMALL LETTER P
496 0071    LATIN SMALL LETTER Q
497 0072    LATIN SMALL LETTER R
498 0073    LATIN SMALL LETTER S
499 0074    LATIN SMALL LETTER T
500 0075    LATIN SMALL LETTER U
501 0076    LATIN SMALL LETTER V
502 0077    LATIN SMALL LETTER W
503 0078    LATIN SMALL LETTER X
504 0079    LATIN SMALL LETTER Y
505 007A    LATIN SMALL LETTER Z
506         x (latin small letter z with stroke - 01B6)
507 007B    LEFT CURLY BRACKET
508         = OPENING CURLY BRACKET
509         = opening brace
510 007C    VERTICAL LINE
511         = VERTICAL BAR
512         * used in pairs to indicate absolute value
513         x (latin letter dental click - 01C0)
514         x (hebrew punctuation paseq - 05C0)
515         x (divides - 2223)
516         x (light vertical bar - 2758)
517 007D    RIGHT CURLY BRACKET
518         = CLOSING CURLY BRACKET
519         = closing brace
520 007E    TILDE
521         * this is a spacing character
522         x (small tilde - 02DC)
523         x (combining tilde - 0303)
524         x (tilde operator - 223C)
525         x (fullwidth tilde - FF5E)
526 007F    <control>
527         = DELETE
528 @@      0080    C1 Controls and Latin-1 Supplement (Latin-1 Supplement) 00FF
529 @               C1 controls
530 @+              Alias names are those for ISO 6429.
531 0080    <control>
532 0081    <control>
533 0082    <control>
534         = BREAK PERMITTED HERE
535 0083    <control>
536         = NO BREAK HERE
537 0084    <control>
538 0085    <control>
539         = NEXT LINE
540 0086    <control>
541         = START OF SELECTED AREA
542 0087    <control>
543         = END OF SELECTED AREA
544 0088    <control>
545         = CHARACTER TABULATION SET
546 0089    <control>
547         = CHARACTER TABULATION WITH JUSTIFICATION
548 008A    <control>
549         = LINE TABULATION SET
550 008B    <control>
551         = PARTIAL LINE DOWN
552 008C    <control>
553         = PARTIAL LINE UP
554 008D    <control>
555         = REVERSE LINE FEED
556 008E    <control>
557         = SINGLE SHIFT TWO
558 008F    <control>
559         = SINGLE SHIFT THREE
560 0090    <control>
561         = DEVICE CONTROL STRING
562 0091    <control>
563         = PRIVATE USE ONE
564 0092    <control>
565         = PRIVATE USE TWO
566 0093    <control>
567         = SET TRANSMIT STATE
568 0094    <control>
569         = CANCEL CHARACTER
570 0095    <control>
571         = MESSAGE WAITING
572 0096    <control>
573         = START OF GUARDED AREA
574 0097    <control>
575         = END OF GUARDED AREA
576 0098    <control>
577         = START OF STRING
578 0099    <control>
579 009A    <control>
580         = SINGLE CHARACTER INTRODUCER
581 009B    <control>
582         = CONTROL SEQUENCE INTRODUCER
583 009C    <control>
584         = STRING TERMINATOR
585 009D    <control>
586         = OPERATING SYSTEM COMMAND
587 009E    <control>
588         = PRIVACY MESSAGE
589 009F    <control>
590         = APPLICATION PROGRAM COMMAND
591 @               ISO 8859-1 (aka Latin-1)
592 00A0    NO-BREAK SPACE
593         x (space - 0020)
594         x (figure space - 2007)
595         x (narrow no-break space - 202F)
596         x (zero width no-break space - FEFF)
597         # <noBreak> 0020
598 00A1    INVERTED EXCLAMATION MARK
599         * Spanish, Asturian, Galician
600         x (exclamation mark - 0021)
601 00A2    CENT SIGN
602 00A3    POUND SIGN
603         = pound sterling, Irish punt
604         x (lira sign - 20A4)
605 00A4    CURRENCY SIGN
606         = Filzlaus, Ricardi-Sonne (German names)
607         * other currency symbol characters: 20A0-20AF
608         x (dollar sign - 0024)
609 00A5    YEN SIGN
610         = yuan sign
611         * glyph may have one or two crossbars
612 00A6    BROKEN BAR
613         = BROKEN VERTICAL BAR
614         = parted rule (in typography)
615 00A7    SECTION SIGN
616         * paragraph sign in some European usage
617 00A8    DIAERESIS
618         * this is a spacing character
619         x (combining diaeresis - 0308)
620         # 0020 0308
621 00A9    COPYRIGHT SIGN
622         x (sound recording copyright - 2117)
623 00AA    FEMININE ORDINAL INDICATOR
624         * Spanish
625         # <super> 0061
626 00AB    LEFT-POINTING DOUBLE ANGLE QUOTATION MARK *
627         = LEFT POINTING GUILLEMET
628         = chevrons (in typography)
629         * usually opening, sometimes closing
630         x (much less-than - 226A)
631         x (left double angle bracket - 300A)
632 00AC    NOT SIGN
633         = angled dash (in typography)
634         x (reversed not sign - 2310)
635 00AD    SOFT HYPHEN
636         = discretionary hyphen
637         x (mongolian todo soft hyphen - 1806)
638 00AE    REGISTERED SIGN
639         = REGISTERED TRADE MARK SIGN
640 00AF    MACRON
641         = overline, APL overbar
642         * this is a spacing character
643         x (modifier letter macron - 02C9)
644         x (combining macron - 0304)
645         x (combining overline - 0305)
646         # 0020 0304
647 00B0    DEGREE SIGN
648         * this is a spacing character
649         x (ring above - 02DA)
650         x (combining ring above - 030A)
651         x (superscript zero - 2070)
652         x (ring operator - 2218)
653 00B1    PLUS-MINUS SIGN
654         x (minus-or-plus sign - 2213)
655 00B2    SUPERSCRIPT TWO
656         = squared
657         * other superscript digit characters: 2070-2079
658         x (superscript one - 00B9)
659         # <super> 0032
660 00B3    SUPERSCRIPT THREE
661         = cubed
662         x (superscript one - 00B9)
663         # <super> 0033
664 00B4    ACUTE ACCENT
665         * this is a spacing character
666         x (modifier letter prime - 02B9)
667         x (modifier letter acute accent - 02CA)
668         x (combining acute accent - 0301)
669         x (prime - 2032)
670         # 0020 0301
671 00B5    MICRO SIGN
672         # 03BC greek small letter mu
673 00B6    PILCROW SIGN
674         = PARAGRAPH SIGN
675         * section sign in some European usage
676         x (reversed pilcrow sign - 204B)
677         x (curved stem paragraph sign ornament - 2761)
678 00B7    MIDDLE DOT
679         = midpoint (in typography)
680         = Georgian comma
681         = Greek middle dot
682         x (bullet - 2022)
683         x (one dot leader - 2024)
684         x (hyphenation point - 2027)
685         x (bullet operator - 2219)
686         x (dot operator - 22C5)
687         x (katakana middle dot - 30FB)
688 00B8    CEDILLA
689         * this is a spacing character
690         * other spacing accent characters: 02D8-02DB
691         x (combining cedilla - 0327)
692         # 0020 0327
693 00B9    SUPERSCRIPT ONE
694         x (superscript two - 00B2)
695         x (superscript three - 00B3)
696         # <super> 0031
697 00BA    MASCULINE ORDINAL INDICATOR
698         * Spanish
699         # <super> 006F
700 00BB    RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK *
701         = RIGHT POINTING GUILLEMET
702         * usually closing, sometimes opening
703         x (much greater-than - 226B)
704         x (right double angle bracket - 300B)
705 00BC    VULGAR FRACTION ONE QUARTER
706         * bar may be horizontal or slanted
707         * other fraction characters: 2153-215E
708         # 0031 2044 0034
709 00BD    VULGAR FRACTION ONE HALF
710         * bar may be horizontal or slanted
711         # 0031 2044 0032
712 00BE    VULGAR FRACTION THREE QUARTERS
713         * bar may be horizontal or slanted
714         # 0033 2044 0034
715 00BF    INVERTED QUESTION MARK
716         = turned question mark
717         * Spanish
718         x (question mark - 003F)
719 00C0    LATIN CAPITAL LETTER A WITH GRAVE
720         : 0041 0300
721 00C1    LATIN CAPITAL LETTER A WITH ACUTE
722         : 0041 0301
723 00C2    LATIN CAPITAL LETTER A WITH CIRCUMFLEX
724         : 0041 0302
725 00C3    LATIN CAPITAL LETTER A WITH TILDE
726         : 0041 0303
727 00C4    LATIN CAPITAL LETTER A WITH DIAERESIS
728         : 0041 0308
729 00C5    LATIN CAPITAL LETTER A WITH RING ABOVE
730         x (angstrom sign - 212B)
731         : 0041 030A
732 00C6    LATIN CAPITAL LETTER AE (ash) *
733         = LATIN CAPITAL LIGATURE AE
734 00C7    LATIN CAPITAL LETTER C WITH CEDILLA
735         : 0043 0327
736 00C8    LATIN CAPITAL LETTER E WITH GRAVE
737         : 0045 0300
738 00C9    LATIN CAPITAL LETTER E WITH ACUTE
739         : 0045 0301
740 00CA    LATIN CAPITAL LETTER E WITH CIRCUMFLEX
741         : 0045 0302
742 00CB    LATIN CAPITAL LETTER E WITH DIAERESIS
743         : 0045 0308
744 00CC    LATIN CAPITAL LETTER I WITH GRAVE
745         : 0049 0300
746 00CD    LATIN CAPITAL LETTER I WITH ACUTE
747         : 0049 0301
748 00CE    LATIN CAPITAL LETTER I WITH CIRCUMFLEX
749         : 0049 0302
750 00CF    LATIN CAPITAL LETTER I WITH DIAERESIS
751         : 0049 0308
752 00D0    LATIN CAPITAL LETTER ETH (Icelandic)
753         x (latin small letter eth - 00F0)
754         x (latin capital letter d with stroke - 0110)
755         x (latin capital letter african d - 0189)
756 00D1    LATIN CAPITAL LETTER N WITH TILDE
757         : 004E 0303
758 00D2    LATIN CAPITAL LETTER O WITH GRAVE
759         : 004F 0300
760 00D3    LATIN CAPITAL LETTER O WITH ACUTE
761         : 004F 0301
762 00D4    LATIN CAPITAL LETTER O WITH CIRCUMFLEX
763         : 004F 0302
764 00D5    LATIN CAPITAL LETTER O WITH TILDE
765         : 004F 0303
766 00D6    LATIN CAPITAL LETTER O WITH DIAERESIS
767         : 004F 0308
768 00D7    MULTIPLICATION SIGN
769         = z notation Cartesian product
770 00D8    LATIN CAPITAL LETTER O WITH STROKE
771         = LATIN CAPITAL LETTER O SLASH
772         x (empty set - 2205)
773 00D9    LATIN CAPITAL LETTER U WITH GRAVE
774         : 0055 0300
775 00DA    LATIN CAPITAL LETTER U WITH ACUTE
776         : 0055 0301
777 00DB    LATIN CAPITAL LETTER U WITH CIRCUMFLEX
778         : 0055 0302
779 00DC    LATIN CAPITAL LETTER U WITH DIAERESIS
780         : 0055 0308
781 00DD    LATIN CAPITAL LETTER Y WITH ACUTE
782         : 0059 0301
783 00DE    LATIN CAPITAL LETTER THORN (Icelandic)
784 00DF    LATIN SMALL LETTER SHARP S (German)
785         = Eszett
786         * German
787         * uppercase is "SS"
788         * in origin a ligature of 017F and 0073
789         x (greek small letter beta - 03B2)
790 00E0    LATIN SMALL LETTER A WITH GRAVE
791         : 0061 0300
792 00E1    LATIN SMALL LETTER A WITH ACUTE
793         : 0061 0301
794 00E2    LATIN SMALL LETTER A WITH CIRCUMFLEX
795         : 0061 0302
796 00E3    LATIN SMALL LETTER A WITH TILDE
797         * Portuguese
798         : 0061 0303
799 00E4    LATIN SMALL LETTER A WITH DIAERESIS
800         : 0061 0308
801 00E5    LATIN SMALL LETTER A WITH RING ABOVE
802         * Danish, Norwegian, Swedish, Walloon
803         : 0061 030A
804 00E6    LATIN SMALL LETTER AE (ash) *
805         = LATIN SMALL LIGATURE AE
806         = ash (from Old English ï¿½sc)
807         * Danish, Norwegian, Icelandic, Faroese, Old English, French, IPA
808         x (latin small ligature oe - 0153)
809         x (cyrillic small ligature a ie - 04D5)
810 00E7    LATIN SMALL LETTER C WITH CEDILLA
811         : 0063 0327
812 00E8    LATIN SMALL LETTER E WITH GRAVE
813         : 0065 0300
814 00E9    LATIN SMALL LETTER E WITH ACUTE
815         : 0065 0301
816 00EA    LATIN SMALL LETTER E WITH CIRCUMFLEX
817         : 0065 0302
818 00EB    LATIN SMALL LETTER E WITH DIAERESIS
819         : 0065 0308
820 00EC    LATIN SMALL LETTER I WITH GRAVE
821         * Italian, Malagasy
822         : 0069 0300
823 00ED    LATIN SMALL LETTER I WITH ACUTE
824         : 0069 0301
825 00EE    LATIN SMALL LETTER I WITH CIRCUMFLEX
826         : 0069 0302
827 00EF    LATIN SMALL LETTER I WITH DIAERESIS
828         : 0069 0308
829 00F0    LATIN SMALL LETTER ETH (Icelandic)
830         * Icelandic, Faroese, Old English, IPA
831         x (latin capital letter eth - 00D0)
832         x (greek small letter delta - 03B4)
833         x (partial differential - 2202)
834 00F1    LATIN SMALL LETTER N WITH TILDE
835         : 006E 0303
836 00F2    LATIN SMALL LETTER O WITH GRAVE
837         : 006F 0300
838 00F3    LATIN SMALL LETTER O WITH ACUTE
839         : 006F 0301
840 00F4    LATIN SMALL LETTER O WITH CIRCUMFLEX
841         : 006F 0302
842 00F5    LATIN SMALL LETTER O WITH TILDE
843         * Portuguese, Estonian
844         : 006F 0303
845 00F6    LATIN SMALL LETTER O WITH DIAERESIS
846         : 006F 0308
847 00F7    DIVISION SIGN
848 00F8    LATIN SMALL LETTER O WITH STROKE
849         = LATIN SMALL LETTER O SLASH
850         * Danish, Norwegian, Faroese, IPA
851 00F9    LATIN SMALL LETTER U WITH GRAVE
852         * French, Italian
853         : 0075 0300
854 00FA    LATIN SMALL LETTER U WITH ACUTE
855         : 0075 0301
856 00FB    LATIN SMALL LETTER U WITH CIRCUMFLEX
857         : 0075 0302
858 00FC    LATIN SMALL LETTER U WITH DIAERESIS
859         : 0075 0308
860 00FD    LATIN SMALL LETTER Y WITH ACUTE
861         * Czech, Slovak, Icelandic, Faroese, Welsh, Malagasy
862         : 0079 0301
863 00FE    LATIN SMALL LETTER THORN (Icelandic)
864         * Icelandic, Old English, phonetics
865         * Runic letter borrowed into Latin script
866         x (runic letter thurisaz thurs thorn - 16A6)
867 00FF    LATIN SMALL LETTER Y WITH DIAERESIS
868         * French
869         x (latin capital letter y with diaeresis - 0178)
870         : 0079 0308
871 @@      0100    Latin Extended-A        017F
872 @               European Latin
873 0100    LATIN CAPITAL LETTER A WITH MACRON
874         : 0041 0304
875 0101    LATIN SMALL LETTER A WITH MACRON
876         * Latvian, Latin, ...
877         : 0061 0304
878 0102    LATIN CAPITAL LETTER A WITH BREVE
879         : 0041 0306
880 0103    LATIN SMALL LETTER A WITH BREVE
881         * Romanian, Vietnamese, Latin, ...
882         : 0061 0306
883 0104    LATIN CAPITAL LETTER A WITH OGONEK
884         : 0041 0328
885 0105    LATIN SMALL LETTER A WITH OGONEK
886         * Polish, Lithuanian, ...
887         : 0061 0328
888 0106    LATIN CAPITAL LETTER C WITH ACUTE
889         : 0043 0301
890 0107    LATIN SMALL LETTER C WITH ACUTE
891         * Polish, Croatian, ...
892         x (cyrillic small letter tshe - 045B)
893         : 0063 0301
894 0108    LATIN CAPITAL LETTER C WITH CIRCUMFLEX
895         : 0043 0302
896 0109    LATIN SMALL LETTER C WITH CIRCUMFLEX
897         * Esperanto
898         : 0063 0302
899 010A    LATIN CAPITAL LETTER C WITH DOT ABOVE
900         : 0043 0307
901 010B    LATIN SMALL LETTER C WITH DOT ABOVE
902         * Maltese, Irish Gaelic (old orthography)
903         : 0063 0307
904 010C    LATIN CAPITAL LETTER C WITH CARON
905         : 0043 030C
906 010D    LATIN SMALL LETTER C WITH CARON
907         * Czech, Slovak, Slovenian, and many other languages
908         : 0063 030C
909 010E    LATIN CAPITAL LETTER D WITH CARON
910         * the form using caron/hacek is preferred in all contexts
911         : 0044 030C
912 010F    LATIN SMALL LETTER D WITH CARON
913         * Czech, Slovak
914         * the form using apostrophe is preferred in typesetting
915         : 0064 030C
916 0110    LATIN CAPITAL LETTER D WITH STROKE
917         x (latin capital letter eth - 00D0)
918         x (latin small letter d with stroke - 0111)
919         x (latin capital letter african d - 0189)
920 0111    LATIN SMALL LETTER D WITH STROKE
921         * Croatian, Vietnamese, S�mi
922         x (latin capital letter d with stroke - 0110)
923         x (cyrillic small letter dje - 0452)
924 0112    LATIN CAPITAL LETTER E WITH MACRON
925         : 0045 0304
926 0113    LATIN SMALL LETTER E WITH MACRON
927         * Latvian, Latin, ...
928         : 0065 0304
929 0114    LATIN CAPITAL LETTER E WITH BREVE
930         : 0045 0306
931 0115    LATIN SMALL LETTER E WITH BREVE
932         * Malay, Latin, ...
933         : 0065 0306
934 0116    LATIN CAPITAL LETTER E WITH DOT ABOVE
935         : 0045 0307
936 0117    LATIN SMALL LETTER E WITH DOT ABOVE
937         * Lithuanian
938         : 0065 0307
939 0118    LATIN CAPITAL LETTER E WITH OGONEK
940         : 0045 0328
941 0119    LATIN SMALL LETTER E WITH OGONEK
942         * Polish, Lithuanian, ...
943         : 0065 0328
944 011A    LATIN CAPITAL LETTER E WITH CARON
945         : 0045 030C
946 011B    LATIN SMALL LETTER E WITH CARON
947         * Czech, ...
948         : 0065 030C
949 011C    LATIN CAPITAL LETTER G WITH CIRCUMFLEX
950         : 0047 0302
951 011D    LATIN SMALL LETTER G WITH CIRCUMFLEX
952         * Esperanto
953         : 0067 0302
954 011E    LATIN CAPITAL LETTER G WITH BREVE
955         : 0047 0306
956 011F    LATIN SMALL LETTER G WITH BREVE
957         * Turkish, Azerbaijani
958         x (latin small letter g with caron - 01E7)
959         : 0067 0306
960 0120    LATIN CAPITAL LETTER G WITH DOT ABOVE
961         : 0047 0307
962 0121    LATIN SMALL LETTER G WITH DOT ABOVE
963         * Maltese, Irish Gaelic (old orthography)
964         : 0067 0307
965 0122    LATIN CAPITAL LETTER G WITH CEDILLA
966         : 0047 0327
967 0123    LATIN SMALL LETTER G WITH CEDILLA
968         * Latvian
969         * there are three major glyph variants
970         : 0067 0327
971 0124    LATIN CAPITAL LETTER H WITH CIRCUMFLEX
972         : 0048 0302
973 0125    LATIN SMALL LETTER H WITH CIRCUMFLEX
974         * Esperanto
975         : 0068 0302
976 0126    LATIN CAPITAL LETTER H WITH STROKE
977 0127    LATIN SMALL LETTER H WITH STROKE
978         * Maltese, IPA, ...
979         x (cyrillic small letter tshe - 045B)
980         x (planck constant over two pi - 210F)
981 0128    LATIN CAPITAL LETTER I WITH TILDE
982         : 0049 0303
983 0129    LATIN SMALL LETTER I WITH TILDE
984         * Greenlandic (old orthography)
985         : 0069 0303
986 012A    LATIN CAPITAL LETTER I WITH MACRON
987         : 0049 0304
988 012B    LATIN SMALL LETTER I WITH MACRON
989         * Latvian, Latin, ...
990         : 0069 0304
991 012C    LATIN CAPITAL LETTER I WITH BREVE
992         : 0049 0306
993 012D    LATIN SMALL LETTER I WITH BREVE
994         * Latin, ...
995         : 0069 0306
996 012E    LATIN CAPITAL LETTER I WITH OGONEK
997         : 0049 0328
998 012F    LATIN SMALL LETTER I WITH OGONEK
999         * Lithuanian, ...
1000         : 0069 0328
1001 0130    LATIN CAPITAL LETTER I WITH DOT ABOVE
1002         = LATIN CAPITAL LETTER I DOT
1003         * Turkish, Azerbaijani
1004         * lowercase is 0069
1005         x (latin capital letter i - 0049)
1006         : 0049 0307
1007 0131    LATIN SMALL LETTER DOTLESS I
1008         * Turkish, Azerbaijani
1009         * uppercase is 0049
1010         x (latin small letter i - 0069)
1011 0132    LATIN CAPITAL LIGATURE IJ
1012         # 0049 004A
1013 0133    LATIN SMALL LIGATURE IJ
1014         * Dutch
1015         # 0069 006A
1016 0134    LATIN CAPITAL LETTER J WITH CIRCUMFLEX
1017         : 004A 0302
1018 0135    LATIN SMALL LETTER J WITH CIRCUMFLEX
1019         * Esperanto
1020         : 006A 0302
1021 0136    LATIN CAPITAL LETTER K WITH CEDILLA
1022         : 004B 0327
1023 0137    LATIN SMALL LETTER K WITH CEDILLA
1024         * Latvian
1025         : 006B 0327
1026 0138    LATIN SMALL LETTER KRA (Greenlandic)
1027         * Greenlandic (old orthography)
1028 0139    LATIN CAPITAL LETTER L WITH ACUTE
1029         : 004C 0301
1030 013A    LATIN SMALL LETTER L WITH ACUTE
1031         * Slovak
1032         : 006C 0301
1033 013B    LATIN CAPITAL LETTER L WITH CEDILLA
1034         : 004C 0327
1035 013C    LATIN SMALL LETTER L WITH CEDILLA
1036         * Latvian
1037         : 006C 0327
1038 013D    LATIN CAPITAL LETTER L WITH CARON
1039         : 004C 030C
1040 013E    LATIN SMALL LETTER L WITH CARON
1041         * Slovak
1042         * the form using apostrophe is preferred in typesetting
1043         : 006C 030C
1044 013F    LATIN CAPITAL LETTER L WITH MIDDLE DOT
1045         * some fonts show the middle dot inside the L, but the preferred form has the dot following the L
1046         # 004C 00B7
1047 0140    LATIN SMALL LETTER L WITH MIDDLE DOT
1048         * Catalan
1049         # 006C 00B7
1050 0141    LATIN CAPITAL LETTER L WITH STROKE
1051 0142    LATIN SMALL LETTER L WITH STROKE
1052         * Polish, ...
1053         x (latin small letter l with bar - 019A)
1054 0143    LATIN CAPITAL LETTER N WITH ACUTE
1055         : 004E 0301
1056 0144    LATIN SMALL LETTER N WITH ACUTE
1057         * Polish, ...
1058         : 006E 0301
1059 0145    LATIN CAPITAL LETTER N WITH CEDILLA
1060         : 004E 0327
1061 0146    LATIN SMALL LETTER N WITH CEDILLA
1062         * Latvian
1063         : 006E 0327
1064 0147    LATIN CAPITAL LETTER N WITH CARON
1065         : 004E 030C
1066 0148    LATIN SMALL LETTER N WITH CARON
1067         * Czech, Slovak
1068         : 006E 030C
1069 0149    LATIN SMALL LETTER N PRECEDED BY APOSTROPHE
1070         = LATIN SMALL LETTER APOSTROPHE N
1071         * Afrikaans
1072         * this is not actually a single letter
1073         # 02BC 006E
1074 014A    LATIN CAPITAL LETTER ENG (Sami)
1075         * glyph may also have appearance of large form of the small letter
1076 014B    LATIN SMALL LETTER ENG (Sami)
1077         * S�mi, Mende, IPA, ...
1078 014C    LATIN CAPITAL LETTER O WITH MACRON
1079         : 004F 0304
1080 014D    LATIN SMALL LETTER O WITH MACRON
1081         * Latvian, Latin, ...
1082         : 006F 0304
1083 014E    LATIN CAPITAL LETTER O WITH BREVE
1084         : 004F 0306
1085 014F    LATIN SMALL LETTER O WITH BREVE
1086         * Latin
1087         : 006F 0306
1088 0150    LATIN CAPITAL LETTER O WITH DOUBLE ACUTE
1089         : 004F 030B
1090 0151    LATIN SMALL LETTER O WITH DOUBLE ACUTE
1091         * Hungarian
1092         : 006F 030B
1093 0152    LATIN CAPITAL LIGATURE OE
1094 0153    LATIN SMALL LIGATURE OE
1095         = LATIN SMALL LETTER O E
1096         = ethel (from Old English e�el)
1097         * French, IPA, Old Icelandic, Old English, ...
1098         x (latin small letter ae - 00E6)
1099         x (latin letter small capital oe - 0276)
1100 0154    LATIN CAPITAL LETTER R WITH ACUTE
1101         : 0052 0301
1102 0155    LATIN SMALL LETTER R WITH ACUTE
1103         * Slovak, ...
1104         : 0072 0301
1105 0156    LATIN CAPITAL LETTER R WITH CEDILLA
1106         : 0052 0327
1107 0157    LATIN SMALL LETTER R WITH CEDILLA
1108         * Latvian
1109         : 0072 0327
1110 0158    LATIN CAPITAL LETTER R WITH CARON
1111         : 0052 030C
1112 0159    LATIN SMALL LETTER R WITH CARON
1113         * Czech, ...
1114         : 0072 030C
1115 015A    LATIN CAPITAL LETTER S WITH ACUTE
1116         : 0053 0301
1117 015B    LATIN SMALL LETTER S WITH ACUTE
1118         * Polish, Indic transliteration, ...
1119         : 0073 0301
1120 015C    LATIN CAPITAL LETTER S WITH CIRCUMFLEX
1121         : 0053 0302
1122 015D    LATIN SMALL LETTER S WITH CIRCUMFLEX
1123         * Esperanto
1124         : 0073 0302
1125 015E    LATIN CAPITAL LETTER S WITH CEDILLA *
1126         : 0053 0327
1127 015F    LATIN SMALL LETTER S WITH CEDILLA *
1128         * Turkish, Azerbaijani, Romanian, ...
1129         * this character is used in both Turkish and Romanian data
1130         * a glyph variant with comma below is preferred for Romanian
1131         x (latin small letter s with comma below - 0219)
1132         : 0073 0327
1133 0160    LATIN CAPITAL LETTER S WITH CARON
1134         : 0053 030C
1135 0161    LATIN SMALL LETTER S WITH CARON
1136         * Czech, Estonian, Finnish, Slovak, and many other languages
1137         : 0073 030C
1138 0162    LATIN CAPITAL LETTER T WITH CEDILLA *
1139         : 0054 0327
1140 0163    LATIN SMALL LETTER T WITH CEDILLA *
1141         * Romanian, Semitic transliteration, ...
1142         * this character is used in Romanian data
1143         * a glyph variant with comma below is preferred for Romanian
1144         x (latin small letter t with comma below - 021B)
1145         : 0074 0327
1146 0164    LATIN CAPITAL LETTER T WITH CARON
1147         * the form using caron/hacek is preferred in all contexts
1148         : 0054 030C
1149 0165    LATIN SMALL LETTER T WITH CARON
1150         * Czech, Slovak
1151         * the form using apostrophe is preferred in typesetting
1152         : 0074 030C
1153 0166    LATIN CAPITAL LETTER T WITH STROKE
1154 0167    LATIN SMALL LETTER T WITH STROKE
1155         * S�mi
1156 0168    LATIN CAPITAL LETTER U WITH TILDE
1157         : 0055 0303
1158 0169    LATIN SMALL LETTER U WITH TILDE
1159         * Greenlandic (old orthography)
1160         : 0075 0303
1161 016A    LATIN CAPITAL LETTER U WITH MACRON
1162         : 0055 0304
1163 016B    LATIN SMALL LETTER U WITH MACRON
1164         * Latvian, Lithuanian, Latin, ...
1165         : 0075 0304
1166 016C    LATIN CAPITAL LETTER U WITH BREVE
1167         : 0055 0306
1168 016D    LATIN SMALL LETTER U WITH BREVE
1169         * Latin, Esperanto, ...
1170         : 0075 0306
1171 016E    LATIN CAPITAL LETTER U WITH RING ABOVE
1172         : 0055 030A
1173 016F    LATIN SMALL LETTER U WITH RING ABOVE
1174         * Czech, ...
1175         : 0075 030A
1176 0170    LATIN CAPITAL LETTER U WITH DOUBLE ACUTE
1177         : 0055 030B
1178 0171    LATIN SMALL LETTER U WITH DOUBLE ACUTE
1179         * Hungarian
1180         : 0075 030B
1181 0172    LATIN CAPITAL LETTER U WITH OGONEK
1182         : 0055 0328
1183 0173    LATIN SMALL LETTER U WITH OGONEK
1184         * Lithuanian
1185         : 0075 0328
1186 0174    LATIN CAPITAL LETTER W WITH CIRCUMFLEX
1187         : 0057 0302
1188 0175    LATIN SMALL LETTER W WITH CIRCUMFLEX
1189         * Welsh
1190         : 0077 0302
1191 0176    LATIN CAPITAL LETTER Y WITH CIRCUMFLEX
1192         : 0059 0302
1193 0177    LATIN SMALL LETTER Y WITH CIRCUMFLEX
1194         * Welsh
1195         : 0079 0302
1196 0178    LATIN CAPITAL LETTER Y WITH DIAERESIS
1197         * French, Igbo
1198         x (latin small letter y with diaeresis - 00FF)
1199         : 0059 0308
1200 0179    LATIN CAPITAL LETTER Z WITH ACUTE
1201         : 005A 0301
1202 017A    LATIN SMALL LETTER Z WITH ACUTE
1203         * Polish, ...
1204         : 007A 0301
1205 017B    LATIN CAPITAL LETTER Z WITH DOT ABOVE
1206         : 005A 0307
1207 017C    LATIN SMALL LETTER Z WITH DOT ABOVE
1208         * Polish, ...
1209         : 007A 0307
1210 017D    LATIN CAPITAL LETTER Z WITH CARON
1211         : 005A 030C
1212 017E    LATIN SMALL LETTER Z WITH CARON
1213         * Czech, Estonian, Finnish, Slovak, Slovenian, and many other languages
1214         : 007A 030C
1215 017F    LATIN SMALL LETTER LONG S
1216         * in common use in Roman types until the 18th century
1217         * in current use in Fraktur and Gaelic types
1218         # 0073 latin small letter s
1219 @@      0180    Latin Extended-B        024F
1220 @               Latin extended-B
1221 0180    LATIN SMALL LETTER B WITH STROKE
1222         * Americanist and Indo-Europeanist usage for phonetic beta
1223         * Old Saxon
1224         x (greek small letter beta - 03B2)
1225         x (blank symbol - 2422)
1226 0181    LATIN CAPITAL LETTER B WITH HOOK
1227         * Zulu, Pan-Nigerian alphabet
1228         x (latin small letter b with hook - 0253)
1229 0182    LATIN CAPITAL LETTER B WITH TOPBAR
1230 0183    LATIN SMALL LETTER B WITH TOPBAR
1231         * Zhuang
1232         * former Soviet minority language scripts
1233         x (cyrillic capital letter be - 0411)
1234 0184    LATIN CAPITAL LETTER TONE SIX
1235 0185    LATIN SMALL LETTER TONE SIX
1236         * Zhuang
1237         * Zhuang tone three is Cyrillic ze
1238         * Zhuang tone four is Cyrillic che
1239         x (latin small letter tone two - 01A8)
1240         x (latin small letter tone five - 01BD)
1241         x (cyrillic small letter ze - 0437)
1242         x (cyrillic small letter che - 0447)
1243         x (cyrillic small letter soft sign - 044C)
1244 0186    LATIN CAPITAL LETTER OPEN O
1245         * typographically a turned C
1246         x (latin small letter open o - 0254)
1247 0187    LATIN CAPITAL LETTER C WITH HOOK
1248 0188    LATIN SMALL LETTER C WITH HOOK
1249         * African
1250 0189    LATIN CAPITAL LETTER AFRICAN D *
1251         * Ewe
1252         x (latin capital letter eth - 00D0)
1253         x (latin capital letter d with stroke - 0110)
1254         x (latin small letter d with tail - 0256)
1255 018A    LATIN CAPITAL LETTER D WITH HOOK
1256         * Pan-Nigerian alphabet
1257         x (latin small letter d with hook - 0257)
1258 018B    LATIN CAPITAL LETTER D WITH TOPBAR
1259 018C    LATIN SMALL LETTER D WITH TOPBAR
1260         * former-Soviet minority language scripts
1261 018D    LATIN SMALL LETTER TURNED DELTA
1262         * archaic phonetic for labialized dental fricative
1263         * recommended spellings 007A 02B7 or 007A 032B
1264 018E    LATIN CAPITAL LETTER REVERSED E
1265         = LATIN CAPITAL LETTER TURNED E
1266         * Pan-Nigerian alphabet
1267         * lowercase is 01DD
1268 018F    LATIN CAPITAL LETTER SCHWA
1269         * Azerbaijani, ...
1270         x (latin small letter schwa - 0259)
1271         x (cyrillic capital letter schwa - 04D8)
1272 0190    LATIN CAPITAL LETTER OPEN E
1273         = LATIN CAPITAL LETTER EPSILON
1274         * African
1275         x (latin small letter open e - 025B)
1276         x (euler constant - 2107)
1277 0191    LATIN CAPITAL LETTER F WITH HOOK
1278         * African
1279 0192    LATIN SMALL LETTER F WITH HOOK
1280         = LATIN SMALL LETTER SCRIPT F
1281         = Florin currency symbol (Netherlands)
1282         = function symbol
1283         = abbreviation convention for folder
1284 0193    LATIN CAPITAL LETTER G WITH HOOK
1285         * African
1286         x (latin small letter g with hook - 0260)
1287 0194    LATIN CAPITAL LETTER GAMMA
1288         * African
1289         x (latin small letter gamma - 0263)
1290 0195    LATIN SMALL LETTER HV (hwair)
1291         * Gothic transliteration
1292         * uppercase is 01F6
1293 0196    LATIN CAPITAL LETTER IOTA
1294         * African
1295         x (latin small letter iota - 0269)
1296 0197    LATIN CAPITAL LETTER I WITH STROKE
1297         = barred i, i bar
1298         * African
1299         * ISO 6438 gives lowercase as 026A, not 0268
1300         x (latin letter small capital i - 026A)
1301 0198    LATIN CAPITAL LETTER K WITH HOOK
1302 0199    LATIN SMALL LETTER K WITH HOOK
1303         * Hausa, Pan-Nigerian alphabet
1304 019A    LATIN SMALL LETTER L WITH BAR
1305         = barred l
1306         * Americanist phonetic usage for 026C
1307         x (latin small letter l with stroke - 0142)
1308 019B    LATIN SMALL LETTER LAMBDA WITH STROKE
1309         = barred lambda, lambda bar
1310         * Americanist phonetic usage
1311 019C    LATIN CAPITAL LETTER TURNED M
1312         * Zhuang
1313         x (latin small letter turned m - 026F)
1314 019D    LATIN CAPITAL LETTER N WITH LEFT HOOK
1315         * African
1316         x (latin small letter n with left hook - 0272)
1317 019E    LATIN SMALL LETTER N WITH LONG RIGHT LEG
1318         * archaic phonetic for Japanese syllabic "n"
1319         * recommended spelling 006E 0329
1320 019F    LATIN CAPITAL LETTER O WITH MIDDLE TILDE *
1321         = barred o, o bar
1322         * lowercase is 0275
1323         * African
1324         x (cyrillic capital letter barred o - 04E8)
1325 01A0    LATIN CAPITAL LETTER O WITH HORN
1326         : 004F 031B
1327 01A1    LATIN SMALL LETTER O WITH HORN
1328         * Vietnamese
1329         : 006F 031B
1330 01A2    LATIN CAPITAL LETTER OI (gha)
1331 01A3    LATIN SMALL LETTER OI (gha)
1332         = gha
1333         * Pan-Turkic Latin alphabets
1334 01A4    LATIN CAPITAL LETTER P WITH HOOK
1335 01A5    LATIN SMALL LETTER P WITH HOOK
1336         * African
1337 01A6    LATIN LETTER YR *
1338         * old Norse
1339         * from German Standard DIN 31624 and ISO 5246-2
1340         * lowercase is 0280
1341 01A7    LATIN CAPITAL LETTER TONE TWO
1342 01A8    LATIN SMALL LETTER TONE TWO
1343         * Zhuang
1344         * typographically a reversed S
1345         x (latin small letter tone six - 0185)
1346 01A9    LATIN CAPITAL LETTER ESH
1347         * African
1348         x (latin small letter esh - 0283)
1349         x (greek capital letter sigma - 03A3)
1350 01AA    LATIN LETTER REVERSED ESH LOOP
1351         * archaic phonetic for labialized palatoalveolar or palatal fricative
1352         * Twi
1353         * recommended spellings 0283 02B7, 00E7 02B7, 0068 0265, etc.
1354 01AB    LATIN SMALL LETTER T WITH PALATAL HOOK
1355         * archaic phonetic for palatalized alveolar or dental stop
1356         * recommended spelling 0074 02B2
1357 01AC    LATIN CAPITAL LETTER T WITH HOOK
1358 01AD    LATIN SMALL LETTER T WITH HOOK
1359         * African
1360 01AE    LATIN CAPITAL LETTER T WITH RETROFLEX HOOK
1361         * African
1362         x (latin small letter t with retroflex hook - 0288)
1363 01AF    LATIN CAPITAL LETTER U WITH HORN
1364         : 0055 031B
1365 01B0    LATIN SMALL LETTER U WITH HORN
1366         * Vietnamese
1367         : 0075 031B
1368 01B1    LATIN CAPITAL LETTER UPSILON
1369         * African
1370         * typographically based on turned capital Greek omega
1371         x (latin small letter upsilon - 028A)
1372         x (inverted ohm sign - 2127)
1373 01B2    LATIN CAPITAL LETTER V WITH HOOK
1374         = LATIN CAPITAL LETTER SCRIPT V
1375         * African
1376         x (latin small letter v with hook - 028B)
1377 01B3    LATIN CAPITAL LETTER Y WITH HOOK
1378 01B4    LATIN SMALL LETTER Y WITH HOOK
1379         * Bini, Esoko, and other Edo languages in West Africa
1380 01B5    LATIN CAPITAL LETTER Z WITH STROKE
1381 01B6    LATIN SMALL LETTER Z WITH STROKE
1382         = barred z, z bar
1383         * Pan-Turkic Latin orthography
1384         * handwritten variant of Latin "z"
1385         x (latin small letter z - 007A)
1386 01B7    LATIN CAPITAL LETTER EZH
1387         * African, Skolt S�mi
1388         * lowercase is 0292
1389         x (latin capital letter yogh - 021C)
1390         x (cyrillic capital letter abkhasian dze - 04E0)
1391 01B8    LATIN CAPITAL LETTER EZH REVERSED
1392 01B9    LATIN SMALL LETTER EZH REVERSED
1393         * archaic phonetic for voiced pharyngeal fricative
1394         * sometimes typographically rendered with a turned digit 3
1395         * recommended spelling 0295
1396         x (latin letter pharyngeal voiced fricative - 0295)
1397         x (arabic letter ain - 0639)
1398 01BA    LATIN SMALL LETTER EZH WITH TAIL
1399         * archaic phonetic for labialized voiced palatoalveolar or palatal fricative
1400         * Twi
1401         * recommended spellings 0292 02B7 or 006A 02B7
1402 01BB    LATIN LETTER TWO WITH STROKE
1403         * archaic phonetic for [dz] affricate
1404         * recommended spellings 0292 or 0064 007A
1405 01BC    LATIN CAPITAL LETTER TONE FIVE
1406 01BD    LATIN SMALL LETTER TONE FIVE
1407         * Zhuang
1408         x (latin small letter tone six - 0185)
1409 01BE    LATIN LETTER INVERTED GLOTTAL STOP WITH STROKE
1410         * archaic phonetic for [ts] affricate
1411         * recommended spelling 0074 0073
1412         * letter form is actually derived from ligation of ts, rather than inverted glottal stop
1413 01BF    LATIN LETTER WYNN
1414         = wen
1415         * Runic letter borrowed into Latin script
1416         * replaced by "w" in modern transcriptions of Old English
1417         * uppercase is 01F7
1418         x (runic letter wunjo wynn w - 16B9)
1419 01C0    LATIN LETTER DENTAL CLICK
1420         = pipe
1421         * Khoisan tradition
1422         * "c" in Zulu orthography
1423         x (solidus - 002F)
1424         x (vertical line - 007C)
1425         x (latin small letter turned t - 0287)
1426         x (divides - 2223)
1427 01C1    LATIN LETTER LATERAL CLICK
1428         = double pipe
1429         * Khoisan tradition
1430         * "x" in Zulu orthography
1431         x (latin letter inverted glottal stop - 0296)
1432         x (parallel to - 2225)
1433 01C2    LATIN LETTER ALVEOLAR CLICK
1434         = double-barred pipe
1435         * Khoisan tradition
1436         x (not equal to - 2260)
1437 01C3    LATIN LETTER RETROFLEX CLICK
1438         = LATIN LETTER EXCLAMATION MARK
1439         * Khoisan tradition
1440         * "q" in Zulu orthography
1441         x (exclamation mark - 0021)
1442         x (latin letter stretched c - 0297)
1443 @               Croatian digraphs matching Serbian Cyrillic letters
1444 01C4    LATIN CAPITAL LETTER DZ WITH CARON
1445         # 0044 017D
1446 01C5    LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
1447         # 0044 017E
1448 01C6    LATIN SMALL LETTER DZ WITH CARON
1449         x (cyrillic small letter dzhe - 045F)
1450         # 0064 017E
1451 01C7    LATIN CAPITAL LETTER LJ
1452         # 004C 004A
1453 01C8    LATIN CAPITAL LETTER L WITH SMALL LETTER J
1454         # 004C 006A
1455 01C9    LATIN SMALL LETTER LJ
1456         x (cyrillic small letter lje - 0459)
1457         # 006C 006A
1458 01CA    LATIN CAPITAL LETTER NJ
1459         # 004E 004A
1460 01CB    LATIN CAPITAL LETTER N WITH SMALL LETTER J
1461         # 004E 006A
1462 01CC    LATIN SMALL LETTER NJ
1463         x (cyrillic small letter nje - 045A)
1464         # 006E 006A
1465 @               Pinyin diacritic-vowel combinations
1466 01CD    LATIN CAPITAL LETTER A WITH CARON
1467         : 0041 030C
1468 01CE    LATIN SMALL LETTER A WITH CARON
1469         * Pinyin third tone
1470         : 0061 030C
1471 01CF    LATIN CAPITAL LETTER I WITH CARON
1472         : 0049 030C
1473 01D0    LATIN SMALL LETTER I WITH CARON
1474         * Pinyin third tone
1475         : 0069 030C
1476 01D1    LATIN CAPITAL LETTER O WITH CARON
1477         : 004F 030C
1478 01D2    LATIN SMALL LETTER O WITH CARON
1479         * Pinyin third tone
1480         : 006F 030C
1481 01D3    LATIN CAPITAL LETTER U WITH CARON
1482         : 0055 030C
1483 01D4    LATIN SMALL LETTER U WITH CARON
1484         * Pinyin third tone
1485         : 0075 030C
1486 01D5    LATIN CAPITAL LETTER U WITH DIAERESIS AND MACRON
1487         : 00DC 0304
1488 01D6    LATIN SMALL LETTER U WITH DIAERESIS AND MACRON
1489         * Pinyin first tone
1490         : 00FC 0304
1491 01D7    LATIN CAPITAL LETTER U WITH DIAERESIS AND ACUTE
1492         : 00DC 0301
1493 01D8    LATIN SMALL LETTER U WITH DIAERESIS AND ACUTE
1494         * Pinyin second tone
1495         : 00FC 0301
1496 01D9    LATIN CAPITAL LETTER U WITH DIAERESIS AND CARON
1497         : 00DC 030C
1498 01DA    LATIN SMALL LETTER U WITH DIAERESIS AND CARON
1499         * Pinyin third tone
1500         : 00FC 030C
1501 01DB    LATIN CAPITAL LETTER U WITH DIAERESIS AND GRAVE
1502         : 00DC 0300
1503 01DC    LATIN SMALL LETTER U WITH DIAERESIS AND GRAVE
1504         * Pinyin fourth tone
1505         : 00FC 0300
1506 @               Additions
1507 01DD    LATIN SMALL LETTER TURNED E
1508         * Pan-Nigerian alphabet
1509         * all other usages of schwa are 0259
1510         * uppercase is 018E
1511         x (latin small letter schwa - 0259)
1512 01DE    LATIN CAPITAL LETTER A WITH DIAERESIS AND MACRON
1513         : 00C4 0304
1514 01DF    LATIN SMALL LETTER A WITH DIAERESIS AND MACRON
1515         * Livonian, Uralicist usage
1516         : 00E4 0304
1517 01E0    LATIN CAPITAL LETTER A WITH DOT ABOVE AND MACRON
1518         : 0226 0304
1519 01E1    LATIN SMALL LETTER A WITH DOT ABOVE AND MACRON
1520         * Uralicist usage
1521         : 0227 0304
1522 01E2    LATIN CAPITAL LETTER AE WITH MACRON (ash) *
1523         : 00C6 0304
1524 01E3    LATIN SMALL LETTER AE WITH MACRON (ash) *
1525         * Old Norse, Old English
1526         : 00E6 0304
1527 01E4    LATIN CAPITAL LETTER G WITH STROKE
1528 01E5    LATIN SMALL LETTER G WITH STROKE
1529         * Skolt S�mi
1530 01E6    LATIN CAPITAL LETTER G WITH CARON
1531         : 0047 030C
1532 01E7    LATIN SMALL LETTER G WITH CARON
1533         * Skolt S�mi
1534         x (latin small letter g with breve - 011F)
1535         : 0067 030C
1536 01E8    LATIN CAPITAL LETTER K WITH CARON
1537         : 004B 030C
1538 01E9    LATIN SMALL LETTER K WITH CARON
1539         * Skolt S�mi
1540         : 006B 030C
1541 01EA    LATIN CAPITAL LETTER O WITH OGONEK
1542         : 004F 0328
1543 01EB    LATIN SMALL LETTER O WITH OGONEK
1544         * S�mi, Iroquoian, Old Icelandic
1545         : 006F 0328
1546 01EC    LATIN CAPITAL LETTER O WITH OGONEK AND MACRON
1547         : 01EA 0304
1548 01ED    LATIN SMALL LETTER O WITH OGONEK AND MACRON
1549         * Old Icelandic
1550         : 01EB 0304
1551 01EE    LATIN CAPITAL LETTER EZH WITH CARON
1552         : 01B7 030C
1553 01EF    LATIN SMALL LETTER EZH WITH CARON
1554         * Skolt S�mi
1555         : 0292 030C
1556 01F0    LATIN SMALL LETTER J WITH CARON
1557         * IPA and many languages
1558         : 006A 030C
1559 01F1    LATIN CAPITAL LETTER DZ
1560         # 0044 005A
1561 01F2    LATIN CAPITAL LETTER D WITH SMALL LETTER Z
1562         # 0044 007A
1563 01F3    LATIN SMALL LETTER DZ
1564         # 0064 007A
1565 01F4    LATIN CAPITAL LETTER G WITH ACUTE
1566         : 0047 0301
1567 01F5    LATIN SMALL LETTER G WITH ACUTE
1568         * Macedonian and Serbian transliteration
1569         : 0067 0301
1570 01F6    LATIN CAPITAL LETTER HWAIR
1571         * lowercase is 0195
1572 01F7    LATIN CAPITAL LETTER WYNN
1573         = wen
1574         * lowercase is 01BF
1575 01F8    LATIN CAPITAL LETTER N WITH GRAVE
1576         : 004E 0300
1577 01F9    LATIN SMALL LETTER N WITH GRAVE
1578         * Pinyin
1579         : 006E 0300
1580 01FA    LATIN CAPITAL LETTER A WITH RING ABOVE AND ACUTE
1581         : 00C5 0301
1582 01FB    LATIN SMALL LETTER A WITH RING ABOVE AND ACUTE
1583         : 00E5 0301
1584 01FC    LATIN CAPITAL LETTER AE WITH ACUTE (ash) *
1585         : 00C6 0301
1586 01FD    LATIN SMALL LETTER AE WITH ACUTE (ash) *
1587         : 00E6 0301
1588 01FE    LATIN CAPITAL LETTER O WITH STROKE AND ACUTE
1589         : 00D8 0301
1590 01FF    LATIN SMALL LETTER O WITH STROKE AND ACUTE
1591         : 00F8 0301
1592 @               Additions for Slovenian and Croatian
1593 0200    LATIN CAPITAL LETTER A WITH DOUBLE GRAVE
1594         : 0041 030F
1595 0201    LATIN SMALL LETTER A WITH DOUBLE GRAVE
1596         : 0061 030F
1597 0202    LATIN CAPITAL LETTER A WITH INVERTED BREVE
1598         : 0041 0311
1599 0203    LATIN SMALL LETTER A WITH INVERTED BREVE
1600         : 0061 0311
1601 0204    LATIN CAPITAL LETTER E WITH DOUBLE GRAVE
1602         : 0045 030F
1603 0205    LATIN SMALL LETTER E WITH DOUBLE GRAVE
1604         : 0065 030F
1605 0206    LATIN CAPITAL LETTER E WITH INVERTED BREVE
1606         : 0045 0311
1607 0207    LATIN SMALL LETTER E WITH INVERTED BREVE
1608         : 0065 0311
1609 0208    LATIN CAPITAL LETTER I WITH DOUBLE GRAVE
1610         : 0049 030F
1611 0209    LATIN SMALL LETTER I WITH DOUBLE GRAVE
1612         : 0069 030F
1613 020A    LATIN CAPITAL LETTER I WITH INVERTED BREVE
1614         : 0049 0311
1615 020B    LATIN SMALL LETTER I WITH INVERTED BREVE
1616         : 0069 0311
1617 020C    LATIN CAPITAL LETTER O WITH DOUBLE GRAVE
1618         : 004F 030F
1619 020D    LATIN SMALL LETTER O WITH DOUBLE GRAVE
1620         : 006F 030F
1621 020E    LATIN CAPITAL LETTER O WITH INVERTED BREVE
1622         : 004F 0311
1623 020F    LATIN SMALL LETTER O WITH INVERTED BREVE
1624         : 006F 0311
1625 0210    LATIN CAPITAL LETTER R WITH DOUBLE GRAVE
1626         : 0052 030F
1627 0211    LATIN SMALL LETTER R WITH DOUBLE GRAVE
1628         : 0072 030F
1629 0212    LATIN CAPITAL LETTER R WITH INVERTED BREVE
1630         : 0052 0311
1631 0213    LATIN SMALL LETTER R WITH INVERTED BREVE
1632         : 0072 0311
1633 0214    LATIN CAPITAL LETTER U WITH DOUBLE GRAVE
1634         : 0055 030F
1635 0215    LATIN SMALL LETTER U WITH DOUBLE GRAVE
1636         : 0075 030F
1637 0216    LATIN CAPITAL LETTER U WITH INVERTED BREVE
1638         : 0055 0311
1639 0217    LATIN SMALL LETTER U WITH INVERTED BREVE
1640         : 0075 0311
1641 @               Additions for Romanian
1642 0218    LATIN CAPITAL LETTER S WITH COMMA BELOW *
1643         : 0053 0326
1644 0219    LATIN SMALL LETTER S WITH COMMA BELOW *
1645         * Romanian, when distinct comma below form is required
1646         x (latin small letter s with cedilla - 015F)
1647         : 0073 0326
1648 021A    LATIN CAPITAL LETTER T WITH COMMA BELOW *
1649         : 0054 0326
1650 021B    LATIN SMALL LETTER T WITH COMMA BELOW *
1651         * Romanian, when distinct comma below form is required
1652         x (latin small letter t with cedilla - 0163)
1653         : 0074 0326
1654 @               Miscellaneous additions
1655 021C    LATIN CAPITAL LETTER YOGH
1656         x (latin capital letter ezh - 01B7)
1657 021D    LATIN SMALL LETTER YOGH
1658         * Middle English, Scots
1659         x (latin small letter ezh - 0292)
1660         x (ounce sign - 2125)
1661 021E    LATIN CAPITAL LETTER H WITH CARON
1662         : 0048 030C
1663 021F    LATIN SMALL LETTER H WITH CARON
1664         * Finnish Romany
1665         : 0068 030C
1666 0222    LATIN CAPITAL LETTER OU
1667 0223    LATIN SMALL LETTER OU
1668         * Algonquin, Huron
1669         x (digit eight - 0038)
1670 0224    LATIN CAPITAL LETTER Z WITH HOOK
1671 0225    LATIN SMALL LETTER Z WITH HOOK
1672         * Middle High German
1673 0226    LATIN CAPITAL LETTER A WITH DOT ABOVE
1674         : 0041 0307
1675 0227    LATIN SMALL LETTER A WITH DOT ABOVE
1676         * Uralicist usage
1677         : 0061 0307
1678 0228    LATIN CAPITAL LETTER E WITH CEDILLA
1679         : 0045 0327
1680 0229    LATIN SMALL LETTER E WITH CEDILLA
1681         : 0065 0327
1682 @               Additions for Livonian
1683 022A    LATIN CAPITAL LETTER O WITH DIAERESIS AND MACRON
1684         : 00D6 0304
1685 022B    LATIN SMALL LETTER O WITH DIAERESIS AND MACRON
1686         * Livonian
1687         : 00F6 0304
1688 022C    LATIN CAPITAL LETTER O WITH TILDE AND MACRON
1689         : 00D5 0304
1690 022D    LATIN SMALL LETTER O WITH TILDE AND MACRON
1691         * Livonian
1692         : 00F5 0304
1693 022E    LATIN CAPITAL LETTER O WITH DOT ABOVE
1694         : 004F 0307
1695 022F    LATIN SMALL LETTER O WITH DOT ABOVE
1696         * Livonian
1697         : 006F 0307
1698 0230    LATIN CAPITAL LETTER O WITH DOT ABOVE AND MACRON
1699         : 022E 0304
1700 0231    LATIN SMALL LETTER O WITH DOT ABOVE AND MACRON
1701         * Livonian
1702         : 022F 0304
1703 0232    LATIN CAPITAL LETTER Y WITH MACRON
1704         : 0059 0304
1705 0233    LATIN SMALL LETTER Y WITH MACRON
1706         * Livonian, Cornish
1707         : 0079 0304
1708 @@      0250    IPA Extensions  02AF
1709 @               IPA extensions
1710 @+              IPA includes basic Latin letters and a number of Latin letters from other blocks.
1711                 x (latin small letter ae - 00E6)
1712                 x (latin small letter c with cedilla - 00E7)
1713                 x (latin small letter eth - 00F0)
1714                 x (latin small letter o with stroke - 00F8)
1715                 x (latin small letter h with stroke - 0127)
1716                 x (latin small letter eng - 014B)
1717                 x (latin small ligature oe - 0153)
1718                 x (greek small letter beta - 03B2)
1719                 x (greek small letter theta - 03B8)
1720                 x (greek small letter lamda - 03BB)
1721                 x (greek small letter chi - 03C7)
1722 0250    LATIN SMALL LETTER TURNED A
1723         * low central unrounded vowel
1724 0251    LATIN SMALL LETTER ALPHA
1725         = LATIN SMALL LETTER SCRIPT A
1726         * low back unrounded vowel
1727         x (greek small letter alpha - 03B1)
1728 0252    LATIN SMALL LETTER TURNED ALPHA
1729         * low back rounded vowel
1730 0253    LATIN SMALL LETTER B WITH HOOK
1731         * implosive bilabial stop
1732         * Pan-Nigerian alphabet
1733         x (latin capital letter b with hook - 0181)
1734 0254    LATIN SMALL LETTER OPEN O
1735         * typographically a turned c
1736         * lower-mid back rounded vowel
1737         x (latin capital letter open o - 0186)
1738 0255    LATIN SMALL LETTER C WITH CURL
1739         * voiceless alveolo-palatal laminal fricative
1740         * used in transcription of Mandarin Chinese
1741         * sound spelled with 015B in Polish
1742 0256    LATIN SMALL LETTER D WITH TAIL
1743         = LATIN SMALL LETTER D RETROFLEX HOOK
1744         * voiced retroflex stop
1745         x (latin capital letter african d - 0189)
1746 0257    LATIN SMALL LETTER D WITH HOOK
1747         * implosive dental or alveolar stop
1748         * Ewe, Pan-Nigerian alphabet
1749         x (latin capital letter d with hook - 018A)
1750 0258    LATIN SMALL LETTER REVERSED E
1751         * upper-mid central unrounded vowel
1752 0259    LATIN SMALL LETTER SCHWA
1753         * mid-central unrounded vowel
1754         * variant uppercase form 018E is associated with 01DD
1755         x (latin capital letter schwa - 018F)
1756         x (latin small letter turned e - 01DD)
1757         x (cyrillic small letter schwa - 04D9)
1758 025A    LATIN SMALL LETTER SCHWA WITH HOOK
1759         * rhotacized schwa
1760 025B    LATIN SMALL LETTER OPEN E
1761         = LATIN SMALL LETTER EPSILON
1762         * lower-mid front unrounded vowel
1763         x (latin capital letter open e - 0190)
1764         x (greek small letter epsilon - 03B5)
1765 025C    LATIN SMALL LETTER REVERSED OPEN E
1766         * lower-mid central unrounded vowel
1767 025D    LATIN SMALL LETTER REVERSED OPEN E WITH HOOK
1768         * rhotacized lower-mid central vowel
1769 025E    LATIN SMALL LETTER CLOSED REVERSED OPEN E
1770         = LATIN SMALL LETTER CLOSED REVERSED EPSILON
1771         * lower-mid central rounded vowel
1772 025F    LATIN SMALL LETTER DOTLESS J WITH STROKE
1773         * voiced palatal stop
1774         * typographically a turned f, but better thought of as a form of j
1775         * "gy" in Hungarian orthography
1776         * also archaic phonetic for palatoalveolar affricate 02A4
1777 0260    LATIN SMALL LETTER G WITH HOOK
1778         * implosive velar stop
1779         x (latin capital letter g with hook - 0193)
1780 0261    LATIN SMALL LETTER SCRIPT G
1781         * voiced velar stop
1782         x (latin small letter g - 0067)
1783 0262    LATIN LETTER SMALL CAPITAL G
1784         * voiced uvular stop
1785 0263    LATIN SMALL LETTER GAMMA
1786         * voiced velar fricative
1787         x (latin capital letter gamma - 0194)
1788         x (greek small letter gamma - 03B3)
1789 0264    LATIN SMALL LETTER RAMS HORN
1790         = LATIN SMALL LETTER BABY GAMMA
1791         * upper-mid back unrounded vowel
1792 0265    LATIN SMALL LETTER TURNED H
1793         * voiced rounded palatal approximant
1794 0266    LATIN SMALL LETTER H WITH HOOK
1795         * breathy-voiced glottal fricative
1796         x (modifier letter small h with hook - 02B1)
1797 0267    LATIN SMALL LETTER HENG WITH HOOK
1798         * voiceless coarticulated velar and palatoalveolar fricative
1799         * "tj" or "kj" or "sj" in some Swedish dialects
1800 0268    LATIN SMALL LETTER I WITH STROKE
1801         = barred i, i bar
1802         * high central unrounded vowel
1803         * ISO 6438 gives lowercase of 0197 as 026A, not 0268
1804 0269    LATIN SMALL LETTER IOTA
1805         * semi-high front unrounded vowel
1806 @+              * obsoleted by IPA in 1989
1807         * preferred use is 026A LATIN LETTER SMALL CAPITAL I
1808         x (latin capital letter iota - 0196)
1809         x (greek small letter iota - 03B9)
1810 026A    LATIN LETTER SMALL CAPITAL I
1811         * semi-high front unrounded vowel
1812         * preferred IPA alternate for 0269
1813         x (latin capital letter i with stroke - 0197)
1814 026B    LATIN SMALL LETTER L WITH MIDDLE TILDE
1815         * velarized voiced alveolar lateral approximant
1816 026C    LATIN SMALL LETTER L WITH BELT
1817         * voiceless alveolar lateral fricative
1818 026D    LATIN SMALL LETTER L WITH RETROFLEX HOOK
1819         * voiced retroflex lateral
1820 026E    LATIN SMALL LETTER LEZH
1821         * voiced lateral fricative
1822         * "dhl" in Zulu orthography
1823 026F    LATIN SMALL LETTER TURNED M
1824         * high back unrounded vowel
1825         x (latin capital letter turned m - 019C)
1826 0270    LATIN SMALL LETTER TURNED M WITH LONG LEG
1827         * voiced velar approximant
1828 0271    LATIN SMALL LETTER M WITH HOOK
1829         * voiced labiodental nasal
1830 0272    LATIN SMALL LETTER N WITH LEFT HOOK
1831         * voiced palatal nasal
1832         x (latin capital letter n with left hook - 019D)
1833 0273    LATIN SMALL LETTER N WITH RETROFLEX HOOK
1834         * voiced retroflex nasal
1835 0274    LATIN LETTER SMALL CAPITAL N
1836         * voiced uvular nasal
1837 0275    LATIN SMALL LETTER BARRED O
1838         = o bar
1839         * rounded mid-central vowel, i.e. rounded schwa
1840         * uppercase is 019F
1841         x (greek small letter theta - 03B8)
1842         x (cyrillic small letter fita - 0473)
1843         x (cyrillic small letter barred o - 04E9)
1844 0276    LATIN LETTER SMALL CAPITAL OE
1845         * low front rounded vowel
1846         x (latin small ligature oe - 0153)
1847 0277    LATIN SMALL LETTER CLOSED OMEGA
1848         * semi-high back rounded vowel
1849 @+              * obsoleted by IPA in 1989
1850         * preferred use is 028A latin small letter upsilon
1851 0278    LATIN SMALL LETTER PHI
1852         * voiceless bilabial fricative
1853         x (greek small letter phi - 03C6)
1854 0279    LATIN SMALL LETTER TURNED R
1855         * voiced alveolar approximant
1856         x (modifier letter small turned r - 02B4)
1857 027A    LATIN SMALL LETTER TURNED R WITH LONG LEG
1858         * voiced lateral flap
1859 027B    LATIN SMALL LETTER TURNED R WITH HOOK
1860         * voiced retroflex approximant
1861         x (modifier letter small turned r with hook - 02B5)
1862 027C    LATIN SMALL LETTER R WITH LONG LEG
1863         * voiced strident apico-alveolar trill
1864 @+              * obsoleted by IPA in 1989
1865         * sound spelled with 0159 in Czech
1866         * preferred phonetic representation for Czech is 0072 031D
1867         * in current use in Gaelic types (as glyph variant of 0072)
1868 027D    LATIN SMALL LETTER R WITH TAIL
1869         * voiced retroflex flap
1870 027E    LATIN SMALL LETTER R WITH FISHHOOK
1871         * voiced alveolar flap or tap
1872 027F    LATIN SMALL LETTER REVERSED R WITH FISHHOOK
1873         * apical dental vowel
1874         * used in Sinological tradition
1875         * IPA spelling - 007A 0329
1876 0280    LATIN LETTER SMALL CAPITAL R *
1877         * voiced uvular trill
1878         * Germanic, Old Norse
1879         * uppercase is 01A6
1880 0281    LATIN LETTER SMALL CAPITAL INVERTED R
1881         * voiced uvular fricative or approximant
1882         x (modifier letter small capital inverted r - 02B6)
1883 0282    LATIN SMALL LETTER S WITH HOOK
1884         * voiceless retroflex fricative
1885 0283    LATIN SMALL LETTER ESH
1886         * voiceless postalveolar fricative
1887         x (latin capital letter esh - 01A9)
1888         x (integral - 222B)
1889 0284    LATIN SMALL LETTER DOTLESS J WITH STROKE AND HOOK
1890         * implosive palatal stop
1891         * typographically based on 025F, not on 0283
1892 0285    LATIN SMALL LETTER SQUAT REVERSED ESH
1893         * apical retroflex vowel
1894         * used in Sinological tradition
1895         * IPA spelling - 0290 0329
1896 0286    LATIN SMALL LETTER ESH WITH CURL
1897         * palatalized voiceless postalveolar fricative
1898         * suggested spelling - 0283 02B2
1899 0287    LATIN SMALL LETTER TURNED T
1900         * dental click (sound of "tsk tsk")
1901         x (latin letter dental click - 01C0)
1902 0288    LATIN SMALL LETTER T WITH RETROFLEX HOOK
1903         * voiceless retroflex stop
1904         x (latin capital letter t with retroflex hook - 01AE)
1905 0289    LATIN SMALL LETTER U BAR
1906         * high central rounded vowel
1907 028A    LATIN SMALL LETTER UPSILON
1908         * semi-high back rounded vowel
1909         * preferred IPA alternate to 0277
1910         x (latin capital letter upsilon - 01B1)
1911         x (greek small letter upsilon - 03C5)
1912 028B    LATIN SMALL LETTER V WITH HOOK
1913         = LATIN SMALL LETTER SCRIPT V
1914         * voiced labiodental approximant
1915         x (latin capital letter v with hook - 01B2)
1916         x (greek small letter upsilon - 03C5)
1917 028C    LATIN SMALL LETTER TURNED V
1918         = caret, wedge
1919         * lower-mid back unrounded vowel
1920         x (greek capital letter lamda - 039B)
1921         x (caret - 2038)
1922         x (logical and - 2227)
1923 028D    LATIN SMALL LETTER TURNED W
1924         * voiceless rounded labiovelar approximant
1925 028E    LATIN SMALL LETTER TURNED Y
1926         * voiced lateral approximant
1927 028F    LATIN LETTER SMALL CAPITAL Y
1928         * semi-high front rounded vowel
1929 0290    LATIN SMALL LETTER Z WITH RETROFLEX HOOK
1930         * voiced retroflex fricative
1931 0291    LATIN SMALL LETTER Z WITH CURL
1932         * voiced alveolo-palatal laminal fricative
1933         * sound spelled with 017A in Polish
1934 0292    LATIN SMALL LETTER EZH
1935         = LATIN SMALL LETTER YOGH
1936         = dram
1937         * voiced postalveolar fricative
1938         * uppercase is 01B7
1939         * Skolt S�mi
1940         x (latin small letter yogh - 021D)
1941         x (cyrillic small letter abkhasian dze - 04E1)
1942         x (ounce sign - 2125)
1943 0293    LATIN SMALL LETTER EZH WITH CURL
1944         * palatalized voiced postalveolar fricative
1945 0294    LATIN LETTER GLOTTAL STOP
1946         x (modifier letter glottal stop - 02C0)
1947 0295    LATIN LETTER PHARYNGEAL VOICED FRICATIVE
1948         = LATIN LETTER REVERSED GLOTTAL STOP
1949         * voiced pharyngeal fricative
1950         * ain
1951         x (latin small letter ezh reversed - 01B9)
1952         x (modifier letter reversed glottal stop - 02C1)
1953 0296    LATIN LETTER INVERTED GLOTTAL STOP
1954         * lateral click
1955         x (latin letter lateral click - 01C1)
1956 0297    LATIN LETTER STRETCHED C
1957         * palatal (or alveolar) click
1958         x (latin letter retroflex click - 01C3)
1959         x (complement - 2201)
1960 0298    LATIN LETTER BILABIAL CLICK
1961         = LATIN LETTER BULLSEYE
1962         x (circled dot operator - 2299)
1963 0299    LATIN LETTER SMALL CAPITAL B
1964         * bilabial trill
1965 029A    LATIN SMALL LETTER CLOSED OPEN E
1966         = LATIN SMALL LETTER CLOSED EPSILON
1967         * lower-mid front rounded vowel
1968         * non-IPA alternate for the preferred 0153
1969 029B    LATIN LETTER SMALL CAPITAL G WITH HOOK
1970         * voiced uvular implosive
1971 029C    LATIN LETTER SMALL CAPITAL H
1972         * voiceless epiglottal fricative
1973 029D    LATIN SMALL LETTER J WITH CROSSED-TAIL
1974         * voiced palatal fricative
1975 029E    LATIN SMALL LETTER TURNED K
1976         * proposed for velar click
1977 @+              * withdrawn by IPA in 1970
1978 029F    LATIN LETTER SMALL CAPITAL L
1979         * velar lateral approximant
1980 02A0    LATIN SMALL LETTER Q WITH HOOK
1981         * voiceless uvular implosive
1982 02A1    LATIN LETTER GLOTTAL STOP WITH STROKE
1983         * voiced epiglottal stop
1984 02A2    LATIN LETTER REVERSED GLOTTAL STOP WITH STROKE
1985         * voiced epiglottal fricative
1986 02A3    LATIN SMALL LETTER DZ DIGRAPH
1987         * voiced dental affricate
1988 02A4    LATIN SMALL LETTER DEZH DIGRAPH
1989         * voiced postalveolar affricate
1990 02A5    LATIN SMALL LETTER DZ DIGRAPH WITH CURL
1991         * voiced alveolo-palatal affricate
1992 02A6    LATIN SMALL LETTER TS DIGRAPH
1993         * voiceless dental affricate
1994 02A7    LATIN SMALL LETTER TESH DIGRAPH
1995         * voiceless postalveolar affricate
1996 02A8    LATIN SMALL LETTER TC DIGRAPH WITH CURL
1997         * voiceless alveolo-palatal affricate
1998 @               IPA characters for disordered speech
1999 02A9    LATIN SMALL LETTER FENG DIGRAPH
2000         * velopharyngeal fricative
2001 02AA    LATIN SMALL LETTER LS DIGRAPH
2002         * lateral alveolar fricative (lisp)
2003 02AB    LATIN SMALL LETTER LZ DIGRAPH
2004         * voiced lateral alveolar fricative
2005 02AC    LATIN LETTER BILABIAL PERCUSSIVE
2006         * audible lip smack
2007 02AD    LATIN LETTER BIDENTAL PERCUSSIVE
2008         * audible teeth gnashing
2009 @@      02B0    Spacing Modifier Letters        02FF
2010 @               Phonetic modifiers derived from Latin letters
2011 02B0    MODIFIER LETTER SMALL H
2012         * aspiration
2013         # <super> 0068
2014 02B1    MODIFIER LETTER SMALL H WITH HOOK
2015         * breathy voiced, murmured
2016         x (latin small letter h with hook - 0266)
2017         x (combining diaeresis below - 0324)
2018         # <super> 0266
2019 02B2    MODIFIER LETTER SMALL J
2020         * palatalization
2021         x (combining palatalized hook below - 0321)
2022         # <super> 006A
2023 02B3    MODIFIER LETTER SMALL R
2024         # <super> 0072
2025 02B4    MODIFIER LETTER SMALL TURNED R
2026         x (latin small letter turned r - 0279)
2027         # <super> 0279
2028 02B5    MODIFIER LETTER SMALL TURNED R WITH HOOK
2029         x (latin small letter turned r with hook - 027B)
2030         # <super> 027B
2031 02B6    MODIFIER LETTER SMALL CAPITAL INVERTED R
2032         * preceding four used for r-coloring or r-offglides
2033         x (latin letter small capital inverted r - 0281)
2034         # <super> 0281
2035 02B7    MODIFIER LETTER SMALL W
2036         * labialization
2037         x (combining inverted double arch below - 032B)
2038         # <super> 0077
2039 02B8    MODIFIER LETTER SMALL Y
2040         * palatalization
2041         * common Americanist substitution for 02B2
2042         # <super> 0079
2043 @               Miscellaneous phonetic modifiers
2044 02B9    MODIFIER LETTER PRIME
2045         * primary stress, emphasis
2046         * transliteration of mjagkij znak (Cyrillic soft sign: palatalization)
2047         x (apostrophe - 0027)
2048         x (acute accent - 00B4)
2049         x (modifier letter acute accent - 02CA)
2050         x (combining acute accent - 0301)
2051         x (greek numeral sign - 0374)
2052         x (prime - 2032)
2053 02BA    MODIFIER LETTER DOUBLE PRIME
2054         * exaggerated stress, contrastive stress
2055         * transliteration of tverdyj znak (Cyrillic hard sign: no palatalization)
2056         x (quotation mark - 0022)
2057         x (combining double acute accent - 030B)
2058         x (double prime - 2033)
2059 02BB    MODIFIER LETTER TURNED COMMA
2060         * typographical alternate for 02BD or 02BF
2061         x (combining turned comma above - 0312)
2062         x (left single quotation mark - 2018)
2063 02BC    MODIFIER LETTER APOSTROPHE
2064         = apostrophe
2065         * glottal stop, glottalization, ejective
2066         * spacing clone of Greek smooth breathing mark
2067         * many languages use this as a letter of their alphabets
2068         x (apostrophe - 0027)
2069         x (combining comma above - 0313)
2070         x (combining comma above right - 0315)
2071         x (armenian apostrophe - 055A)
2072         x (right single quotation mark - 2019)
2073 02BD    MODIFIER LETTER REVERSED COMMA
2074         * weak aspiration
2075         * spacing clone of Greek rough breathing mark
2076         x (combining reversed comma above - 0314)
2077         x (armenian modifier letter left half ring - 0559)
2078         x (single high-reversed-9 quotation mark - 201B)
2079 02BE    MODIFIER LETTER RIGHT HALF RING
2080         * transliteration of Arabic hamza (glottal stop)
2081         x (armenian apostrophe - 055A)
2082         x (arabic letter hamza - 0621)
2083 02BF    MODIFIER LETTER LEFT HALF RING
2084         * transliteration of Arabic ain (voiced pharyngeal fricative)
2085         x (armenian modifier letter left half ring - 0559)
2086         x (arabic letter ain - 0639)
2087 02C0    MODIFIER LETTER GLOTTAL STOP
2088         * ejective or glottalized
2089         * typographical alternate for 02BC or 02BE
2090         x (latin letter glottal stop - 0294)
2091         x (combining hook above - 0309)
2092 02C1    MODIFIER LETTER REVERSED GLOTTAL STOP
2093         * typographical alternate for 02BF
2094         x (latin letter pharyngeal voiced fricative - 0295)
2095 02C2    MODIFIER LETTER LEFT ARROWHEAD
2096         * fronted articulation
2097 02C3    MODIFIER LETTER RIGHT ARROWHEAD
2098         * backed articulation
2099 02C4    MODIFIER LETTER UP ARROWHEAD
2100         * raised articulation
2101         x (circumflex accent - 005E)
2102         x (up arrowhead - 2303)
2103 02C5    MODIFIER LETTER DOWN ARROWHEAD
2104         * lowered articulation
2105 02C6    MODIFIER LETTER CIRCUMFLEX ACCENT
2106         * rising-falling tone, falling tone, secondary stress, etc.
2107         x (circumflex accent - 005E)
2108         x (combining circumflex accent - 0302)
2109 02C7    CARON (Mandarin Chinese third tone)
2110         = hacek
2111         * falling-rising tone
2112         * Mandarin Chinese third tone
2113         x (combining caron - 030C)
2114 02C8    MODIFIER LETTER VERTICAL LINE
2115         * primary stress, downstep
2116         * precedes letter or syllable modified
2117         x (apostrophe - 0027)
2118         x (combining vertical line above - 030D)
2119 02C9    MODIFIER LETTER MACRON (Mandarin Chinese first tone)
2120         * high level tone
2121         * precedes or follows letter or syllable modified
2122         * Mandarin Chinese first tone
2123         x (macron - 00AF)
2124         x (combining macron - 0304)
2125 02CA    MODIFIER LETTER ACUTE ACCENT (Mandarin Chinese second tone)
2126         * high-rising tone (IPA), high tone, primary stress
2127         * Mandarin Chinese second tone
2128         x (acute accent - 00B4)
2129         x (modifier letter prime - 02B9)
2130         x (combining acute accent - 0301)
2131         x (greek numeral sign - 0374)
2132         x (armenian emphasis mark - 055B)
2133 02CB    MODIFIER LETTER GRAVE ACCENT (Mandarin Chinese fourth tone)
2134         * high-falling tone (IPA), low tone, secondary or tertiary stress
2135         * Mandarin Chinese fourth tone
2136         x (grave accent - 0060)
2137         x (combining grave accent - 0300)
2138         x (armenian comma - 055D)
2139 02CC    MODIFIER LETTER LOW VERTICAL LINE
2140         * secondary stress
2141         * precedes letter or syllable modified
2142         x (combining vertical line below - 0329)
2143 02CD    MODIFIER LETTER LOW MACRON
2144         * low level tone
2145         x (low line - 005F)
2146         x (combining macron below - 0331)
2147 02CE    MODIFIER LETTER LOW GRAVE ACCENT
2148         * low-falling tone
2149 02CF    MODIFIER LETTER LOW ACUTE ACCENT
2150         * low-rising tone
2151         x (greek lower numeral sign - 0375)
2152 02D0    MODIFIER LETTER TRIANGULAR COLON
2153         * length mark
2154         x (colon - 003A)
2155 02D1    MODIFIER LETTER HALF TRIANGULAR COLON
2156         * half-length mark
2157         x (middle dot - 00B7)
2158 02D2    MODIFIER LETTER CENTRED RIGHT HALF RING
2159         * more rounded articulation
2160 02D3    MODIFIER LETTER CENTRED LEFT HALF RING
2161         * less rounded articulation
2162 02D4    MODIFIER LETTER UP TACK
2163         * vowel raising or closing
2164         x (combining up tack below - 031D)
2165         x (combining dot below - 0323)
2166 02D5    MODIFIER LETTER DOWN TACK
2167         * vowel lowering or opening
2168         x (combining left half ring below - 031C)
2169         x (combining down tack below - 031E)
2170 02D6    MODIFIER LETTER PLUS SIGN
2171         * advanced or fronted articulation
2172         x (combining plus sign below - 031F)
2173 02D7    MODIFIER LETTER MINUS SIGN
2174         * retracted or backed articulation
2175         * glyph may have small end-serifs
2176         x (combining minus sign below - 0320)
2177 @               Spacing clones of diacritics
2178 02D8    BREVE
2179         x (combining breve - 0306)
2180         # 0020 0306
2181 02D9    DOT ABOVE (Mandarin Chinese light tone)
2182         * Mandarin Chinese fifth tone (light or neutral)
2183         x (combining dot above - 0307)
2184         # 0020 0307
2185 02DA    RING ABOVE
2186         x (degree sign - 00B0)
2187         x (combining ring above - 030A)
2188         # 0020 030A
2189 02DB    OGONEK
2190         x (combining ogonek - 0328)
2191         # 0020 0328
2192 02DC    SMALL TILDE
2193         x (tilde - 007E)
2194         x (combining tilde - 0303)
2195         x (tilde operator - 223C)
2196         # 0020 0303
2197 02DD    DOUBLE ACUTE ACCENT
2198         x (combining double acute accent - 030B)
2199         # 0020 030B
2200 @               Additions based on 1989 IPA
2201 02DE    MODIFIER LETTER RHOTIC HOOK
2202         * rhotacization in vowel
2203         * often ligated: 025A = 0259 + 02DE; 025D = 025C + 02DE
2204 02DF    MODIFIER LETTER CROSS ACCENT
2205         * Swedish grave accent
2206 02E0    MODIFIER LETTER SMALL GAMMA
2207         * these modifier letters are occasionally used in transcription of affricates
2208         # <super> 0263
2209 02E1    MODIFIER LETTER SMALL L
2210         # <super> 006C
2211 02E2    MODIFIER LETTER SMALL S
2212         # <super> 0073
2213 02E3    MODIFIER LETTER SMALL X
2214         # <super> 0078
2215 02E4    MODIFIER LETTER SMALL REVERSED GLOTTAL STOP
2216         # <super> 0295
2217 @               Tone letters
2218 02E5    MODIFIER LETTER EXTRA-HIGH TONE BAR
2219 02E6    MODIFIER LETTER HIGH TONE BAR
2220 02E7    MODIFIER LETTER MID TONE BAR
2221 02E8    MODIFIER LETTER LOW TONE BAR
2222 02E9    MODIFIER LETTER EXTRA-LOW TONE BAR
2223 02EA    MODIFIER LETTER YIN DEPARTING TONE MARK
2224 02EB    MODIFIER LETTER YANG DEPARTING TONE MARK
2225 @               IPA modifiers
2226 02EC    MODIFIER LETTER VOICING
2227 02ED    MODIFIER LETTER UNASPIRATED
2228 @               Other modifier letters
2229 02EE    MODIFIER LETTER DOUBLE APOSTROPHE
2230
2231 2000    EN QUAD
2232         : 2002 en space
2233 2001    EM QUAD
2234         = mutton quad
2235         : 2003 em space
2236 2002    EN SPACE
2237         = nut
2238         * half an em
2239         # 0020 space
2240 2003    EM SPACE
2241         = mutton
2242         * nominally, a space equal to the type size in points
2243         * may scale by the condensation factor of a font
2244         # 0020 space
2245 2004    THREE-PER-EM SPACE
2246         = thick space
2247         # 0020 space
2248 2005    FOUR-PER-EM SPACE
2249         = mid space
2250         # 0020 space
2251 2006    SIX-PER-EM SPACE
2252         * in computer typography sometimes equated to thin space
2253         # 0020 space
2254 2007    FIGURE SPACE
2255         * space equal to tabular width of a font
2256         * this is equivalent to the digit width of fonts with fixed-width digits
2257         # <noBreak> 0020
2258 2008    PUNCTUATION SPACE
2259         * space equal to narrow punctuation of a font
2260         # 0020 space
2261 2009    THIN SPACE
2262         * a fifth of an em (or sometimes a sixth)
2263         # 0020 space
2264 200A    HAIR SPACE
2265         * thinner than a thin space
2266         * in traditional typography, the thinnest space available
2267         # 0020 space
2268 200B    ZERO WIDTH SPACE
2269         * nominally zero width, but may expand in justification
2270 @               Formatting characters
2271 200C    ZERO WIDTH NON-JOINER
2272         = ZWNJ
2273 200D    ZERO WIDTH JOINER
2274         = ZWJ
2275 200E    LEFT-TO-RIGHT MARK
2276         = LRM
2277 200F    RIGHT-TO-LEFT MARK
2278         = RLM
2279 @               Dashes
2280 2010    HYPHEN
2281         x (hyphen-minus - 002D)
2282 2011    NON-BREAKING HYPHEN
2283         x (hyphen-minus - 002D)
2284         # <noBreak> 2010
2285 2012    FIGURE DASH
2286 2013    EN DASH
2287 2014    EM DASH
2288         * may be used in pairs to offset parenthetical text
2289         x (katakana-hiragana prolonged sound mark - 30FC)
2290 2015    HORIZONTAL BAR
2291         = QUOTATION DASH
2292         * long dash introducing quoted text
2293 @               General punctuation
2294 2016    DOUBLE VERTICAL LINE
2295         * used in pairs to indicate norm of a matrix
2296         x (parallel to - 2225)
2297 2017    DOUBLE LOW LINE
2298         * this is a spacing character
2299         x (low line - 005F)
2300         x (combining double low line - 0333)
2301         # 0020 0333
2302 2018    LEFT SINGLE QUOTATION MARK
2303         = SINGLE TURNED COMMA QUOTATION MARK
2304         * this is the preferred glyph (as opposed to 201B)
2305         x (apostrophe - 0027)
2306         x (modifier letter turned comma - 02BB)
2307         x (heavy single turned comma quotation mark ornament - 275B)
2308 2019    RIGHT SINGLE QUOTATION MARK
2309         = SINGLE COMMA QUOTATION MARK
2310         * this is the preferred character to use for apostrophe
2311         x (apostrophe - 0027)
2312         x (modifier letter apostrophe - 02BC)
2313         x (heavy single comma quotation mark ornament - 275C)
2314 201A    SINGLE LOW-9 QUOTATION MARK
2315         = LOW SINGLE COMMA QUOTATION MARK
2316         * used as opening single quotation mark in some languages
2317 201B    SINGLE HIGH-REVERSED-9 QUOTATION MARK
2318         = SINGLE REVERSED COMMA QUOTATION MARK
2319         * glyph variant of 2018
2320         x (modifier letter reversed comma - 02BD)
2321 201C    LEFT DOUBLE QUOTATION MARK
2322         = DOUBLE TURNED COMMA QUOTATION MARK
2323         * this is the preferred glyph (as opposed to 201F)
2324         x (quotation mark - 0022)
2325         x (heavy double turned comma quotation mark ornament - 275D)
2326         x (reversed double prime quotation mark - 301D)
2327 201D    RIGHT DOUBLE QUOTATION MARK
2328         = DOUBLE COMMA QUOTATION MARK
2329         x (quotation mark - 0022)
2330         x (double prime - 2033)
2331         x (heavy double comma quotation mark ornament - 275E)
2332         x (double prime quotation mark - 301E)
2333 201E    DOUBLE LOW-9 QUOTATION MARK
2334         = LOW DOUBLE COMMA QUOTATION MARK
2335         * used as opening double quotation mark in some languages
2336         x (low double prime quotation mark - 301F)
2337 201F    DOUBLE HIGH-REVERSED-9 QUOTATION MARK
2338         = DOUBLE REVERSED COMMA QUOTATION MARK
2339         * glyph variant of 201C
2340 2020    DAGGER
2341         = obelisk, obelus, long cross
2342 2021    DOUBLE DAGGER
2343         = diesis, double obelisk
2344 2022    BULLET
2345         = black small circle
2346         x (middle dot - 00B7)
2347         x (one dot leader - 2024)
2348         x (bullet operator - 2219)
2349         x (inverse bullet - 25D8)
2350         x (white bullet - 25E6)
2351 2023    TRIANGULAR BULLET
2352         x (end of proof - 220E)
2353         x (black right-pointing small triangle - 25B8)
2354 2024    ONE DOT LEADER
2355         x (middle dot - 00B7)
2356         x (bullet - 2022)
2357         x (bullet operator - 2219)
2358         # 002E full stop
2359 2025    TWO DOT LEADER
2360         # 002E 002E
2361 2026    HORIZONTAL ELLIPSIS
2362         = three dot leader
2363         x (vertical ellipsis - 22EE)
2364         # 002E 002E 002E
2365 2027    HYPHENATION POINT
2366 @               Formatting characters
2367 2028    LINE SEPARATOR
2368         * may be used to represent this semantic unambiguously
2369 2029    PARAGRAPH SEPARATOR
2370         * may be used to represent this semantic unambiguously
2371 202A    LEFT-TO-RIGHT EMBEDDING
2372         = LRE
2373 202B    RIGHT-TO-LEFT EMBEDDING
2374         = RLE
2375 202C    POP DIRECTIONAL FORMATTING
2376         = PDF
2377 202D    LEFT-TO-RIGHT OVERRIDE
2378         = LRO
2379 202E    RIGHT-TO-LEFT OVERRIDE
2380         = RLO
2381 202F    NARROW NO-BREAK SPACE
2382         x (no-break space - 00A0)
2383         # <noBreak> 0020
2384 @               General punctuation
2385 2030    PER MILLE SIGN
2386         x (percent sign - 0025)
2387 2031    PER TEN THOUSAND SIGN
2388         x (percent sign - 0025)
2389 2032    PRIME
2390         = minutes, feet
2391         x (apostrophe - 0027)
2392         x (acute accent - 00B4)
2393         x (modifier letter prime - 02B9)
2394 2033    DOUBLE PRIME
2395         = seconds, inches
2396         x (quotation mark - 0022)
2397         x (modifier letter double prime - 02BA)
2398         x (right double quotation mark - 201D)
2399         x (ditto mark - 3003)
2400         x (double prime quotation mark - 301E)
2401         # 2032 2032
2402 2034    TRIPLE PRIME
2403         # 2032 2032 2032
2404 2035    REVERSED PRIME
2405         x (grave accent - 0060)
2406 2036    REVERSED DOUBLE PRIME
2407         x (reversed double prime quotation mark - 301D)
2408         # 2035 2035
2409 2037    REVERSED TRIPLE PRIME
2410         # 2035 2035 2035
2411 2038    CARET
2412         x (up arrowhead - 2303)
2413 2039    SINGLE LEFT-POINTING ANGLE QUOTATION MARK
2414         = LEFT POINTING SINGLE GUILLEMET
2415         * usually opening, sometimes closing
2416         x (less-than sign - 003C)
2417         x (left-pointing angle bracket - 2329)
2418         x (left angle bracket - 3008)
2419 203A    SINGLE RIGHT-POINTING ANGLE QUOTATION MARK
2420         = RIGHT POINTING SINGLE GUILLEMET
2421         * usually closing, sometimes opening
2422         x (greater-than sign - 003E)
2423         x (right-pointing angle bracket - 232A)
2424         x (right angle bracket - 3009)
2425 203B    REFERENCE MARK
2426         = Japanese kome
2427         = Urdu paragraph separator
2428         x (tibetan ku ru kha bzhi mig can - 0FBF)
2429 203C    DOUBLE EXCLAMATION MARK
2430         x (exclamation mark - 0021)
2431         # 0021 0021
2432 203D    INTERROBANG
2433         x (exclamation mark - 0021)
2434         x (question mark - 003F)
2435 203E    OVERLINE
2436         = SPACING OVERSCORE
2437         # 0020 0305
2438 203F    UNDERTIE (Enotikon)
2439         = Greek enotikon
2440         x (smile - 2323)
2441 2040    CHARACTER TIE
2442         x (frown - 2322)
2443 2041    CARET INSERTION POINT
2444         * proofreader's mark: insert here
2445         x (right semidirect product - 22CC)
2446 2042    ASTERISM
2447 2043    HYPHEN BULLET
2448 2044    FRACTION SLASH
2449         = solidus (in typography)
2450         * for composing arbitrary fractions
2451         x (solidus - 002F)
2452         x (division slash - 2215)
2453 2045    LEFT SQUARE BRACKET WITH QUILL
2454 2046    RIGHT SQUARE BRACKET WITH QUILL
2455 2048    QUESTION EXCLAMATION MARK
2456         * designed for use in vertical text
2457         # 003F 0021
2458 2049    EXCLAMATION QUESTION MARK
2459         * designed for use in vertical text
2460         # 0021 003F
2461 204A    TIRONIAN SIGN ET
2462         * Irish Gaelic, ...
2463 204B    REVERSED PILCROW SIGN
2464         x (pilcrow sign - 00B6)
2465 204C    BLACK LEFTWARDS BULLET
2466 204D    BLACK RIGHTWARDS BULLET
2467 @               Deprecated
2468 206A    INHIBIT SYMMETRIC SWAPPING
2469 206B    ACTIVATE SYMMETRIC SWAPPING
2470 206C    INHIBIT ARABIC FORM SHAPING
2471 206D    ACTIVATE ARABIC FORM SHAPING
2472 206E    NATIONAL DIGIT SHAPES
2473 206F    NOMINAL DIGIT SHAPES
2474 @@      2070    Superscripts and Subscripts     209F
2475 @               Superscripts
2476 2070    SUPERSCRIPT ZERO
2477         # <super> 0030
2478 2071    <reserved>
2479         x (superscript one - 00B9)
2480 2072    <reserved>
2481         x (superscript two - 00B2)
2482 2073    <reserved>
2483         x (superscript three - 00B3)
2484 2074    SUPERSCRIPT FOUR
2485         # <super> 0034
2486 2075    SUPERSCRIPT FIVE
2487         # <super> 0035
2488 2076    SUPERSCRIPT SIX
2489         # <super> 0036
2490 2077    SUPERSCRIPT SEVEN
2491         # <super> 0037
2492 2078    SUPERSCRIPT EIGHT
2493         # <super> 0038
2494 2079    SUPERSCRIPT NINE
2495         # <super> 0039
2496 207A    SUPERSCRIPT PLUS SIGN
2497         # <super> 002B
2498 207B    SUPERSCRIPT MINUS
2499         # <super> 2212
2500 207C    SUPERSCRIPT EQUALS SIGN
2501         # <super> 003D
2502 207D    SUPERSCRIPT LEFT PARENTHESIS
2503         # <super> 0028
2504 207E    SUPERSCRIPT RIGHT PARENTHESIS
2505         # <super> 0029
2506 207F    SUPERSCRIPT LATIN SMALL LETTER N
2507         # <super> 006E
2508 @               Subscripts
2509 2080    SUBSCRIPT ZERO
2510         # <sub> 0030
2511 2081    SUBSCRIPT ONE
2512         # <sub> 0031
2513 2082    SUBSCRIPT TWO
2514         # <sub> 0032
2515 2083    SUBSCRIPT THREE
2516         # <sub> 0033
2517 2084    SUBSCRIPT FOUR
2518         # <sub> 0034
2519 2085    SUBSCRIPT FIVE
2520         # <sub> 0035
2521 2086    SUBSCRIPT SIX
2522         # <sub> 0036
2523 2087    SUBSCRIPT SEVEN
2524         # <sub> 0037
2525 2088    SUBSCRIPT EIGHT
2526         # <sub> 0038
2527 2089    SUBSCRIPT NINE
2528         # <sub> 0039
2529 208A    SUBSCRIPT PLUS SIGN
2530         # <sub> 002B
2531 208B    SUBSCRIPT MINUS
2532         # <sub> 2212
2533 208C    SUBSCRIPT EQUALS SIGN
2534         # <sub> 003D
2535 208D    SUBSCRIPT LEFT PARENTHESIS
2536         # <sub> 0028
2537 208E    SUBSCRIPT RIGHT PARENTHESIS
2538         # <sub> 0029
2539 @@      20A0    Currency Symbols        20CF
2540 @               Currency symbols
2541 @+              A number of currency symbols are found in other blocks.
2542                 x (dollar sign - 0024)
2543                 x (cent sign - 00A2)
2544                 x (pound sign - 00A3)
2545                 x (currency sign - 00A4)
2546                 x (yen sign - 00A5)
2547                 x (bengali rupee mark - 09F2)
2548                 x (bengali rupee sign - 09F3)
2549                 x (thai currency symbol baht - 0E3F)
2550                 x (khmer currency symbol riel - 17DB)
2551 20A0    EURO-CURRENCY SIGN
2552         * intended for ECU, but not widely used
2553         * historical character, this is NOT the euro!
2554         x (euro sign - 20AC)
2555 20A1    COLON SIGN
2556         * Costa Rica, El Salvador
2557 20A2    CRUZEIRO SIGN
2558         * Brazil
2559 20A3    FRENCH FRANC SIGN
2560         * France
2561 20A4    LIRA SIGN
2562         * Italy, Turkey
2563         x (pound sign - 00A3)
2564 20A5    MILL SIGN
2565         * USA (1/10 cent)
2566 20A6    NAIRA SIGN
2567         * Nigeria
2568 20A7    PESETA SIGN
2569         * Spain
2570 20A8    RUPEE SIGN
2571         * India
2572         # 0052 0073
2573 20A9    WON SIGN
2574         * Korea
2575 20AA    NEW SHEQEL SIGN
2576         * Israel
2577 20AB    DONG SIGN
2578         * Vietnam
2579 20AC    EURO SIGN
2580         * currency sign for the European Monetary Union
2581         * euro, not ECU
2582         x (euro-currency sign - 20A0)
2583 20AD    KIP SIGN
2584         * Laos
2585 20AE    TUGRIK SIGN
2586         * Mongolia
2587         * also transliterated as tugrug, tugric, tugrog, togrog
2588 20AF    DRACHMA SIGN
2589         * Greece
2590 @@      20D0    Combining Diacritical Marks for Symbols 20FF
2591 @               Combining diacritical marks for symbols
2592 20D0    COMBINING LEFT HARPOON ABOVE
2593 20D1    COMBINING RIGHT HARPOON ABOVE
2594         * vector
2595 20D2    COMBINING LONG VERTICAL LINE OVERLAY
2596 20D3    COMBINING SHORT VERTICAL LINE OVERLAY
2597         * negation
2598 20D4    COMBINING ANTICLOCKWISE ARROW ABOVE
2599 20D5    COMBINING CLOCKWISE ARROW ABOVE
2600         * rotation
2601 20D6    COMBINING LEFT ARROW ABOVE
2602 20D7    COMBINING RIGHT ARROW ABOVE
2603         * vector
2604 20D8    COMBINING RING OVERLAY
2605 20D9    COMBINING CLOCKWISE RING OVERLAY
2606 20DA    COMBINING ANTICLOCKWISE RING OVERLAY
2607 20DB    COMBINING THREE DOTS ABOVE
2608         = third derivative
2609 20DC    COMBINING FOUR DOTS ABOVE
2610         = fourth derivative
2611 @               Enclosing diacritics
2612 20DD    COMBINING ENCLOSING CIRCLE
2613         = JIS composition circle
2614         x (white circle - 25CB)
2615         x (large circle - 25EF)
2616         x (ideographic number zero - 3007)
2617 20DE    COMBINING ENCLOSING SQUARE
2618         x (white square - 25A1)
2619 20DF    COMBINING ENCLOSING DIAMOND
2620         x (white diamond - 25C7)
2621 20E0    COMBINING ENCLOSING CIRCLE BACKSLASH
2622         * prohibition
2623 @               Additional diacritical mark for symbols
2624 20E1    COMBINING LEFT RIGHT ARROW ABOVE
2625         * tensor
2626 @               Additional enclosing diacritics
2627 20E2    COMBINING ENCLOSING SCREEN
2628         x (clear screen symbol - 239A)
2629 20E3    COMBINING ENCLOSING KEYCAP
2630
2631 */
2632