Unicode 上付き文字・下付き文字

Web

Unicodeには上付き・下付きの文字も含まれているというのがTwitterで話題になっていました。HTMLなら<sup>や<sub>が使えるのですが、Twitterでは使えません。テキストだけで上付き・下付きできると数式や化学式を書くときに便利ですので、話題になるのも納得できます。

ax²+bx+c=0

Cu(OH)₂+4NH₃ → [Cu(NH₃)₄]²⁺+2OH⁻


ところが、ここにも麻雀牌と同じくフォント依存の問題があるのでした……


上付き数字・下付き数字のUnicode

0-9までの上付き・下付き数字のUnicodeは下表の通りです。ほとんどの文字は同じ領域(Superscripts and subscripts block)に並んでいるのですが、上付きの1〜3は別の領域(Latin-1 Supplement)にあり、不穏な空気が漂っています。

文字上付き文字下付き文字
0⁰ U+2070₀ U+2080
1¹ U+00B9₁ U+2081
2² U+00B2₂ U+2082
3³ U+00B3₃ U+2083
4⁴ U+2074₄ U+2084
5⁵ U+2075₅ U+2085
6⁶ U+2076₆ U+2086
7⁷ U+2077₇ U+2087
8⁸ U+2078₈ U+2088
9⁹ U+2079₉ U+2089



試しに Chrome上で自分自身にTwitter DMを送ってみました。案の定、1〜3だけ位置がずれています。


各種フォントを指定してみました

font-family: sans-serif;

⁰¹²³⁴⁵⁶⁷⁸⁹₀₁₂₃₄₅₆₇₈₉

font-family:’Apple Symbols’;

⁰¹²³⁴⁵⁶⁷⁸⁹₀₁₂₃₄₅₆₇₈₉

font-family:’Segoe UI Symbol’;

⁰¹²³⁴⁵⁶⁷⁸⁹₀₁₂₃₄₅₆₇₈₉

font-family:’Segoe UI Emoji’;

⁰¹²³⁴⁵⁶⁷⁸⁹₀₁₂₃₄₅₆₇₈₉

font-family: 'Noto Sans JP’, sans-serif;

⁰¹²³⁴⁵⁶⁷⁸⁹₀₁₂₃₄₅₆₇₈₉


麻雀牌と異なり大きく見え方が違うわけではないし、多くの環境ではSans Serifを指定しておけば良さそうです。それでもブログでは従来通り<sup>や<sub>を使うのが無難かな。

Web

Posted by ず@沖縄