テキスト文字変換
このツールについて
使い方
- 変換したいテキストを入力欄に貼り付けます
- 実行したい変換ボタンをクリックします
- 変換結果をコピーボタンで取得できます
対応する変換
- 全角 ↔ 半角: 英数字・記号・スペースの全角/半角を変換します
- 全角カタカナ ↔ 半角カタカナ: 濁点・半濁点付き文字にも対応しています
- カタカナ ↔ ひらがな: カタカナとひらがなを相互変換します
- 大文字 ↔ 小文字: 英字の大文字/小文字を変換します
全角と半角の歴史
日本のコンピュータ史において、半角文字は JIS X 0201 (1969年制定) で定義された1バイト文字、 全角文字は JIS X 0208 (1978年制定) で定義された2バイト文字に由来します。 「全角」「半角」という呼び名は、固定幅フォントで全角文字が半角文字の2倍の幅を占めることから生まれました。 Unicode では全角・半角の区別なく統一的にコードポイントが割り当てられていますが、 互換性のために全角形 (U+FF01〜U+FF5E) と半角形 (U+FF65〜U+FF9F) も収録されています。
Unicode のカタカナ領域
Unicode ではカタカナに複数のブロックが割り当てられています。 全角カタカナは U+30A0〜U+30FF (Katakana ブロック)、 半角カタカナは U+FF65〜U+FF9F (Halfwidth Katakana Forms) に配置されています。 ひらがなは U+3040〜U+309F (Hiragana ブロック) にあり、 全角カタカナとの間には 0x60 のオフセットがあるため、 コードポイントの加減算だけで相互変換が可能です。
半角カタカナの功罪
半角カタカナは、1バイトで表現できるため携帯電話の SMS や初期のメールシステムでバイト数の節約に重宝されました。 しかし、半角カタカナには濁点・半濁点が独立した文字として扱われる (「ガ」が「ガ」の2文字になる) という特殊な構造があり、 文字数カウントや文字列検索で予期しない結果を招くことがあります。 現代のシステムでは文字化けや互換性問題の原因となるため、 全角カタカナへの統一が推奨されています。
- Halfwidth and Fullwidth Forms - Unicode
半角・全角形 (U+FF00〜U+FFEF) の Unicode 公式チャート
- String.prototype.toLowerCase() - MDN
JavaScript の大文字・小文字変換メソッド
- String.prototype.normalize() - MDN
Unicode 正規化 (NFC/NFD/NFKC/NFKD) で半角全角を統一する方法