文字数カウンター
このツールについて
使い方
テキストを入力すると、文字数・バイト数・行数をリアルタイムで計測します。
バイト数の計算方法
UTF-8 エンコーディングでのバイト数を表示しています。半角英数字は1バイト、日本語の全角文字は通常3バイトです。
文字数0
文字数(空白を除く)0
バイト数(UTF-8)0
行数0
豆知識
「文字数」の定義は一つではない
「文字数」と一口に言っても、数え方はさまざまです。 改行を含むか、スペースを含むか、全角と半角を区別するかなど、 用途によって定義が異なります。 X (旧 Twitter) の文字数制限は Unicode コードポイントの加重カウント方式で、日本語は1文字が2としてカウントされますが、 SMS では文字コード (GSM 7-bit / UCS-2) によって上限が変わります。
Unicode と文字数の複雑な関係
絵文字の「👨👩👧👦」(家族) は見た目は1文字ですが、 内部では7つの Unicode コードポイント (4人の絵文字 + 3つの結合文字) で構成されています。 JavaScript の .length ではさらに大きな数値になります。 正確な「見た目の文字数」を数えるには Intl.Segmenter API が有効です。
各サービスの文字数制限
- X (旧 Twitter): 基本140文字 → 2017年に280カウントに拡大 (日本語は1文字=2カウントのため実質140文字が上限)
- SMS: GSM 7-bit なら160文字、日本語 (UCS-2) は70文字
- HTML meta description: Google 検索結果に表示されるのは約120文字 (日本語) が目安
参考リンク
- Unicode Standard - The Unicode Consortium
Unicode の公式仕様書 (コードポイント・正規化・結合文字)
- Intl.Segmenter - JavaScript MDN
絵文字などを考慮した「書記素クラスター」単位で文字を数える API
- UTF-8 - Wikipedia
UTF-8 のバイトエンコーディング仕様 (1〜4バイト可変長)
このツールの更新履歴
文字数カウンターを公開
テキストの文字数・バイト数・行数をリアルタイムで計測します。