ホームに戻る
出典 :
正規表現でのひらがな,全角カタカナ,半角カタカナの書き方 ? 伸ばし棒|僕らの適正技術
関連 :
目次 :

正規表現におけるひらがな、カタカナの判別

仮名文字を網羅的に判別するには、Unicodeの文字コード、または文字プロパティを用いる。
文字で範囲指定 コードで範囲指定 文字プロパティで指定 備考
ひらがな すべて [\u3041-\u309F] \p{Hiragana} 長音記号(ー)は含まれない
すべて(長音含む) [\u3041-\u309F\u30FC] [\p{Hiragana}\u30FC]
特殊文字を除く [ぁ-ん] [\u3041-\u3093] 長音記号(ー)は含まれない
全角カタカナ すべて [\u30A0-\u30FF] \p{Katagana}
特殊文字を除く [ァ-ヴー] [\u30A1-\u30F4\u30FC]

付録 : 文字コード表(Unicode)

ひらがな

0 1 2 3 4 5 6 7 8 9 A B C D E F
U+304x
U+305x
U+306x
U+307x
U+308x
U+309x
灰地は割り当てなし
U+3099 : 濁点(合成用)
U+309A : 半濁点(合成用)
U+309B : 濁点
U+309C : 半濁点
U+309D : 繰り返し記号
U+309E : 繰り返し記号(濁点)
U+309F : 合字「より」

全角カタカナ

0 1 2 3 4 5 6 7 8 9 A B C D E F
U+30Ax
U+30Bx
U+30Cx
U+30Dx
U+30Ex
U+30Fx
U+30A0 : ダブルハイフン
U+30F7 : ワに濁点
U+30F8 : ヰに濁点
U+30F9 : ヱに濁点
U+30FA : ヲに濁点
U+30FC : 長音記号
U+30FD : 繰り返し記号
U+30FE : 繰り返し記号(濁点)
U+30FF : 合字「コト」