ホームに戻る
出典 :
関連 :
目次 :
正規表現におけるひらがな、カタカナの判別
仮名文字を網羅的に判別するには、Unicodeの文字コード、または文字プロパティを用いる。
|
文字で範囲指定 |
コードで範囲指定 |
文字プロパティで指定 |
備考 |
| ひらがな |
すべて |
|
[\u3041-\u309F] |
\p{Hiragana} |
長音記号(ー)は含まれない |
| すべて(長音含む) |
|
[\u3041-\u309F\u30FC] |
[\p{Hiragana}\u30FC] |
|
| 特殊文字を除く |
[ぁ-ん] |
[\u3041-\u3093] |
|
長音記号(ー)は含まれない |
| 全角カタカナ |
すべて |
|
[\u30A0-\u30FF] |
\p{Katagana} |
|
| 特殊文字を除く |
[ァ-ヴー] |
[\u30A1-\u30F4\u30FC] |
|
|
付録 : 文字コード表(Unicode)
ひらがな
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
| U+304x | | ぁ | あ | ぃ | い | ぅ | う | ぇ | え | ぉ | お | か | が | き | ぎ | く |
| U+305x | ぐ | け | げ | こ | ご | さ | ざ | し | じ | す | ず | せ | ぜ | そ | ぞ | た |
| U+306x | だ | ち | ぢ | っ | つ | づ | て | で | と | ど | な | に | ぬ | ね | の | は |
| U+307x | ば | ぱ | ひ | び | ぴ | ふ | ぶ | ぷ | へ | べ | ぺ | ほ | ぼ | ぽ | ま | み |
| U+308x | む | め | も | ゃ | や | ゅ | ゆ | ょ | よ | ら | り | る | れ | ろ | ゎ | わ |
| U+309x | ゐ | ゑ | を | ん | ゔ | ゕ | ゖ | | | ゙ | ゚ |
゛ | ゜ | ゝ | ゞ | ゟ |
灰地は割り当てなし
U+3099 : 濁点(合成用)
U+309A : 半濁点(合成用)
U+309B : 濁点
U+309C : 半濁点
U+309D : 繰り返し記号
U+309E : 繰り返し記号(濁点)
U+309F : 合字「より」
全角カタカナ
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
| U+30Ax | ゠ | ァ | ア | ィ | イ | ゥ | ウ | ェ | エ | ォ | オ | カ | ガ | キ | ギ | ク |
| U+30Bx | グ | ケ | ゲ | コ | ゴ | サ | ザ | シ | ジ | ス | ズ | セ | ゼ | ソ | ゾ | タ |
| U+30Cx | ダ | チ | ヂ | ッ | ツ | ヅ | テ | デ | ト | ド | ナ | ニ | ヌ | ネ | ノ | ハ |
| U+30Dx | バ | パ | ヒ | ビ | ピ | フ | ブ | プ | ヘ | ベ | ペ | ホ | ボ | ポ | マ | ミ |
| U+30Ex | ム | メ | モ | ャ | ヤ | ュ | ユ | ョ | ヨ | ラ | リ | ル | レ | ロ | ヮ | ワ |
| U+30Fx | ヰ | ヱ | ヲ | ン | ヴ | ヵ | ヶ | ヷ | ヸ | ヹ | ヺ | ・ | ー | ヽ | ヾ | ヿ |
U+30A0 : ダブルハイフン
U+30F7 : ワに濁点
U+30F8 : ヰに濁点
U+30F9 : ヱに濁点
U+30FA : ヲに濁点
U+30FC : 長音記号
U+30FD : 繰り返し記号
U+30FE : 繰り返し記号(濁点)
U+30FF : 合字「コト」