正規表現は、文字列のパターンを効率よく検索・抽出・置換するための強力なツールです。プログラミングやテキスト編集など幅広いシーンで活用されています。この記事では、正規表現の基本的な表現や記載方法をわかりやすくまとめます。
正規表現(Regular Expression)は、複数の文字列パターンを一つの表現で表すことができる記法です。たとえば、「abc」と「adc」をまとめて「a.c」と表現できます。これにより、特定のルールに合致する文字列を一括で検索・抽出・置換できるようになります。
よく使う正規表現の表現と記載方法を一覧で紹介します。
正規表現 | 意味・使い方 | 例 |
---|---|---|
. | 任意の1文字 | a.c (abc, adcなど) |
* | 直前の文字が0回以上繰り返す | ab*c (ac, abc, abbcなど) |
+ | 直前の文字が1回以上繰り返す | ab+c (abc, abbcなど) |
? | 直前の文字が0回または1回 | ab?c (ac, abc) |
{n} | 直前の文字がちょうどn回 | a{3} (aaa) |
{n,m} | 直前の文字がn回以上m回以下 | a{2,4} (aa, aaa, aaaa) |
^ | 行の先頭 | ^abc (行頭がabc) |
$ | 行の末尾 | abc$ (行末がabc) |
[] | 指定した文字のいずれか1文字 | [abc] (a, b, cのいずれか) |
“ | 指定した文字以外の1文字 | [^abc] (a, b, c以外) |
` | ` | または(OR) |
() | グループ化 | (abc)+ (abc, abcabcなど) |
\ | メタ文字の打ち消し | \. (ピリオドそのもの) |
\d{3}
\w
\s
^start
end$
^(?!.*stop).*$
正規表現は、文字列操作を効率化するための強力な記法です。基本的な表現と記載方法を覚えるだけで、テキスト処理やデータ分析の幅が大きく広がります。まずはよく使うパターンから練習してみてください。