正規表現は、文字列のパターンを効率よく検索・抽出・置換するための強力なツールです。プログラミングやテキスト編集など幅広いシーンで活用されています。この記事では、正規表現の基本的な表現や記載方法をわかりやすくまとめます。
正規表現(Regular Expression)は、複数の文字列パターンを一つの表現で表すことができる記法です。たとえば、「abc」と「adc」をまとめて「a.c」と表現できます。これにより、特定のルールに合致する文字列を一括で検索・抽出・置換できるようになります。
よく使う正規表現の表現と記載方法を一覧で紹介します。
| 正規表現 | 意味・使い方 | 例 |
|---|---|---|
. | 任意の1文字 | a.c(abc, adcなど) |
* | 直前の文字が0回以上繰り返す | ab*c(ac, abc, abbcなど) |
+ | 直前の文字が1回以上繰り返す | ab+c(abc, abbcなど) |
? | 直前の文字が0回または1回 | ab?c(ac, abc) |
{n} | 直前の文字がちょうどn回 | a{3}(aaa) |
{n,m} | 直前の文字がn回以上m回以下 | a{2,4}(aa, aaa, aaaa) |
^ | 行の先頭 | ^abc(行頭がabc) |
$ | 行の末尾 | abc$(行末がabc) |
[] | 指定した文字のいずれか1文字 | [abc](a, b, cのいずれか) |
| “ | 指定した文字以外の1文字 | [^abc](a, b, c以外) |
| ` | ` | または(OR) |
() | グループ化 | (abc)+(abc, abcabcなど) |
\ | メタ文字の打ち消し | \.(ピリオドそのもの) |
\d{3}\w\s^startend$^(?!.*stop).*$正規表現は、文字列操作を効率化するための強力な記法です。基本的な表現と記載方法を覚えるだけで、テキスト処理やデータ分析の幅が大きく広がります。まずはよく使うパターンから練習してみてください。