正規表現は、文字列のパターンを効率よく検索・抽出・置換するための強力なツールです。プログラミングやテキスト編集など幅広いシーンで活用されています。この記事では、正規表現の基本的な表現や記載方法をわかりやすくまとめます。
正規表現とは
正規表現(Regular Expression)は、複数の文字列パターンを一つの表現で表すことができる記法です。たとえば、「abc」と「adc」をまとめて「a.c」と表現できます。これにより、特定のルールに合致する文字列を一括で検索・抽出・置換できるようになります。
基本的な正規表現の表現と記載方法
よく使う正規表現の表現と記載方法を一覧で紹介します。
正規表現 | 意味・使い方 | 例 |
---|---|---|
. | 任意の1文字 | a.c (abc, adcなど) |
* | 直前の文字が0回以上繰り返す | ab*c (ac, abc, abbcなど) |
+ | 直前の文字が1回以上繰り返す | ab+c (abc, abbcなど) |
? | 直前の文字が0回または1回 | ab?c (ac, abc) |
{n} | 直前の文字がちょうどn回 | a{3} (aaa) |
{n,m} | 直前の文字がn回以上m回以下 | a{2,4} (aa, aaa, aaaa) |
^ | 行の先頭 | ^abc (行頭がabc) |
$ | 行の末尾 | abc$ (行末がabc) |
[] | 指定した文字のいずれか1文字 | [abc] (a, b, cのいずれか) |
“ | 指定した文字以外の1文字 | [^abc] (a, b, c以外) |
` | ` | または(OR) |
() | グループ化 | (abc)+ (abc, abcabcなど) |
\ | メタ文字の打ち消し | \. (ピリオドそのもの) |
よく使う正規表現の例
- 任意の数字3文字
\d{3}
- 英単語を構成する文字(半角英数字とアンダースコア)
\w
- 空白やタブなど
\s
- 特定の単語で始まる行
^start
- 特定の単語で終わる行
end$
- 特定の文字列を含まない行
^(?!.*stop).*$
正規表現の活用シーン
- ログファイルの特定パターン抽出
- テキストデータの一括置換
- 入力値のバリデーション(例:メールアドレスや電話番号のチェック)
まとめ
正規表現は、文字列操作を効率化するための強力な記法です。基本的な表現と記載方法を覚えるだけで、テキスト処理やデータ分析の幅が大きく広がります。まずはよく使うパターンから練習してみてください。
コメント