-
seh
2010/6/30
テキトーです
-
匿名
2010/5/4
-
匿名
2010/3/4
-
Frozen
2010/2/11
グループ化を使用すると、() の中の正規表現がどのような文字列に一致したかが記録されます。(これをキャプチャされると言います。)
下の例では、左から1番目の () が 「チョコレート」に一致し、左から2番目の () が「100円」に一致しているので、
1:チョコレート
2:1...
-
Frozen
2010/2/10
グループ化された部分の中で | を使用すると、| によって区切られるのはグループ内に制限されます。
例えば、「大きな(犬|イヌ|dog)」は「大きな」の後に「犬」「イヌ」「dog」の3種類のいずれかの文字列が現れる部分に一致します。
-
Frozen
2010/2/9
() で囲む事で正規表現の一部をグループ化する事ができます。
グループ化された部分の後に繰り返し回数を表す {2} などを付けると、グループ全体を繰り返すことを表すようになります。
例えば、「([a-z][0-9]){3}」は正規表現「[a-z][0-9]」に一致する部分が3...
-
Frozen
2010/2/8
|で区切って複数の正規表現を記述すると、|で区切られた部分のいずれにも一致します。
例えば、「犬|イヌ|dog」は「犬」「イヌ」「dog」の3種類の文字列に一致します。
-
Frozen
2010/2/7
文字グループの内の最後に -[ ] と書くと、文字グループから -[ ] の中に書いた文字を除外します。
例えば、「[a-z-[c-x]]」は「aからzまで」の範囲から「cからxまで」の範囲を除外するので、a、b、y、zの4種類の文字を表します。
-
Frozen
2010/2/6
文字グループ内で ] を使用するには、] の代わりに \] と記述します。
「[ab\]]」はa、b、]の3種類の文字を表します。
-
Frozen
2010/2/5
文字グループの中では、*、+などのメタ文字は特別な意味をもたず、それぞれの文字そのものを表します。
一方、\n、\sなどは、文字グループの外で使われた時と同じ意味で使われます。
-
Frozen
2010/2/4
文字グループに - を含める場合は一番最初に記述します。
「-abc」は、-、a、b、cの4種類の文字に一致します。
-
Frozen
2010/2/3
文字グループでは複数の範囲を指定したり、範囲と個別の文字を組み合わせたりすることができます。
例えば、「[a-c3-5あいう]」は、a、b、c、3、4、5、あ、い、う の9種類の文字に一致します。
-
Frozen
2010/2/2
[ ] の中に a-d のように2つの文字を-でつなげて書くと、つなげた文字の範囲に一致するようになります。
例えば「[a-d]」は、a、b、c、dの4つの文字に一致します。
-
Frozen
2010/2/1
[ ]の中の最初に^があると、その後に書かれた文字以外に一致します。
例えば、「[^abcあいう]」は a、b、c、あ、い、うの6種類の文字以外に一致します。
-
Frozen
2010/1/31
[ ]の中に複数の文字を書くと、[] の中に書いた文字のいずれにも一致します。
例えば、「[abcあいう]」は a、b、c、あ、い、うの6種類の文字に一致します。
-
Frozen
2010/1/31
\、+、*など、特別な意味を持つ文字の前に\を付けると、\の後にある文字そのものを表すようになります。
例えば、「\*\\」は「*\」に一致します。
-
Frozen
2010/1/30
\tは水平タブを表します。
よって、「\taa」は水平タブとその直後の "aa" に一致します。
-
匿名
2010/1/29
-
Frozen
2010/1/29
\nは改行を表します。
よって、「\naa」は改行とその直後の文字列 "aa" に一致します。
-
匿名
2010/1/28
-
Frozen
2010/1/28
\Wは\wで一致する文字以外に一致します。
-
Frozen
2010/1/27
\wはアルファベット、数字、平仮名、漢字など、単語として使用される文字に一致します。
記号には一致しません。
-
CPU eater
2010/1/26
-
Frozen
2010/1/26
\Dはアラビア数字以外に一致します。
-
Frozen
2010/1/25
\dはアラビア数字に一致します。
-
Frozen
2010/1/24
\Sは空白以外に一致します。
例えば、「a\S」はaとその後に続く空白以外の文字に一致します。
-
Frozen
2010/1/23
\sは空白(スペース、タブ、改行)に一致します。
例えば、「a\sb」はaの後に空白が1つあり、その後にbがある部分に一致します。
-
Frozen
2010/1/23
.(ピリオド)は改行以外のあらゆる文字に一致します。
例えば、「a.」はaとその後に続く1文字に一致します。
-
匿名
2010/1/22
Unicodeのサロゲートペアに一致する正規表現。
\p{Cs}だけだと、サロゲートペアの半分にしか一致しないので{2}を付けています。
-
Frozen
2010/1/21
{m,n}は直前の文字をm回以上n回以下繰り返すことを表します。
例えば、「a{3,5}」はaを3回以上5回以下繰り返すことを表します。
-
Frozen
2010/1/13
{n}は直前の文字をn回以上繰り返すことを表します。
例えば、「a{5,}」はaを5回以上繰り返すことを表します。
-
Frozen
2010/1/9
{n}は直前の文字をn回繰り返すことを表します。
例えば、「a{5}」はaを5回繰り返すことを表します。
-
匿名
2010/1/7
-
poster
2010/1/6
-
Frozen
2010/1/6
?は直前の文字が現れても現れなくてもよいことを表します。
例えば、「ab?」は「a」又は「ab」に一致します。
-
Frozen
2010/1/4
+は直前の文字を1回以上繰り返すことを表します。
例えば、「ab+」はaの次にbが1回以上現れる文字列に一致します。
-
poster
2010/1/4
-
poster
2010/1/4
-
匿名
2010/1/3
-
匿名
2010/1/3
-
Frozen
2010/1/3
*は直前の文字を0回以上繰り返すことを表します。
例えば、「ab*」はaの次にbが0回以上現れる文字列に一致します。
-
Frozen
2010/1/3
正規表現では 「*」「+」「?」等の記号を使用して複雑なパターンの文字列を検索することができます。
このような記号をメタ文字を呼びます。
一方、メタ文字以外の文字はリテラル文字と呼ばれ、文字列そのものに一致します。
例えば、正規表現「みかん」は「みかん」という文字そのものに一...
-
Frozen
2010/1/3
タグ #正規表現の基礎 が付いた記事では、正規表現の基本的な使い方を解説します。
なお、正規表現レシピでは .Net Framework の正規表現を使用しています。
一部、他の言語の正規表現では使用できない表現も含まれています。
参考
.NET Framework の正規...
-
りんご
2010/1/3
-
りんご
2010/1/3
-
匿名
2010/1/2
年が2桁の日付には一致しますが、年が4桁の日付には一致しません。
-
匿名
2009/12/31
-
匿名
2009/12/30
-
Frozen
2009/12/28
ひらがなに一致する正規表現です。
ひらがなに続く濁点、半濁点、長音にも一致します。
-
Frozen
2009/12/28
カタカナに一致する正規表現です。
カタカナに続く濁点、半濁点、長音にも一致します。
-
Frozen
2009/12/28
全ての漢字にヒットする正規表現です。