このページの目次
InDesignでよく使う正規表現をまとめておきます。
下記に自分がよく使う検索パターンを書いていますので、コピペで使ってください。
正規表現は、検索パレットの正規表現タブ、それと段落スタイル設定内の正規表現スタイルがありますが、どちらも同じような使い方ができます。
自分は検索パレットで検索で正確にマッチしたら、段落スタイルの正規表現に使ったりもします。
また段落スタイルの正規表現は検索のみ。検索置換はできませんので、ご了承ください。
正規表現とか聞くと会社の方々でも二の足を踏むのですが、実はそんなに難しいわけではありません。
まあ、自分もごく一部しか使っていませんので、全てを知る必要は無いと思います。
迷ったときに検索するなどで少しづつスキルアップしていけばね。
コピペで使ってくださいな。
検索パレットの正規表現
検索パレットの正規表現タブをクリックすると使えます。
それで、検索文字列、置換文字列、それぞれの横にある@ボタンを触ると、
こんなのが出てきます。
このあたりはAdobe側でよく使うだろうなと想定したものを入れたんだと思います。
でも実際には、一番良く使う「.+?」(最短マッチ)、「^」(行頭)、「$」(行末)などはありませんが、操作的には選択しやすいので「一応ここにあるかも」っていう認識だけでも持っていれば良いかもしれませんね。
【例文サンプル】よく使う正規表現集
括弧の検索置換(「あああ」→【あああ】に切り替える)
たとえば、「あああ」→【あああ】に切り替えたいときには、
検索文字:「(.+?)」
置換文字:【$1】
とします。「」と【】は普通の文字として入力し、
()(半角かっこ)は正規表現ではグループというのですが、
このような使い方の場合には、検索した検索文字列の()(グループ内の文字)一部を、置換文字列で$1で呼び出して使えるようです。
$1は、.+?(最短マッチ)で呼び出した文字列(.+?は何でも引っかかる暗号的な認識でも良いです)を()(グループ)で囲んだ1つ目を呼び出す($1)を使っています。
()の中身を呼び出すときに$1、または$0。
()が複数あるときには、$1、$2、$3・・・、という感じで、呼び出しても良いです。
$0は、$1、$2、$3・・・など、すべてをまとめて拾って来ます。
括弧のトルツメ(「あああ」→あああに切り替える)
括弧をトルツメしたいときには、
検索文字:「(.+?)」
置換文字:$1
とします。
こちらは特別説明いらないと思いますが、単純にグループ内の文字のみを結果として吐き出しています。
色々な括弧をまとめて変更(「あああ」や(あああ)→【あああ】に切り替える)
色々な括弧を一括で検索置換したいときには、
検索文字:[\’\”‘“”\[[「『【\((\<<](.+?)[\’\”’”\]]」』】\))\>>]
置換文字:【$1】
とします。
こちらは、[](半角かっこ)で囲んだ、色々なかっこのどれか一つでもあれば、検索してきます。
(あああ)でも、「あああ)でも、”あああ’でも引っかかりますので、
自分はチェック用に検索文字列のみ入力して使ったりします。
※足りないものもあるかもしれませんが、その際には足して使用してください。
ちなみに補足説明しますと、[]内に、\’や、\”がありますが、正規表現で使う特殊文字のことを(メタ文字)と呼びます。メタ文字は、すべて半角記号なのですが、. ^ $ [ ] * + ? | ( ) –などがメタ文字です。
検索文字列にメタ文字とバッティングする文字を入力したい場合には、\.や、\$と入力します。
これはバックスラッシュシーケンスとか言うのだとか。
よくわからなくてもいいですが、メタ文字に該当する半角記号を入力する場合には、\(バックスラッシュ キーボードの半角¥記号)を入力するようにしましょう。
ちなみに上の、\’や、\”は、javaScriptとかの文字列入力のくせが出てしまっているみたいですね。実際には、不要かもしれません。
半角記号を入力しても検索に引っかからない場合は、バックスラッシュを入れる。とおぼえてください。
行頭スペースなど
検索文字:^\s+(.+?)、置換文字は何も入れない(からの状態)。
とします。
ちょっと特殊になってきたので説明しますと、
^(行頭)
\s(空白文字[ \t\r\n]と同じ)半角スペース、タブ、シフトエンター、エンター
+(前の文字が複数)
となり、行頭にスペースやタブや改行などがあれば検索して、その後ろの文字を入れます。
ただ、改行などが入ってしまって使い勝手が悪いため、以下のほうが良いかと。
検索文字:^[ ~S\t\/]+、置換文字には何も入れない(からの状態)。
これなら改行関連を外してありますので、半角スペース、全角スペース、非分離スペース、タブ、スラッシュが行頭にある場合に引っかかります。
ハイフンとかも足しても良いでしょうね。その場合には[]の中身に\-を追加します。
一応怖いので、一つ一つチェックしながら削除していきましょう。
行末スペースをトルツメ
検索文字:[ ~S\t]+$、置換文字には何も入れない(からの状態)。
とします。
行頭と異なる点は、スラッシュは行末にあっても問題ないので外し、$(行末)が行末記号です。
こちらも怖いので、一つ一つチェックしながら削除していきましょう。
改行が2つ以上
検索文字:[\r\n~M]+、置換文字には何も入れない(からの状態)。
とします。
いらない改行は削除するよねぇ。
一つ一つチェックしながら削除していきましょう。