ポケットリファレンスシリーズ正規表現ポケットリファレンス

[表紙]正規表現ポケットリファレンス

四六判/200ページ

定価(本体1,880円+税)

ISBN 4-7741-2671-3

ただいま弊社在庫はございません。

→学校・法人一括購入ご検討の皆様へ

書籍の概要

この本の概要

巨大なテキストファイルからデータを処理するときに,正規表現を使うと効率が良くなります。本書は,正規表現の代表的なメタキャラクタ,処理系ガイド,レシピ集,プチプログラム集を引きやすいリファレンス形式でまとめました。プログラマ必携の1冊です。

こんな方におすすめ

  • プログラマ
  • テキスト処理の効率をあげたい方

目次

第1章 正規表現概説

  • 正規表現とは
  • 正規表現の用途
  • 正規表現の概念

第2章 代表的なメタキャラクタ

  • 単一の文字にマッチするメタキャラクタ
    • 任意の文字にマッチ(.)
    • 単語を構成する文字にマッチ(\w)
    • 単語を構成する文字以外の文字にマッチ(\W)
    • 空白文字にマッチ(\s)
    • 空白文字以外の文字にマッチ(\S)
    • 数字にマッチ(\d)
    • 数字以外の文字にマッチ(\D)
  • 量指定子メタキャラクタ
    • 0回以上の繰り返しにマッチ(*)
    • 1回以上の繰り返しにマッチ(+)
    • n回の繰り返しにマッチ({n})
    • n回以上の繰り返しにマッチ({n,})
    • n回以上m回以下の繰り返しにマッチ({n,m})
    • 0回または1回の出現にマッチ(?)
  • 集合を表すメタキャラクタ
    • いずれかの文字にマッチ([●●●])
    • いずれかのパターンにマッチ(●●●:●●●)
  • 位置を表すメタキャラクタ
    • 文字列の先頭にマッチ(^)
    • 文字列の終端にマッチ($)
    • 単語境界にマッチ(\b)
    • 単語境界以外にマッチ(\B)
  • その他のメタキャラクタ
    • すでにマッチしたテキストにマッチ(\1,\2,\3,…)
    • エスケープ(\●)

第3章 ちょっと踏み込んだ話

  • 大文字と小文字を無視する
  • 日本語の扱い
  • 文字列リテラルのメタキャラクタ
  • 貪欲さ 〜 最長マッチと最短マッチ
  • モード
  • 行の概念
  • 丸括弧「()」の機能(グループ化とキャプチャ)
  • 前後読み

第4章 処理系別ガイド

  • Perl
    • Perlと正規表現
    • サポートされるメタキャラクタ
    • パターンマッチ演算子(m/●●●/) 〜パターンマッチングを行う
    • 置換演算子(s/●●●/●●●/) 〜マッチした箇所を別の文字列に置換する
    • 変換演算子(tr/●●●/●●●/) 〜文字を変換する
    • 文字列分割(split) 〜パターンを区切りとして文字列を分割する
    • 正規表現関係の特殊変数
    • 正規表現オペランド
    • 文字列リテラルのメタキャラクタ
    • 日本語の扱い
  • Java
    • Javaと正規表現
    • サポートされるメタキャラクタ
    • java.util.regex.Patternクラス
    • java.util.regex.Matcherクラス
    • java.lang.Stringクラス
    • java.util.regex.PatternSyntaxExceptionクラス
    • 検索の例
    • 置換の例
    • 文字列分割の例
    • 文字列リテラルのメタキャラクタ
    • 日本語の扱い
  • PHP
    • PHPと正規表現
    • サポートされるメタキャラクタ(PCRE関数)
    • POSIX拡張正規表現関数
    • PCRE関数(Perl互換の正規表現)
    • 文字列リテラルのメタキャラクタ
    • 日本語の扱い
  • Ruby
    • Rubyと正規表現
    • サポートされるメタキャラクタ
    • Regexpクラス
    • Stringクラス
    • MatchDataクラス
    • 正規表現関係の特殊変数
    • 文字列リテラルのメタキャラクタ
    • 日本語の扱い
  • JavaScript
    • JavaScriptと正規表現
    • サポートされるメタキャラクタ
    • RegExpオブジェクト
    • Stringオブジェクト
    • 文字列リテラルのメタキャラクタ
  • コマンドラインツール
    • grep
    • sed

第5章 正規表現レシピ集

  • 正規表現レシピの使い方
  • 英文中の単語にマッチ
  • 英文中の名詞にマッチ
  • HTMLタグにマッチ
  • 郵便番号にマッチ
  • 電話番号にマッチ
  • httpのURLにマッチ
  • メールアドレスにマッチ
  • IPアドレスにマッチ
  • 整数値にマッチ
  • 十進数値にマッチ
  • 16進数値にマッチ
  • パーセント値にマッチ
  • 偶数値にマッチ
  • カンマ区切り付きの数字にマッチ
  • 2005/10/4のような日付にマッチ
  • 18:30:00のような24時間制の時刻にマッチ
  • 2005/10/4 18:30:00のような日時にマッチ
  • 脆弱なパスワードにマッチ
  • ファイル名にマッチ
  • ファイルパスにマッチ
  • ファイル名の各要素を取り出す
  • 空行にマッチ
  • 空行以外の行にマッチ

第6章 プチ・プログラム集

  • 標準入力からのパターン検索
  • 置換フィルタ
  • 入力チェックを行う
  • 改行コードを統一する
  • 改行コードを<br>に変換する
  • 半角空白を に変換する
  • URLをHTMLのハイパーリンクにする
  • メールアドレスをHTMLのハイパーリンクにする
  • HTML特殊文字をエスケープする
  • テキストをHTMLに変換する
  • 定型文書の差し込み出力(テンプレートエンジン)
  • 数字に3桁区切りのカンマを付ける

著者プロフィール

宮前竜也(みやまえたつや)