Perlテキスト処理のエッセンス

Perlテキスト処理プログラミングと正規表現の入門書

概要

「Perlテキスト処理のエッセンス」は、テキスト処理の基本と実践をPerlプログラミング言語を使ってマスターするための書籍です。 テキスト処理というのは文章の中の文字を、検索したり置換したりする処理のことです。

「ファイルの中に書かれたこの文字を検索したい」「この文字を置換したい」「ファイルを読み込んで、別のファイルに書き出したい」。 Perlを使うと正規表現という機能を組み合わせてテキスト処理が簡単に書けるので、その方法をこの書籍にぎゅっとまとめました。

目次

第1章 Perlのインストール
1.1 WindowsへのPerlのインストール
1.1.1 Strawberry PerlのWebサイト
1.1.2 Strawberry Perlのダウンロード
1.1.3 Strawberry Perlのインストール
1.1.4 Perlがインストールされていることの確認
1.1.5 Windowsへのその他のPerlのインストール方法
1.2 コマンドプロンプトでPerlを実行する
1.2.1 コマンドプロンプトとは
1.2.2 コマンドプロンプトを実行するには
1.2.3 拡張子を表示する
1.2.4 Perlプログラムを作成する
1.2.5 Perlプログラムを実行する
1.2.6 ファイル一覧を表示する - dirコマンド
1.2.7 ディレクトリを作成する - mkdirコマンド
1.2.8 作業ディレクトリを変更する - cdコマンド
1.2.9 ドライブを変更する
1.2.10 コマンド履歴を参照する
1.2.11 補足:コマンドプロンプトとPowerShellの違い
1.3 MacへのPerlのインストール
1.3.1 ターミナルの起動
1.3.2 Perlがインストールされていることの確認
1.3.3 拡張子を表示する
1.3.4 Perlプログラムの作成
1.3.5 Perlプログラムの実行
1.3.6 Macでのその他のPerlのインストール方法
1.4 Linux/UNIXへのPerlのインストール
1.4.1 Perlがインストールされていることの確認
1.4.2 Perlプログラムの作成
1.4.3 Perlプログラムの実行
1.4.4 Linux/UNIXでのその他のPerlのインストール方法
1.5 覚えておきたいシェルコマンド
1.5.1 ファイル一覧を表示する - lsコマンド
1.5.2 ディレクトリを作成する - mkdirコマンド
1.5.3 作業ディレクトリを変更する - cdコマンド
第2章 日本語CSVファイル処理
2.1 日本語CSVファイル処理のプログラム
2.1.1 CSV形式の入力データファイル
2.1.2 CSVファイル処理の内容
2.1.3 予想される出力データ
2.1.4 日本語CSVファイル処理するPerlプログラム
2.2 画面に文字列を表示する
2.3 Perlの文法チェック
2.4 改行
2.5 コメント
2.5.1 1行コメント
2.5.2 複数行コメント
2.6 Perlの約束事
2.7 変数
2.7.1 変数宣言
2.7.2 有効な変数名
2.7.3 推奨される変数名
2.7.4 変数の宣言と初期化を同時に行う
2.8 数値
2.8.1 整数リテラル
2.8.2 浮動小数点リテラル
2.8.3 数値の計算
2.8.4 演算子の優先順位
2.8.5 数値計算のサンプルプログラム
2.9 文字列
2.9.1 シングルクォート文字列
2.9.2 ダブルクォート文字列
2.9.3 文字列の連結
2.9.4 文字列のサンプルプログラム
2.10 配列
2.10.1 配列とは
2.10.2 配列の要素の取得と設定
2.10.3 配列の要素の画面への出力
2.11 ハッシュ
2.11.1 ハッシュの宣言
2.11.2 ハッシュへの代入
2.11.3 ハッシュの値の取得と設定
2.12 if文を使った条件分岐
2.12.1 本の価格が1000円以下だったら
2.12.2 数値比較演算子
2.12.3 本の名前がPerlだったら
2.12.4 文字列比較演算子
2.12.5 本の名前にPerlを含んでいたら
2.13 繰り返し
2.13.1 for文
2.13.2 foreach文
2.13.3 while文
2.14 Perl標準関数
2.14.1 chomp関数 - 改行削除
2.14.2 OSに依存しないで改行コードを削除する方法
2.14.3 split関数 - 区切り文字を指定して配列に変換する
2.14.4 join関数 - 区切り文字で連結された文字列を取得
2.15 日本語処理
2.15.1 ソースコードはUTF-8で保存
2.15.2 「use utf8;」の記述
2.15.3 Encodeモジュール
2.15.4 ファイルから入力するときはdecode関数
2.15.5 ファイルへ出力するときはencode関数
2.15.6 日本語を出力するサンプル
2.16 ファイル入出力
2.16.1 リダイレクトを使ったファイルへの出力
2.16.2 ダイヤモンド演算子を使ったファイルからの入力
2.16.3 一般的なファイル入出力
2.17 最初のCSVファイル処理のサンプルをもう一度
第3章 正規表現で CSVファイルから 必要な行を取り出す
3.1 正規表現でCSVファイルから行を取り出す準備
3.2 検索条件を指定してみよう
3.2.1 書名にPerlが含まれている
3.2.2 書名がPerlで始まる
3.2.3 書名がPerlで終わる
3.2.4 Perlの大文字と小文字を区別せずに検索
3.2.5 書名にPerlまたはWebを含む
3.2.6 書名が「Web(なんでもよい一文字以上)Perl」を含む
3.2.7 価格が1000円以上、2000円より小さい
3.2.8 2018年から2019年の間に発売された
第4章 正規表現の 検索・置換を HTMLで実践
4.1 正規表現の検索・置換をHTMLで実践
4.1.1 見出しのテキストを取得する
4.1.2 見出しのテキストを取得する - 最短マッチ
4.1.3 HTMLからタグを削除する
4.1.4 前後の空白文字を取り除く
4.1.5 pタグで作られた複数行の段落から本文だけを取り出す
4.2 HTMLファイルを処理する
4.2.1 HTMLファイル全体を読み込む
4.2.2 すべてのバナナをリンゴに置換する
4.2.3 青リンゴ、赤リンゴ、黄リンゴの数を数える
4.2.4 全角数字を半角数字に変換する
4.2.5 小文字の単語を大文字の単語に変換する
4.2.6 すべての外部URLを取り出す
4.2.7 ファイル全部を読み込むより簡単な方法
第5章 多次元データ構造とJSONデータ入出力
5.1 JSONデータを入出力するサンプル
5.1.1 複数の書籍の情報を表現するJSONデータ
5.1.2 JSONデータフォーマットの解説
5.1.3 JSONデータを読み込んで、データを加工して、出力する
5.2 JSONを読み込むソースコードの解説
5.2.1 JSON::PPモジュールの読み込みと関数のインポート
5.2.2 JSONデータをファイルから読み込みPerlのデータ構造に変換する
5.2.3 Perlのデータ構造をJSONデータに変換する
5.3 リファレンス
5.3.1 配列リファレンスの作成
5.3.2 配列リファレンスを簡単に作成する
5.3.3 ハッシュのリファレンスの作成
5.3.4 ハッシュリファレンスを簡単に作成する
5.4 デリファレンス
5.4.1 スカラのデリファレンス
5.4.2 配列のデリファレンス
5.4.3 ハッシュのデリファレンス
5.5 リファレンスから要素にアクセスする
5.5.1 配列のリファレンスから要素を取得・設定する
5.5.2 ハッシュのリファレンスから要素を取得・設定する
5.6 データをダンプする
5.6.1 配列をダンプする
5.6.2 配列のリファレンスをダンプする
5.6.3 ハッシュをダンプする
5.6.4 ハッシュのリファレンスをダンプする
5.6.5 日本語のデータをダンプする
5.7 ハッシュの配列というデータ構造をPerlで表現する
5.7.1 ハッシュの配列というデータ構造の作成
5.7.2 ハッシュの配列をループする
5.8 演習問題: CSVファイル読込、正規表現で検索・置換、JSONデータ出力
5.8.1 CSVデータ形式の入力ファイル
5.8.2 JSONデータ形式の出力ファイル
5.8.3 演習問題の答え合わせ
5.9 Perlプログラミングの今後の目標
5.9.1 Linux/UNIXサーバー管理
5.9.2 Webシステム開発
5.10 サンプルコードのダウンロード

サンプルコード

書籍情報

  • 発行日 2021年6月1日 初版第1刷発行
  • 発行日 2021年7月6日 初版第2刷発行
  • 発行日 2022年1月27日 第2版第1刷発行
  • 著者 Perlクラブ
  • 装丁 MNdesign
  • 発行者・発行所 Perlクラブ(株)
  • 〒104-0061 東京都中央区銀座7丁目17番8号 銀座松良ビル5階
  • 電話 03-6281-5440
  • ページ数 120p
  • フルカラー