東京図書株式会社

実践! 異常検知と故障予測 IBM SPSS ModelerによるIoT時系列データ活用

小川 努・竹村 玄・堀 恵治・本田智則・河田 大・西牧洋一郎・牧野泰江 著

B5判変形 304頁 定価 3800円
ISBN 978-4-489-02385-9 C3040
2022年5月刊行

◎内容紹介

内容紹介…近年のIot機器の普及により、ビッグデータは集まる一方。これを活用するにはシステムに日常的に接して、理解している技術者が直接ビッグデータ解析を行うべき。Iotセンサーデータの癖の強さに苦しんでいる方、大規模時系列データのやりくりに悩むすべてのユーザーのために、SPSSガチ勢ユーザーが結集。インストール方法から基本操作・異常検知・故障予測・需要予測・データの前処理・移動体のデータ活用・予測モデルの運用についてのテクニックを惜しみなく公開した。

著者略歴:

小川 努(HONDA)

竹村 玄(JALエンジニアリング)

堀 恵治(JR東日本)

本田智則(国立研究開発法人産業技術総合研究所:産総研)

河田 大・西牧洋一郎・牧野泰江(IBM)

本書で使用している各データを、こちらからダウンロードすることができます。
 【注意】

    1. ファイルは、通常の運用に関してはなんら問題のないことを確認していますが、運用はすべて自己責任で行うものとします。
    2. 運用の結果、万一損害が発生したとしても、著者および出版社はいかなる責任も負いません。
    3. サービスの供与などを行うことは固く禁じます。

目次

第0章 基本的な使い方 1

0-1 SPSS Modelerの基本操作 2

0-1-1 SPSS Modelerとは 2

0-1-2 SPSS Modelerのインストール 2

0-1-3 SPSS Modelerの起動と画面構成 3

0-1-4 ストリームの作成と実行・保存 8

0-2 時系列データの加工でよく使う機能 15

0-2-1 特徴量を作成するフィールド作成ノード 15

0-2-2 時系列データの加工でよく使う関数 20

0-2-3 時系列データの加工でよく使うノード 29

0-3 時系列センサーデータの特徴量抽出 35

0-3-1 時系列センサーデータから生成する特徴量の特性 35

0-3-2 過去のセンサー値との差、比、傾き 37

0-3-3 過去からのセンサー値の累積値 39

0-3-4 状態やイベントの判定 40

0-3-5 目的変数の加工 45

第1章 異常を検知する 47

1-1 異常検知の目的と手法 48

1-1-1 時系列データに対する異常検知とは 48

1-1-2 異常検知の目的 48

1-1-3 異常検知の手法 49

1-1-4 特徴量を活用した異常検知 51

1-1-5 異常検知の業務適用における注意事項 52

1-2 異常検知の進め方 54

1-2-1 時系列ノードを活用した異常検知 54

1-2-2 TCMノードを活用した異常検知 61

1-2-3 機械学習を活用した異常検知 65

1-2-4 特徴量を活用した異常検知 71

1-3 実務で使える異常検知 76

1-3-1 データの理解と問題設定 76

1-3-2 データの準備 79

1-3-3 データの前処理 81

1-3-4 データの加工 87

1-3-5 繰り返し処理 89

第2章 故障を予測する 97

2-1 時系列データを用いた故障予測とは 98

2-1-1 時系列センサーデータから機械・設備の故障を予測する 98

2-1-2 過去に発生した故障から学習する 98

2-2 時系列データを用いた故障予測分析の進め方 100

2-2-1 分析対象となるデータを選定し、取得する 100

2-2-2 予測したい状態と検知条件を定義する 100

2-2-3 データをクレンジングした上で、可視化して観察する 103

2-2-4 故障の予兆となりうる特徴量を見つける 106

2-2-5 着目した特徴量を用いて故障予測モデルを作成する 113

2-2-6 モデルの精度を評価し、実運用可能かを検証する 124

2-2-7 実際に故障予測モニターを開始する 127

2-3 故障予測に利用する手法と留意点 129?

2-3-1 アンバランスなデータの処理 129?

2-3-2 モデルの汎化性能向上のための交差検証 134?

2-3-3 モデルの比較と自動モデリング 137?

第3章 需要を予測する 139

3-1 需要予測の目的と手法 140

3-1-1 需要予測が問われる真価 140

3-1-2 需要予測の目的 140

3-1-3 需要予測の方法と時系列統計モデル 142

3-1-4 数値予測モデルを用いた需要予測 144

3-1-5 過去の類似クラスタに当てはめ予測する 145

3-2 時系列統計モデルとAutoモデリング 147

3-3 機械学習を用いた時系列予測 160

3-3-1 特徴量を準備して数値予測モデルを作成する 160

3-3-2 数値予測モデルを評価する 165

3-3-3 将来の気象予報や計画を加えて予測する 168

第4章 時系列データを理解し データから新たな価値を発見する 171

4-1 本章の目的 172

4-2 ビッグデータを直接解析することの意味 174

4-3 時間データの取り扱い 176

4-3-1 時間データの種類 176

4-3-2 サンプルデータについて 177

4-3-3 データの読込 177

4-3-4 日時の加工 179

4-4 データ欠損の補完 186

4-4-1 時系列データ分析上の課題 「データそのものの欠損」 186

4-4-2 時系列分析において、なぜレコード欠損が問題なのか? 187

4-4-3 存在しないデータの補完 (データサイエンティスト以外がデータを分析する意義) 189

4-4-4 欠損データの処理 197

4-5 傾向の把握:移動平均を用いた可視化 205

4-6 システム理解の重要性 211

第5章 位置情報データを活用する 213

5-1 データの扱い方 214

5-1-1 精度 214

5-1-2 座標系 216

5-1-3 本章で扱うサンプルデータ 217

5-2 データの加工 218

5-2-1 座標系の変換 218

5.2.1.1 再投影ノードによる変換 218

5.2.1.2 拡張の変換ノード(R + sfパッケージ)による変換 223

5-3 データの可視化 227

5-3-1 散布図での可視化 227

5-3-2 地図上での可視化 229

5-3-3 「マップ可視化」ノードでの可視化 231

5-4 データの範囲抽出 235

5-4-1 座標での範囲抽出 235

5-4-2 シェープファイルでの範囲抽出 242

5-5 データの分析 246

5-5-1 移動距離/速度/加速度/角速度の算出 246

5-5-2 移動量の集計 249

第6章 予測モデルを業務で運用する 257

6-1 予測モデルの業務運用 258

6-1-1 予測モデルの業務運用 MLOps 258

6-1-2 MLOpsを実現するSPSS Collaboration And Deployment Services 259

6-2 業務連携 260

6-2-1 アプリケーション連携 260

6-2-1-1 バッチ・スコアリング 261

6-2-1-2 リアルタイム・スコアリング 264

6-2-1-3 アプリ組み込み(エッジ) 266

6-2-2 3つのアプリケーション連携方法の比較 267

6-2-3 アドホック・レポート 268

6-2-4 リファクタリング 269

6-2-5 ビジネス・ルール 272

6-3 レポジトリ 274

6-4 劣化検知とモデル更新 275

6-5 アーキテクチャー 276

6-5-1 開発・テスト環境と本番環境 276

6-5-2 高可用性構成 277

参考リンク

索引