実践! 異常検知と故障予測 IBM SPSS ModelerによるIoT時系列データ活用
小川 努・竹村 玄・堀 恵治・本田智則・河田 大・西牧洋一郎・牧野泰江 著

B5判変形 304頁 定価 3800円
ISBN 978-4-489-02385-9 C3040
2022年5月刊行
◎内容紹介
内容紹介…近年のIot機器の普及により、ビッグデータは集まる一方。これを活用するにはシステムに日常的に接して、理解している技術者が直接ビッグデータ解析を行うべき。Iotセンサーデータの癖の強さに苦しんでいる方、大規模時系列データのやりくりに悩むすべてのユーザーのために、SPSSガチ勢ユーザーが結集。インストール方法から基本操作・異常検知・故障予測・需要予測・データの前処理・移動体のデータ活用・予測モデルの運用についてのテクニックを惜しみなく公開した。
著者略歴:
小川 努(HONDA)
竹村 玄(JALエンジニアリング)
堀 恵治(JR東日本)
本田智則(国立研究開発法人産業技術総合研究所:産総研)
河田 大・西牧洋一郎・牧野泰江(IBM)
本書で使用している各データを、こちらからダウンロードすることができます。
【注意】
- ファイルは、通常の運用に関してはなんら問題のないことを確認していますが、運用はすべて自己責任で行うものとします。
- 運用の結果、万一損害が発生したとしても、著者および出版社はいかなる責任も負いません。
- サービスの供与などを行うことは固く禁じます。
■02385.zip
目次
第0章 基本的な使い方 1
0-1 SPSS Modelerの基本操作 2
0-1-1 SPSS Modelerとは 2
0-1-2 SPSS Modelerのインストール 2
0-1-3 SPSS Modelerの起動と画面構成 3
0-1-4 ストリームの作成と実行・保存 8
0-2 時系列データの加工でよく使う機能 15
0-2-1 特徴量を作成するフィールド作成ノード 15
0-2-2 時系列データの加工でよく使う関数 20
0-2-3 時系列データの加工でよく使うノード 29
0-3 時系列センサーデータの特徴量抽出 35
0-3-1 時系列センサーデータから生成する特徴量の特性 35
0-3-2 過去のセンサー値との差、比、傾き 37
0-3-3 過去からのセンサー値の累積値 39
0-3-4 状態やイベントの判定 40
0-3-5 目的変数の加工 45
第1章 異常を検知する 47
1-1 異常検知の目的と手法 48
1-1-1 時系列データに対する異常検知とは 48
1-1-2 異常検知の目的 48
1-1-3 異常検知の手法 49
1-1-4 特徴量を活用した異常検知 51
1-1-5 異常検知の業務適用における注意事項 52
1-2 異常検知の進め方 54
1-2-1 時系列ノードを活用した異常検知 54
1-2-2 TCMノードを活用した異常検知 61
1-2-3 機械学習を活用した異常検知 65
1-2-4 特徴量を活用した異常検知 71
1-3 実務で使える異常検知 76
1-3-1 データの理解と問題設定 76
1-3-2 データの準備 79
1-3-3 データの前処理 81
1-3-4 データの加工 87
1-3-5 繰り返し処理 89
第2章 故障を予測する 97
2-1 時系列データを用いた故障予測とは 98
2-1-1 時系列センサーデータから機械・設備の故障を予測する 98
2-1-2 過去に発生した故障から学習する 98
2-2 時系列データを用いた故障予測分析の進め方 100
2-2-1 分析対象となるデータを選定し、取得する 100
2-2-2 予測したい状態と検知条件を定義する 100
2-2-3 データをクレンジングした上で、可視化して観察する 103
2-2-4 故障の予兆となりうる特徴量を見つける 106
2-2-5 着目した特徴量を用いて故障予測モデルを作成する 113
2-2-6 モデルの精度を評価し、実運用可能かを検証する 124
2-2-7 実際に故障予測モニターを開始する 127
2-3 故障予測に利用する手法と留意点 129?
2-3-1 アンバランスなデータの処理 129?
2-3-2 モデルの汎化性能向上のための交差検証 134?
2-3-3 モデルの比較と自動モデリング 137?
第3章 需要を予測する 139
3-1 需要予測の目的と手法 140
3-1-1 需要予測が問われる真価 140
3-1-2 需要予測の目的 140
3-1-3 需要予測の方法と時系列統計モデル 142
3-1-4 数値予測モデルを用いた需要予測 144
3-1-5 過去の類似クラスタに当てはめ予測する 145
3-2 時系列統計モデルとAutoモデリング 147
3-3 機械学習を用いた時系列予測 160
3-3-1 特徴量を準備して数値予測モデルを作成する 160
3-3-2 数値予測モデルを評価する 165
3-3-3 将来の気象予報や計画を加えて予測する 168
第4章 時系列データを理解し データから新たな価値を発見する 171
4-1 本章の目的 172
4-2 ビッグデータを直接解析することの意味 174
4-3 時間データの取り扱い 176
4-3-1 時間データの種類 176
4-3-2 サンプルデータについて 177
4-3-3 データの読込 177
4-3-4 日時の加工 179
4-4 データ欠損の補完 186
4-4-1 時系列データ分析上の課題 「データそのものの欠損」 186
4-4-2 時系列分析において、なぜレコード欠損が問題なのか? 187
4-4-3 存在しないデータの補完 (データサイエンティスト以外がデータを分析する意義) 189
4-4-4 欠損データの処理 197
4-5 傾向の把握:移動平均を用いた可視化 205
4-6 システム理解の重要性 211
第5章 位置情報データを活用する 213
5-1 データの扱い方 214
5-1-1 精度 214
5-1-2 座標系 216
5-1-3 本章で扱うサンプルデータ 217
5-2 データの加工 218
5-2-1 座標系の変換 218
5.2.1.1 再投影ノードによる変換 218
5.2.1.2 拡張の変換ノード(R + sfパッケージ)による変換 223
5-3 データの可視化 227
5-3-1 散布図での可視化 227
5-3-2 地図上での可視化 229
5-3-3 「マップ可視化」ノードでの可視化 231
5-4 データの範囲抽出 235
5-4-1 座標での範囲抽出 235
5-4-2 シェープファイルでの範囲抽出 242
5-5 データの分析 246
5-5-1 移動距離/速度/加速度/角速度の算出 246
5-5-2 移動量の集計 249
第6章 予測モデルを業務で運用する 257
6-1 予測モデルの業務運用 258
6-1-1 予測モデルの業務運用 MLOps 258
6-1-2 MLOpsを実現するSPSS Collaboration And Deployment Services 259
6-2 業務連携 260
6-2-1 アプリケーション連携 260
6-2-1-1 バッチ・スコアリング 261
6-2-1-2 リアルタイム・スコアリング 264
6-2-1-3 アプリ組み込み(エッジ) 266
6-2-2 3つのアプリケーション連携方法の比較 267
6-2-3 アドホック・レポート 268
6-2-4 リファクタリング 269
6-2-5 ビジネス・ルール 272
6-3 レポジトリ 274
6-4 劣化検知とモデル更新 275
6-5 アーキテクチャー 276
6-5-1 開発・テスト環境と本番環境 276
6-5-2 高可用性構成 277
参考リンク
索引