東京図書株式会社

Pythonによる経済・経営分析のためのデータサイエンス ~分析の基礎から因果推論まで~

原 泰史 著

B5判変形 320頁 定価 3520円
ISBN 978-4-489-02350-7 C0040
2021年2月刊行

◎データを活用しビジネスや経済行動を日々ダイナミックに変化させる!

「データサイエンス」という言葉の先には、データを活用しビジネスや経済行動を日々ダイナミックに変化させる未来が待っている。本書は、プログラミング言語 Python を用いたデータ分析の技法について、その実行環境の構築からデータの取得および整理、基礎的な統計的分析の手法から、機械学習や因果推論の技法について包括的かつ具体的なコーディング方法までを紹介。また、Python によるコーディング時に起こる様々な疑問を解決する “困ったときの逆引き事典”も掲載した。

原 泰史(はら やすし) 

1982年 愛知県みよし市生まれ
2002年 株式会社クララオンライン
2009年 日本学術振興会 特別研究員DC1
2012年 一橋大学イノベーション研究センター特任助手
2015年 政策研究大学院大学科学技術イノベーション研究センター(GRIPS SciREXセンター)専門職
2018年 パリ社会科学高等研究院日仏研究センター(CEAFJP/EHESS)ミシュランフェロー
現在、一橋大学大学院経済学研究科特任講師。および、学習院大学非常勤講師。
早稲田大学、政策研究大学院大学、関西学院大学、HR総研客員研究員

専門は、産業組織論。イノベーションプロセスの定量的分析
主要な業績に、
・Who explores further? Evidence on R&D outsourcing fromthe survey of research and development
(2020年, R&D Management)
・DrugDiscovery in Japan (2019年, Springer)
・20 Years of Human Pluripotent StemCell Research: It All Started with Five Lines
(2018年, Cell Stem Cell)など

第1章 経済・経営分析のためのデータサイエンス
1.1 データサイエンスと社会科学で出来ること
1.2 理論と実践をつなげるには
1.3 本書のねらいと構成
1.4 Pythonとは?
1.5 統計ソフトの比較
1.6 本書で扱う事例について
1.7 本書の読み進め方
1.8 さらなる学習のために

 

第2章 はじめの一歩, Pythonを使ってみよう
2.1 Jupyter Notebook, Jupyter LabおよびSpyderのインストール
2.1.1 Jupyter Labの起動
2.1.2 Jupyter Notebookの起動
2.1.3 Spyderの起動方法
2.2 Google Colaboratoryへのアクセスと、画面の見方
2.3 サンプルデータを読み込む-はじめの一歩

 

第3章 Pythonを使ってデータを集めよう
3.1 データを「つくる」-Webスクレイピング
3.1.1 緊急事態宣言下のパチンコホールの営業状況を調べる
3.1.2 COVID-19に関連する支援状況を把握する
3.2 データで「まなぶ」-Kaggleとデータセット
3.3 データを「つかう」(1) -政府統計データ
Column 法人番号で宮城県の企業の数をカウントしてみる
3.4 データを「つかう」(2) -Linked Open Data
Column EDINETからデータを取得する
3.5 データを保存して、Excelなどで使えるようにする
Column データの可用性とプライバシー
練習問題

 

第4章Pythonによる基礎的な統計分析
4.1 Pythonによる基礎的な統計分析
4.2 データを把握する(1) -型や特性を把握する
4.3 データを把握する(2) -平均、分散、標準偏差を求める
4.4 データを把握する(3) -ヒストグラムを書く
4.5 データを把握する(4) -変数間の関係性
4.6 作業結果を保存する
4.7 データを把握する(5) -データの可視化手法; ploty, D3.js
練習問題

 

第5章 Pythonによる多変量解析-クロスセクション・パネルデータ
5.1 回帰分析の考え方-最小二乗法
5.2 データの種類-クロスセクション・時系列データ・パネルデータ
5.2.1 クロスセクションデータ
5.2.2 時系列データ
5.2.3 パネルデータ
5.3 回帰分析(1)単回帰分析
5.4 回帰分析(2)ダミー変数と重回帰分析
5.5 回帰分析(3)分析結果の解釈の方法
Column Airbnbの価格分析-空間情報の活用
5.5.1 geocodingに必要なパッケージをインストールする
5.5.2 ランドマークの位置情報を取得する
5.5.3 ランドマークと、Airbnbホストとの距離を測る
5.5.4 散布図やヒストグラムを求める
5.5.5 地図上にプロットする
5.5.6 回帰分析を行う
5.6 回帰分析(4)操作変数法
5.7 パネルデータ分析(1)データ構築
5.8 パネルデータ分析(2) Pooled OLS
5.9 パネルデータ分析(3)固定効果モデル
5.10 パネルデータ分析(4)変動効果モデル
5.11 パネルデータ分析(5)モデルの比較
練習問題

 

第6章 応用編;機械学習と因果推論とテキスト分析
6.1 応用編;機械学習と因果推論とテキスト分析
6.2 機械学習(1)決定木分析
6.3 機械学習(2) SVM
6.4 機械学習(3) SGDRegressor
6.5 機械学習(4)スパース推定(Lasso)
6.6 リッジ推定(Ridge)
6.7 モデルの比較
6.8 因果推論(1)傾向スコアマッチング(PSM)
6.9 因果推論(2)回帰非連続デザイン
6.10 テキスト分析(1) Twitterからデータを取得し、Mecabで分かち書きをする
6.11 テキスト分析(2) Wordcloud
Column 社会科学の違いを「測る」 -Linked Open Dataを使ったテキスト分析
6.12 テキスト分析(3) word2vecモデル
6.13 テキスト分析(4)トピックモデル
6.14 さいごに

 

困ったときの逆引き事典
① Pythonで基本的なプログラミング構文を学ぶ
1 標準出力
2 数値演算
3 データ型の変換
4 for文
5 enumerate文
6 zip文
7 enumerateとzip文を一緒に使う
8 for文を用いた多重ループ
9 itertoolsを使った多重ループ
10 if文
11 論理演算子
12 while文
13 無限ループと例外処理276
② Pythonでの基本的な数理計算
1 四則演算
2 三角関数とMathパッケージ
3 ベクトルの計算
4 行列の計算2845Pandasを使った処理
③ pipでパッケージを導入する
④ パッケージのバージョンを確認する
⑤ エラーコードの対処方法
1 Name is Not Definedな場合
2 数字を文字列で割っている場合
3 砂山からダイヤモンドを探す方法(エラーの倒し方)

索 引

本書で扱っているサンプルデータおよびNotebookは以下の著者のWebページよりダウンロードできます。