新刊書


刊行】
 





■著者紹介:
原 泰史(はら やすし)

1982年 愛知県みよし市生まれ
2002年 株式会社クララオンライン
2009年 日本学術振興会 特別研究員DC1
2012年 一橋大学イノベーション研究センター特任助手
2015年 政策研究大学院大学科学技術イノベーション研究センター(GRIPS SciREXセンター)専門職
2018年 パリ社会科学高等研究院日仏研究センター(CEAFJP/EHESS)ミシュランフェロー
現在、一橋大学大学院経済学研究科特任講師。および、学習院大学非常勤講師。
早稲田大学、政策研究大学院大学、関西学院大学、HR総研客員研究員

専門は、産業組織論。イノベーションプロセスの定量的分析
主要な業績に、
・Who explores further? Evidence on R&D outsourcing fromthe survey of research and development
(2020年, R&D Management)
・DrugDiscovery in Japan (2019年, Springer)
・20 Years of Human Pluripotent StemCell Research: It All Started with Five Lines
(2018年, Cell Stem Cell)など


■内容紹介




本書で扱っているサンプルデータおよびNotebookは以下の著者のWebページよりダウンロードできます。
原泰史(YASUSHI HARA) のWebページ:
https://sites.google.com/view/yasushihara


■目次

第1章 経済・経営分析のためのデータサイエンス
1.1 データサイエンスと社会科学で出来ること
1.2 理論と実践をつなげるには
1.3 本書のねらいと構成
1.4 Pythonとは?
1.5 統計ソフトの比較
1.6 本書で扱う事例について
1.7 本書の読み進め方
1.8 さらなる学習のために

第2章 はじめの一歩, Pythonを使ってみよう
2.1 Jupyter Notebook, Jupyter LabおよびSpyderのインストール
 2.1.1 Jupyter Labの起動
 2.1.2 Jupyter Notebookの起動
 2.1.3 Spyderの起動方法
2.2 Google Colaboratoryへのアクセスと、画面の見方
2.3 サンプルデータを読み込む-はじめの一歩

第3章 Pythonを使ってデータを集めよう
3.1 データを「つくる」-Webスクレイピング
 3.1.1 緊急事態宣言下のパチンコホールの営業状況を調べる
 3.1.2 COVID-19に関連する支援状況を把握する
3.2 データで「まなぶ」-Kaggleとデータセット
3.3 データを「つかう」(1) -政府統計データ
 Column 法人番号で宮城県の企業の数をカウントしてみる
3.4 データを「つかう」(2) -Linked Open Data
 Column EDINETからデータを取得する
3.5 データを保存して、Excelなどで使えるようにする
 Column データの可用性とプライバシー
練習問題

第4章Pythonによる基礎的な統計分析
4.1 Pythonによる基礎的な統計分析
4.2 データを把握する(1) -型や特性を把握する
4.3 データを把握する(2) -平均、分散、標準偏差を求める
4.4 データを把握する(3) -ヒストグラムを書く
4.5 データを把握する(4) -変数間の関係性
4.6 作業結果を保存する
4.7 データを把握する(5) -データの可視化手法; ploty, D3.js
練習問題

第5章 Pythonによる多変量解析-クロスセクション・パネルデータ
5.1 回帰分析の考え方-最小二乗法
5.2 データの種類-クロスセクション・時系列データ・パネルデータ
 5.2.1 クロスセクションデータ
 5.2.2 時系列データ
 5.2.3 パネルデータ
5.3 回帰分析(1)単回帰分析
5.4 回帰分析(2)ダミー変数と重回帰分析
5.5 回帰分析(3)分析結果の解釈の方法
 Column  Airbnbの価格分析-空間情報の活用
 5.5.1 geocodingに必要なパッケージをインストールする
 5.5.2 ランドマークの位置情報を取得する 
 5.5.3 ランドマークと、Airbnbホストとの距離を測る
 5.5.4 散布図やヒストグラムを求める
 5.5.5 地図上にプロットする
 5.5.6 回帰分析を行う
5.6 回帰分析(4)操作変数法
5.7 パネルデータ分析(1)データ構築
5.8 パネルデータ分析(2) Pooled OLS
5.9 パネルデータ分析(3)固定効果モデル
5.10 パネルデータ分析(4)変動効果モデル
5.11 パネルデータ分析(5)モデルの比較
練習問題

第6章 応用編;機械学習と因果推論とテキスト分析
6.1 応用編;機械学習と因果推論とテキスト分析
6.2 機械学習(1)決定木分析
6.3 機械学習(2) SVM
6.4 機械学習(3) SGDRegressor
6.5 機械学習(4)スパース推定(Lasso)
6.6 リッジ推定(Ridge)
6.7 モデルの比較
6.8 因果推論(1)傾向スコアマッチング(PSM)
6.9 因果推論(2)回帰非連続デザイン
6.10 テキスト分析(1) Twitterからデータを取得し、Mecabで分かち書きをする
6.11 テキスト分析(2) Wordcloud
 Column 社会科学の違いを「測る」 -Linked Open Dataを使ったテキスト分析
6.12 テキスト分析(3) word2vecモデル
6.13 テキスト分析(4)トピックモデル
6.14 さいごに

困ったときの逆引き事典
@ Pythonで基本的なプログラミング構文を学ぶ
 1 標準出力
 2 数値演算
 3 データ型の変換
 4 for文
 5 enumerate文
 6 zip文
 7 enumerateとzip文を一緒に使う
 8 for文を用いた多重ループ
 9 itertoolsを使った多重ループ
 10 if文
 11 論理演算子
 12 while文
 13 無限ループと例外処理276
A Pythonでの基本的な数理計算
 1 四則演算
 2 三角関数とMathパッケージ
 3 ベクトルの計算
 4 行列の計算2845Pandasを使った処理
B pipでパッケージを導入する
C パッケージのバージョンを確認する
D エラーコードの対処方法
 1 Name is Not Definedな場合
 2 数字を文字列で割っている場合
 3 砂山からダイヤモンドを探す方法(エラーの倒し方)

索 引
		



購入案内 統計学(Excel、SPSS、JMP、医療・看護) 新刊書籍

東京図書株式会社
© TokyoTosho Co.,Ltd.