R による多変量解析入門 データ分析の実践と理論

前表紙
株式会社 オーム社, 2018/07/18 - 448 ページ

多変量解析手法の理論と実践をバランスよく習得できる!
 

 様々な媒体、経路を通じて大規模データが、驚くほど低コストで入手できるようになった現在、多変量解析手法に習熟したデータサイエンティストに対する学術界、ビジネス界からのニーズは非常に高まっており、これに対して大学や企業では、高いデータ解析力を持った人材の育成に注力し始めています。しかし、多くの多変量解析についての学習書は、理論的な説明に終始し、実務場面でどのように利用されているかについて、殆ど配慮がない野が現状です。
 そこで本書は、多変量解析手法の理論と実践をバランスよく解説することで、統計が得意ではない大学生や実務者にも利用しやすい構成とし、本書1冊で多変量解析手法を実務に応用できるまで習得できる内容となっています。


まえがき
目次
第I 部 多変量解析の基礎
第1章 多変量解析の基礎を学びたい-Rによる多変量データの基本的な統計処理
1.1 データと手法の概要
1.2 単変量データの基礎分析
1.3 単変量データの群間比較
1.4 多変量データの基礎分析
1.5 多変量データの関係性の分析
1.6 基本統計量の数理的成り立ち
1.7 偏相関係数
コラム1:疑似相関をひたすら集め続ける人
1.8 順序カテゴリカル変数の相関係数
1.9 効果量
コラム2:アメリカ統計学会の統計的仮説検定に対する声明
章末演習

第2章 Rによるデータハンドリングを学びたい-アンケートデータとID-POSデータのハンドリング
2.1 手法の概要
2.2 変数の型
2.3 観測対象の情報の抽出
2.4 欠損値の処理
2.5 ソート
2.6 マージ
2.7 数値の置き換え
2.8 固定長データのハンドリング
2.9 ID-POSデータの読み込み
コラム3:Rの外部エディタとしての“Notepad++”
2.10 ID-POSデータにおけるソート
2.11 RFM分析
2.12 ID-POSデータにおけるクロス集計表顧
2.13 顧客ID別に月ごとの購買金額を求める
2.14 顧客ID別に商品名を取得する---自作関数を利用する
2.15 顧客IDごとに来店間隔の分布を描画・要約する
コラム4:R上達への近道
章末演習

第II部 量的変数の説明・予測
第3章 現象を説明・予測する統計モデルを作りたい(1)-重回帰分析
3.1 データと手法の概要最
3.2 モデル作成と母数の推定・診断
3.3 モデルの評価と解釈
3.4 報告例
3.5 質的変数を含む重回帰分析
3.6 AICとBICによるモデルの評価
3.7 重回帰分析と母数推定理論
コラム5:自由度調整済み決定係数とAICの意義
3.8 偏回帰係数の解釈
3.9 決定係数とその検定
3.10 切片と偏回帰係数の検定切
3.11 切片と偏回帰係数の信頼区間
コラム6:それでも誤解され続ける偏回帰係数
3.12 VIFの理論
章末演習
第4章 現象を説明・予測する統計モデルを作りたい(2)-階層的重回帰分析
4.1 データと手法の概要
4.2 階層的重回帰分析
4.3 重回帰分析での交互作用効果の検討
4.4 単純傾斜分析
コラム7:プリーチャー氏のWebサイト
4.5 報告例
4.6 重回帰分析における変数選択
コラム8:セイバーメトリクス
章末演習
第5章 さまざまな集団から得られたデータを分析したい-マルチレベルモデル
5.1 データと手法の概要
5.2 マルチレベルモデルによる分析
コラム9:マルチレベルモデルにおける記号
5.3 モデル比較
5.4 報告例
5.5 推定法
5.6 複数のレベルを持つデータの例
コラム10:生態学的誤謬
章末演習
第6章 複雑な仮説を統計モデルとして表したい(1)-パス解析
6.1 データと手法の概要
6.2 パス解析
6.3 モデルの評価とモデルの修正
6.4 結果の解釈とまとめ方
6.5 パス解析の理論
コラム11:相関と因果
コラム12:因果関係を示すためには?
6.6 係数の解釈
6.7 モデルの適合度
章末演習

第III部 心理尺度の分析
第7章 心理尺度を開発したい(1)-探索的因子分析
7.1 データと手法の概要
7.2 因子数の決定
7.3 因子負荷の推定
7.4 因子軸の回転
7.5 因子の解釈
7.6 報告例
7.7 信頼性の評価
コラム13:相関行列と因子分析
7.8 順序カテゴリカル変数の探索的因子分析と信頼性の評価
7.9 探索的因子分析の理論
7.10 尺度の信頼性
コラム14:知能と因子分析
章末演習
第8章 心理尺度を開発したい(2)-確認的因子分析
8.1 確認的因子分析と本章の概要
8.2 確認的因子分析
8.3 報告例
8.4 順序カテゴリカル変数を扱った確認的因子分析
8.5 モデルの識別性
8.6 不適解の問題
8.7 高次因子分析
コラム15:探索的因子分析と確認的因子分析
8.8 尺度の妥当性
コラム16:多特性多方法行列
章末演習
第9章 複雑な仮説を統計モデルとして表したい(2)-潜在変数を伴うパス解析
9.1 データと手法の概要
9.2 モデル表現
9.3 モデルの推定および評価
9.4 最終モデルの推定結果の確認
9.5 報告例
9.6 モデルの数式表現
コラム17:フィットよければ全てよし?
9.7 モデルの推定
9.8 発展的な分析に向けて
ラム18:共分散構造分析と共分散分析の違いと手法の深い理解
章末演習

第IV部 質的変数の説明・予測
第10章 クロス集計表をもっとていねいに分析したい-対数線形モデル
10.1 データと手法の概要
10.2 飽和モデルの分析
10.3 独立モデルの分析
10.4 最良モデルの探索
10.5 報告例
10.6 対数線形モデルとポアソン分布
10.7 逸脱度
10.8 モデルの自由度
10.9 逸脱度を用いた尤度比検定
10.10 母数の制約
10.11 母数と期待度数
10.12 期待度数と関連づけた母数の解釈
10.13 基準セルの設定
コラム19:対数線形モデルと変数の個数
章末演習
第11章 カテゴリに所属する確率を説明・予測したい-ロジスティック回帰分析
11.1 データと手法の概要
11.2 係数・切片の推定と解釈
11.3 モデルの良さの評価
11.4 その他の有益な指標
11.5 報告例
11.6 モデルの意味
コラム20:オッズと言えばギャンブル?
11.7 母数の推定の考え方
11.8 Hosmer-Lemeshowの適合度検定
11.9 AIC とBIC
コラム21:GLMって何?
章末演習

第V部 個体と変数の分類
第12章 似たもの同士にグループ分けしたい-クラスター分析
12.1 データと手法の概要
12.2 階層的クラスター分析の実行
12.3 非階層的クラスター分析の実行-k平均法
12.4 報告例
12.5 非類似度の考え方
コラム22:マハラノビス距離
12.6 階層的クラスター分析におけるクラスター形成の考え方
12.7 非階層的クラスター分析の考え方
12.8 クラスター数の妥当性の確認
コラム23:2種類のウォード法
章末演習
第13章 質的変数間の連関を視覚化したい-コレスポンデンス分析
13.1 データと手法の概要
13.2 コレスポンデンス分析
13.3 報告例
13.4 クラスター分析の併用
13.5 多重コレスポンデンス分析
13.6 コレスポンデンス分析の理論
ラム24:「タイタニックデータ」の多重コレスポンデンス分析
13.7 寄与率・平方相関・慣性
コラム25:市場調査の実務で活躍するコレスポンデンス分析
章末演習
第VI部 多変量解析を使いこなす
第14章 データが持つ情報を視覚化したい-パッケージggplot2による描画
14.1 データと手法の概要
14.2 分布の検討
14.3 時系列変化の検討
14.4 2 つの事柄の関係の検討
コラム26:3次元円グラフにはご注意を
14.5 軸以外の審美的属性のマッピング
14.6 軸と凡例の設定
14.7 状況・目的に応じたさまざまな図の描画
コラム27:色に頼りすぎない
章末演習
第15章 多変量解析を実践で生かしたい-手法の組み合わせ
15.1 グループ化-グループの影響の検討
15.2 尺度得点化-尺度得点による説明
15.3 測定状況の確認-多変数間の関係の検討
コラム28:合計得点や平均値による尺度化で気をつけること
章末演習の解答
参考文献
索引

 

目次

882 妥当性と信頼性の関係
206
多特性多方法行列
207
章末演習
208
第9章複雑な仮説を統計モデルとして表したい2潜在変数を伴うパス解析
209
912 分析の目的と手法の位置づけ
211
913 データの内容の確認
212
921 モデルで扱う変数およびそれらの関係
213
922 モデル表現の約束事
215

135 母平均の信頼区間の描画
12
14 多変量データの基礎分析
14
142 多変量データの群間比較
15
15 多変量データの関係性の分析
16
152 連関の分析
20
16 基本統計量の数理的成り立ち
24
17 偏相関係数
28
疑似相関をひたすら集め続ける人
29
18 順序カテゴリカル変数の相関係数
30
19 効果量
33
192 対応のあるt検定における効果量
35
193 その他の効果量と信頼区間
36
アメリカ統計学会の統計的仮説検定に対する声明
38
章末演習
39
第2章 Rによるデータハンドリングを学びたいアンケートデータとIDPOSデータのハンドリング
41
22 変数の型
42
222 関数factorの使いどころ
43
23 観測対象の情報の抽出
44
24 欠損値の処理
47
25 ソート
48
26 マージ
50
27 数値の置き換え
51
28 固定長データのハンドリング
53
29 IDPOSデータの読み込み
56
Rの外部エディタとしてのNotepad++
57
210 IDPOSデータにおけるソート
59
212 IDPOSデータにおけるクロス集計表
60
213 顧客ID別に月ごとの購買金額を求める
61
214 顧客ID別に商品名を取得する自作関数を利用する
62
215 顧客IDごとに来店間隔の分布を描画要約する
63
章末演習
65
第II部量的変数の説明予測
67
第3章現象を説明予測する統計モデルを作りたい1重回帰分析
68
312 分析の目的と概要
69
32 モデル作成と母数の推定診断
71
322 推定結果の診断多重共線性のチェック
72
33 モデルの評価と解釈
74
332 切片と偏回帰係数の解釈
75
333 偏回帰係数の信頼区間
76
34 報告例
78
35 質的変数を含む重回帰分析
79
36 AICとBICによるモデルの評価
80
37 重回帰分析と母数推定理論
81
371 最小2乗法による母数推定の概要
82
自由度調整済み決定係数とAICの意義
83
372 最尤法による母数推定の概要
84
38 偏回帰係数の解釈
85
39 決定係数とその検定
87
310 切片と偏回帰係数の検定切
88
311 切片と偏回帰係数の信頼区間
89
それでも誤解され続ける偏回帰係数
90
章末演習
91
第4章現象を説明予測する統計モデルを作りたい2階層的重回帰分析
92
412 分析の目的と概要
93
42 階層的重回帰分析
94
422 階層的重回帰分析の実行
95
423 決定係数の増分に関する検定
97
424 AICとBICによるモデル比較
98
43 重回帰分析での交互作用効果の検討
99
433 交互作用効果の検討
101
434 標準偏回帰係数の算出
102
44 単純傾斜分析
103
442 単純傾斜分析の実行
104
443 交互作用効果のグラフ化
106
プリーチャー氏のWebサイト
107
45 報告例
108
46 重回帰分析における変数選択
110
セイバーメトリクス
112
章末演習
113
第5章さまざまな集団から得られたデータを分析したいマルチレベルモデル
115
512 データの構造
116
513 分析の目的
117
514 分析手法の概要
118
52 マルチレベルモデルによる分析
119
522 中心化
121
523 ランダム切片モデル
123
524 ランダム傾きモデル
126
525 集団レベルの変数を含むモデル
128
526 クロスレベルの交互作用項を含むモデル
130
マルチレベルモデルにおける記号
132
53 モデル比較
133
54 報告例
134
55 推定法
135
56 複数のレベルを持つデータの例
136
章末演習
137
第6章複雑な仮説を統計モデルとして表したい1パス解析
138
612 分析の目的
139
613 パス図
140
63 モデルの評価とモデルの修正
144
632 モデルの修正修正指標
146
64 結果の解釈とまとめ方
150
65 パス解析の理論
151
相関と因果
153
66 係数の解釈
155
67 モデルの適合度
156
因果関係を示すためには?
157
672 同値モデル
158
章末演習
159
第III部心理尺度の分析
161
第7章心理尺度を開発したい1探索的因子分析
162
712 分析の目的と概要
163
72 因子数の決定
165
722 スクリーテスト
166
73 因子負荷の推定
167
74 因子軸の回転
169
75 因子の解釈
170
76 報告例
171
77 信頼性の評価
172
771 α係数
173
772 ω係数
174
78 順序カテゴリカル変数の探索的因子分析と信頼性の評価
175
783 信頼性の評価
177
792 共通性と独自性
178
793 因子軸の回転
179
710 尺度の信頼性
181
7102 信頼性係数の推定
182
知能と因子分析
183
章末演習
184
第8章心理尺度を開発したい2確認的因子分析
185
812 確認的因子分析の手順と本章の概要
187
822 確認的因子分析の実行
188
83 報告例
191
84 順序カテゴリカル変数を扱った確認的因子分析
192
85 モデルの識別性
194
852 モデルの識別性と母数の制約
197
86 不適解の問題
199
87 高次因子分析
200
872 分析の目的
201
873 確認的因子分析の実行
202
探索的因子分析と確認的因子分析
204
88 尺度の妥当性
205
93 モデルの推定および評価
217
932 モデル適合に関する全体的評価
218
933 適合の悪さの詳細と修正の可能性の追究
219
94 最終モデルの推定結果の確認
220
941 変数から変数への影響の強さの確認
221
942 個人差や測定における誤差の大きさ相関関係の強さの確認
222
943 内生変数に対する影響や内生変数の説明率の確認
223
944 パス図による変数間の関係の視覚的な確認
224
95 報告例
225
96 モデルの数式表現
226
962 母数の同定と自由度
228
97 モデルの推定
229
972 最尤法の考え方
231
973 母数の検定と信頼区間
232
975 非正規データの扱い
233
981 母数の関数として表現される量の定義と推定
234
982 平均や切片をモデルに組み込んだパス解析
235
章末演習
236
第IV部質的変数の説明予測
237
第10章クロス集計表をもっとていねいに分析したい対数線形モデル
238
1012 分析の概要
240
102 飽和モデルの分析
241
103 独立モデルの分析
243
104 最良モデルの探索
245
105 報告例
247
106 対数線形モデルとポアソン分布
249
108 モデルの自由度
250
1010 母数の制約
251
1011 母数と期待度数
252
1012 期待度数と関連づけた母数の解釈
254
10123 1 次の交互作用効果の解釈
255
10124 1 次の交互作用効果の別の求め方
256
10125 2 次の交互作用効果の解釈
257
10126 より高次の交互作用効果
260
章末演習
261
第11章カテゴリに所属する確率を説明予測したいロジスティック回帰分析
262
1112 分析の目的
263
112 係数切片の推定と解釈
265
1122 係数切片の指数変換値の算出と解釈
266
1123 係数切片に関する信頼区間の算出
267
1124 標準化係数の算出と解釈
268
1131 当てはまりの良さの評価指標の出力と解釈
269
114 その他の有益な指標
270
1142 変数選択
271
1143 多重共線性の確認
272
116 モデルの意味
273
1162 切片と係数の指数変換
275
117 母数の推定の考え方
277
1172 ロジスティック回帰分析における尤度関数
278
118 HosmerLemeshowの適合度検定
280
119 AIC とBIC
281
GLMって何?
282
1192 AICとBICの表現
283
第V部個体と変数の分類
285
第12章似たもの同士にグループ分けしたいクラスター分析
286
1212 分析の目的と概要
287
1213 データの読み込みと確認
288
122 階層的クラスター分析の実行
289
1222 デンドログラムの見方
290
1223 解釈のためのクラスター数の決定と妥当性の評価
291
1224 各クラスターの特徴の把握
293
1225 z得点化データによる分析
294
1232 クラスター数の妥当性の確認
295
1233 z得点化データによる分析
296
125 非類似度の考え方
297
マハラノビス距離
298
1252 その他の距離
299
126 階層的クラスター分析におけるクラスター形成の考え方
300
1261 ウォード法
301
1262 その他の方法
305
1263 解釈を困難にするデンドログラムの形状
306
127 非階層的クラスター分析の考え方
307
1272 初期クラスター中心の決定
308
128 クラスター数の妥当性の確認
311
1282 3つの指標
312
2種類のウォード法
313
章末演習
315
第13章質的変数間の連関を視覚化したいコレスポンデンス分析
316
1312 分析の目的と概要
319
132 コレスポンデンス分析
320
133 報告例
323
134 クラスター分析の併用
324
135 多重コレスポンデンス分析
326
1352 図の出力
327
1353 さまざまなデータ形式からの多重コレスポンデンス分析の実行
328
136 コレスポンデンス分析の理論
330
タイタニックデータの多重コレスポンデンス分析
332
1362 ユークリッド距離
333
1363 行列スコアの算出
336
1372 平方相関
337
1373 慣性
338
章末演習
339
第VI部多変量解析を使いこなす
341
第14章データが持つ情報を視覚化したいパッケージggplot2による描画
342
1412 分析の目的と概要
343
1413 データの読み込み確認とカテゴリカル変数の水準の設定
344
142 分布の検討
345
1421 質的変数における棒グラフ
346
1422 量的変数におけるヒストグラム
349
143 時系列変化の検討
352
1432 平均を用いる折れ線グラフの描画
354
144 2 つの事柄の関係の検討
355
1441 パイプ演算子を利用したデータ整形
356
1442 散布図の描画
357
3次元円グラフにはご注意を
360
145 軸以外の審美的属性のマッピング
361
1452 折れ線グラフにおける線の色および線種のマッピング
362
1453 散布図における点の色および種類のマッピング
363
146 軸と凡例の設定
364
1462 スケールと凡例の設定
365
147 状況目的に応じたさまざまな図の描画
366
1472 他の幾何学的オブジェクトの紹介
367
色に頼りすぎない
368
章末演習
370
第15章多変量解析を実践で生かしたい手法の組み合わせ
372
1512 分析の目的と用いる手法
373
1514 グループ化
374
1515 グループの影響の検討
376
152 尺度得点化尺度得点による説明
378
1522 分析の目的と用いる手法
379
1523 データの内容の確認
380
1525 尺度得点を用いた説明
383
153 測定状況の確認多変数間の関係の検討
386
1532 分析の目的と用いる手法
388
1535 多変数間の関係の検討
390
合計得点や平均値による尺度化で気をつけること
392
章末演習の解答
393
参考文献
408
索引
412
奥付
418
著作権

著者について (2018)


書誌情報