2015年4月12日日曜日

データ解析のための統計モデリング入門

読んだ。

Rで書いてあるコードを自分でも再現しながらやるつもりだったけど、結局途中から読むだけになってしまった。以下メモ

・やりたいのは、多数のデータのふるまいを少数のパラメータによって表現すること

・GLMでは確率分布・リンク関数・線形予測子によってモデルが構成される

・最小二乗法は、確率分布に正規分布を仮定したときの最大尤度

・観測にかからない影響をモデルに組み入れたのがGLMM

・GLMMでは過分散を説明するようなモデルも作ることができる

・階層ベイズモデルでは、モデルのパラメータ自体も確率分布する量としてさらにモデル化する →局所的なパラメータを大域的なパラメータで代表させてパラメータを減らす

↑ここまでモデルの話

↓ここから推定の話

・得られたパラメータから後続のデータを予測する際にはどんなモデルが良いか?→AIC基準といものがある(唯一ではないと思うがわかりやすい基準)

・より複雑な統計モデルのあてはめに効果的なのがMCMC

・MCMCサンプリングで得られるのは現在得られたデータから得られるモデルパラメータの定常分布

0 件のコメント:

コメントを投稿