医学統計アーカイブ

はじめに

 臨床家が臨床研究データを解析したりまたその解析結果を解釈したりする際に役立つ統計的手法・手順を出来る限り分かりやすく解説したいと思います。 「統計の勉強をしたいが何かよい教科書はあるか?」という質問をよく受けます。「残念ながら臨床家が求めているような‘よい教科書’は見当たりません」、が回答になってしまいます。 実際に臨床家が求めているのは統計学そのものを理解することではないと思うからです。自ら抱いている臨床的疑問に対して答えを出していくために、目の前にある臨床データをどのように解析し、 解釈すればよいのか、そこを知りたいのではないでしょうか。
 当アーカイブでは、一般的な教科書にあるような全体を網羅する系統的な説明ではなく、相談や質問をよく受ける課題について解説することにしました。 「初級」「中級」「上級(応用)」の三カテゴリーに分けています。もちろん、全てを学習しても良いのですが、自分の知りたいところだけ確認してそれで完了できるように作成しています。 さらに、これまで受けた質問とそれに対する答えをまとめた「Q&A集」も作成していきます。掲載している課題は完全に独立ではなく互いに関連し、中には重複するところもあるかと思いますがそこはご容赦ください。
 このアーカイブは随時更新していきます。皆様からの質問・指摘・要望を受けて課題の追加や修正を行っていきます。皆さまの臨床研究データ分析に少しでも役立つことを願っています。

 

おことわり

掲載情報の正確性については万全を期しておりますが、利用者が当アーカイブの情報を用いて行う一切の行為について何ら責任を負うものではありません(とまずことわりだけさせてください)。 掲載情報に従いデータ分析を行い、解析結果を論文投稿した際にレフリーコメントが付くかもしれません。実データの解析において正解は唯一ではありません(言い換えるとレフリーによって異なる判断をする場合があるからです)。 その点をご了承の上ご利用ください。ただし、レフリーコメントがついた時にはぜひご一報ください。一緒にコメント対応させて(闘わせて)いただきたいと思います。

 

準備したもの

課題ごとにPowerPointファイル(おおむねスライド10枚以内)を用いて解説しています。音声解説(5~10分)をつけています(作成者自ら録音していますのでノイズなどはご容赦ください)。 可能なものについては附属病院で利用可能な統計ソフトJMPでの解析実施手順を動画で準備していく予定です。

 

質問や要望を出したいときは
医学統計アーカイブに関して質問がしたい、と相談してください。
メールツールが起動しない、またはブラウザでメールをご使用の場合は、ds.iact※kuhp.kyoto-u.ac.jp(※印を@に置き換えてご使用ください)あてに質問・コメントメールをお送りください。

 

 

コンテンツ

【初級編】
0.はじめに:調べたい臨床的疑問からデータ(統計)解析へ
1.データをまとめる:真ん中とばらつき
・平均値±SDと中央値(最小-最大)、どう使い分けるの?
・信頼区間って何?信頼できる区間?95%の信頼度?
2.平均値と分散、SDとSE
・平均は分かるけど分散って何?
・SDとSE何が違うの、どっちを使えばよいの?
3.相関係数:2つの測定項目の関係を分析
・ピアソンとスピアマンどう使い分けるの?
・相関の高い低い、p値でみてはだめなの?
4.連続データの群間比較
・t検定とウィルコクソン検定、どう使い分けるの?
5.二値データに対する群間比較
・χ二乗検定とFisher検定、どう使い分けるの?
6.順序があるカテゴリカルデータの群間比較
・マン・ホイットニーのU検定とウィルコクソン順位和検定、実は同じ検定結果(p値)に
7.割合と率の違い
・日本語だと同じように使うことが多いけど統計では使い分けないとだめなの?
8.生存時間データをまとめる
・カプランマイヤー曲線って何?打ち切りって何?
9.データの型(タイプ)の解析方法の使い分け
・多くの解析方法があるけどどれを使ったらいいの?
・見通しをよくするためのポイント:データの型
・統計的検定とは?人間の眼力で群間差評価は難しい

 

【中級編】 拡張予定
1.多変量解析にはいろいろ種類があるみたいだけどどれを使えばいいの?
・オッズ比とハザード比、何が違うの?
・調整済み、って何?
2.多変量解析、どう使って解析すればいいの?
・説明変数、何個まで入れられるの?
・説明変数どうやって選べばいいの?
・説明変数にデータ欠測があるけどどうすればいいの?
・連続値の説明変数をカットオフして高値群/低値群に分けたいのだけど
3.多変量解析やってみたけど解析結果大丈夫なの?
・回帰係数の符号(±)の向きはあっている?の?
・信頼区間がやたら大きいけど計算大丈夫?t検定とWelchのt検定、どう使い分けるの?
・データへの当てはまり、どうやってチェックするの?
4.リスク因子・予後因子のカットオフ値、どうやって決めればいいの?
5.カプランマイヤー曲線って何?打ち切りって何?
・生存時間中央値(MST)とハザード比(HR)、どう解釈すればいいの?
・ログランク検定と一般化ウィルコクソン検定、何が違うの?
6.フォレストプロット(forest plot)見るときの注意点は何?
・交互作用検定ってなに?

 

【上級(応用)編】 拡張予定
1.プロペンシティ(傾向)スコアマッチングってどう使うの?
2.IPTW(Inverse probability of treatment weighting)法って何じゃそりゃ?
3.主要評価項目(プライマリーエンドポイント)を複数設定していいの?
4.主要評価項目の階層的評価の意味っていったい何?
5.制限付き平均生存時間(RMST: restricted mean survival time)て何?