解決済 105B43 24.公衆衛生

帰無仮説のP値=対立仮説の起こる確率?

本問のeの選択肢を正すのであれば「A群とB群とで入院期間に差がないと仮定した場合に、A群とB群との入院期間の差が発生する確率は3.6%である」となるとほずみ先生が公衆衛生の授業内で解説をされていましたが、なぜこうなるのかがわかりません。
ここは「A群とB群とで入院期間に差がないと仮定した場合(帰無仮説)のP値としては3.6%で、これは有意水準5%より低いため、この帰無仮説は棄却され、A群とB群には入院期間に差があるという対立仮説が採用される」だけであるのではないかと考えてしまいます。
なぜ、求められる3.6%が「差が発生する確率」になるのでしょうか?
講義内でも、帰無仮説によって求められるP値は、対立仮説が発生する確率のことであるという内容の話はなかったように思うのですが・・。
どこかで勘違いをしているのだと思うのですが、自分で考えても良くわかりません。
何卒、よろしくお願いします。

回答5件

  • 私なりの認識を述べさせていただくので誤りがあるかもしれませんが、同じように悩んだことがあるため、ご返信させていただきました。

    一般に
    ”p値は、「帰無仮説が正しいという前提において、それ以上、偏った検定統計量が得られる確率」
    を示している。”と言われています。
(参考URL; https://bellcurve.jp/statistics/blog/14004.html )

    p値は、紛れもなく「確率」なんですが、「この確率が、なんの確率か?」というところが我々の理解を最も遠ざけている気がします。

    個人的には、p値が絡んでくる時はいつも、かなり具体的に考えるようにしています。以下、自分の想像上の独り問答です。
    (多少くどいですが、文字でお伝えする性質上、丁寧に伝えております。)

    新薬を投与したA群は8.1日、旧薬を投与したB群は、9.6日。
    どう考えても、平均1日以上の短縮があるので、「差がある!」と言いたいが、直接的には説明できないので、
    背理法(逆の仮説を否定して言及したい真理に迫る方法)で言うしかない。

    ひとまず、帰無仮説「A群とB群の在院日数は差がない。」を正しいとしよう。

    とはいえ、いくら「A群とB群は差がでない。」と言う仮説のもとでも、
    この世界には、誤差が存在する。差が出ることだって、たま〜にはあるだろうに。
    偶然、たまたま、誤差がでてしまい、在院日数がこれほどまでかけ離れるかもしれない!

    さて、それは、一体この実験を100回やると何回くらい「たまたま差が出る結果」
    が出るんでしょうか?
    (▶︎p値は実は、ここの確率のこと。)

    ここで、某サウジアラビアのすごいお金持ちが、研究に興味を持って、100回この実験をランダムに行うことができたとします。
    (▶︎そもそも、「確率」が想像できなくて多く悩むのだと思いますが、確率とは、「同じことを(仮想的に)100回やっていくらその事象が出るのか?」がポイントだと思います。)
    (▶︎こんなことあったら色々と問題ですが、統計学の世界では、こんなことだって論文の中で起こっていると仮定してできているのです。)

    そうすると、
    ・3.6回は今回みたいに、「在院日数が平均1日以上の短縮」と結果が出る。
    ・残りの、96.4回は「在院日数に差がない」と結果が出る。
    つまり、
    「差がないと仮定したら、100回中たったの3.6回しか『在院日数に差がある』と言う事象が起こらない!」
    =「帰無仮説を前提にすると、わずか3.6%しか『この差が出る』と言う現象が起こり得ない。」
    (▶︎ここが、p値であり、「A群とB群とで入院期間に差がないと仮定した場合に、A群とB群との入院期間の差が発生する確率は3.6%である」となるとほずみ先生が公衆衛生の授業内で解説していたところ)

    ハッと、現実世界に戻って、研究室で研究結果をもう一度見直す。
    「いやいや、今、現実に、平均1日以上離れてるじゃないですか??
    たまたまにしては、起こらないことが起こりすぎていませんか???」

    そもそもの帰無仮説=「A群とB群の在院日数は差がない」がおかしい。
    だって、この仮説のもとでは、「今現実に起きているこの差」が誤差として起きうるのは100回中3.6回。3.6%なんだから。
    100回やって3.6回のことをが、今回たまたま起こったと言うのは都合が良すぎる!
    5%有意水準(100回やって5回起こる=20回に1回おこるという基準ライン)よりも低いワケだし、たまたま起こったと言えない。棄却!!

    対立仮説=「A群とB群の在院日数は差がある」を採用!
    (=この薬には、早く治す効果があるんだ〜ということが言えうる!)

    と言う流れになっていると思います。

    質問者様のご意見のように、私も以前までは、
    p値はわからないので、もう頭がごちゃごちゃになってしまうのを防ぐために、p値に確率という意味付けをせずに、

    【p値が有意水準より低い→(敢えて仮定した)帰無仮説が否定される→(本当に証明したい)対立仮説が証明される】

    ということを自分に言いきせるようにしていました。
    (実際にこれで問題は解けるんじゃないかと思いますし、論文も読めると思います。)
    ですが、最近になって「確率」であることを知り、
    この確率とはつまり

    「(実際にはできないんだけどそれを統計学に基づいて)100回同じ実験をして、何回出るか?」

    と言う議論をしていたなんだなぁ、と納得に至りました。

    長文になってしまい、失礼いたしました。
    また、説明が下手で余計に混乱を煽ってしまった場合申し訳ございません。
    (その際は、自身の理解を最優先していただき、この話は見なかったことにしていただければ幸いです。)
    また、「根本的に議論が間違っている」と言う場合はご連絡ください。訂正させていただきます。

    質問者様のご理解の一助に繋がれば幸いです。

    追記:
    また、「講義内でも、帰無仮説によって求められるP値は、対立仮説が発生する確率のことであるという内容の話はなかったように思うのですが・・。」
    と質問者様がおっしゃることについて、言及させていただくと、
    「【帰無仮説(差がない)を前提にした時に!】(⇦ここが最重要ポイント)、対立仮説と同じ現象(差があると言う現象)が発生する確率」=p値
    という、ところがポイントで、
    ・「帰無仮説を前提にした場合」という仮定が必要なこと
    ・(対立仮説そのものの確率は厳密にはないので)対立仮説で言及される現象が起こる確率と捉えること(⇦こっちは、厳密な話なので、無視してOKです。)
    が質問者様に、求められる考え方ではないか、と存じております。

    追記2:
    こういった議論がわかると、p値だけを見て「有意」かどうか判断したりしないでほしい、と言う世界的な動きも納得できます。
    有意水準5%とは、20回に1回起こる確率のことを言っていますが、
    「20回に一回起こることって、そんなに珍しいことなの?」と言うことに議論があるから、p値に振り回されないでね、と言うのがASA始め、統計におけるトピックになっていると思います。
    https://www.editage.jp/insights/is-my-research-significant-why-you-shouldnt-rely-on-p-values
    国家試験と関係が薄くなりましたが、何かの参考になればと思って追記しました。

  • なるほど〜!!
    ご丁寧にありがとうございます。すごくスッキリしました。
    帰無仮説はあくまで前提であり、この前提のもとで対立仮説『と同じ現象』はどれだけ起こるのかを計算しているのがP値なんですね。
    なんども回答を読み直して、しっかり内容を習得したいと思います。
    大変わかりやすい解説をありがとうございました!

    • まさにおっしゃる通りです!
      「帰無仮説はあくまで前提であり、この前提のもとで対立仮説『と同じ現象』はどれだけ起こるのかを計算しているのがP値」
      の部分が非常に素晴らしい要約で、伝えたいところでしたので、伝わって嬉しいです。
      これからもお互いに、精進してゆきましょう!

  • そもそもこの問題はa-eの答え全てが厳密には誤りであることから謎の誤解が生まれていると思います。aからdが誤りであることは明らかとして、e「A群とB群とで入院期間に差がないのに、誤って差があるとする確率は3.6%である」の3.6%という部分が意味不明です。A群とB群とで入院期間に差がないのに誤って~、という部分はmedu4のオンラインの解説でもある通り、タイプ1エラーの確率についていいたいのだと思います。タイプ1エラーというものは、帰無仮説がもし真実である場合に、検定を行ったら対立仮説を採択してしまう確率を表しており、有意水準と同じ数値となります。具体的にこの問題で説明すると、A群とB群で差がないことが真実であった場合に、検定を行うと(今回たまたま得られた表の入院期間のデータから)、間違って差があるとする対立仮説を採択してしまう確率のことです。しかしこの問題はそもそも有意水準を何%と明記しておらず、ナンセンスです。p値と有意水準の誤解によるものと思われます。ひねくれた解釈をするなら、この出題者がかってに有意水準を3.6%と設定したと妄想するなら正しいのかもしれませんが...

    追記
    回答者1さんの解説について、
    「【帰無仮説(差がない)を前提にした時に!】(⇦ここが最重要ポイント)、対立仮説と同じ現象(差があると言う現象)が発生する確率」=p値 という部分ですが、これについてもタイプ1エラーについて言及しており、p値ではなく有意水準だと思います。何をもって差とするかは有意水準によって決定されます。
    p値について言いたいのなら、「【帰無仮説(差がない)を前提にした時に!】(⇦ここが最重要ポイント)、手持ちの統計データ上の差以上の差が発生する確率」=p値であります。

    • ご返信誠にありがとうございます。

      そうですね、私の書き方で示されるものは、有意水準αであり、
      帰無仮説が正しいという前提において、それ以上、偏った検定統計量が得られる確率がp valueですので
      kshatria4wing さまのように表現されるのが適切だと思いました。
      正規分布で考えた時の、いつも斜線で塗られた面積がどういう値であるかで頭の中でイメージしているのでそういうことが文字で伝えられれば良かったのですが、適切な言葉選びができなかったように思います。

      ご指摘誠にありがとうございます。とても勉強になりました。

コメントを投稿する

ログインするとコメントを投稿することができます。

  • 問題参照 105B43

    新しく発売された抗菌薬Aの肺炎に対する治療効果を調べるために、新たに入院する肺炎患者を対象として、抗菌薬Aを投与した群(A群)と既存の抗菌薬Bを投与した群(B群)とに割り付けて、治療効果を入院期間で比較検討した。得られた結果を表に示す。
    A群 B群 P値
    対象者数 198人 201人
    入院期間(平均) 8.1日 9.6日 0.036
    この結果の解釈について正しいのはどれか。
    • a A群はB群に比べて入院期間が平均で3.6%短い。
    • b A群の入院期間の平均値の誤差は3.6%以内である。
    • c A群の方がB群よりも入院期間が短くなる確率は3.6%である。
    • d A群の96.4%の患者は入院期間がB群の平均入院期間よりも短い。
    • e A群とB群とで入院期間に差がないのに、誤って差があるとする確率は3.6%である。
  • 関連トピック

    なし