#統計 「信頼区間」と「同時信頼区間」(矩形型の信頼領域)の違いを明瞭に説明しないと、ほぼ確実に誤用を招くと思いました(奥村さんの疑問は当然)。
例えば、95%同時信頼区間のp₁部分が[0.28, 0.32]のとき、その区間単体に95%という数値を適用すると誤りになる。95%は矩形型領域に適用するべき数値。
統計相談に乗ったときのメモ: カテゴリ3つ以上の割合の信頼区間 stat-consul.blogspot.com/202…
#統計 奥村さんの疑問は当然。
「男・女と2分した場合の男の割合の信頼区間」と「男・未成年女・成年女と3分した場合の男の割合の信頼区間」は等しくなるようにするのが自然。
「男・未成年女・成年女と3分した場合の同時信頼区間(矩形型信頼領域)の男の割合部分」はそれらと違うものになる。
#統計 パラメータの値を(θ₁,…,θᵣ)=(a₁,…,aᵣ)と設定した特定の確率分布モデルで生成した仮想的なデータXから計算されたr次元領域CR(X)に(a₁,…,aᵣ)が含まれる確率が95%で近似されるようになっているとき、領域CR(X)を95%信頼領域と呼びます。続く
#統計 一般に信頼領域の構成法は無数にあるので、実践的には何らかの規準で効率が良いものを使用することになる。
例えば多項分布モデルで区間の直積型領域の場合では次の論文がある。
doi.org/10.1016/S0378-3758(9…
Simultaneous confidence intervals for multinomial proportions
Glaz and Sison 1999
#統計 (θ₁,…,θᵣ)の信頼領域を区間の直積型[L₁,U₁]×⋯×[Lᵣ,Uᵣ]で構成する場合には、誤解しないように注意が必要になります。
すなわち、区間の直積型信頼領域[L₁,U₁]×⋯×[Lᵣ,Uᵣ]のθ₁部分[L₁,U₁]をパラメータθ₁単独の信頼区間と混同しないように注意することが必要になります‼️
#統計 データの値Xに区間を対応させる関数CI₁(X)がパラメータθ₁の95%信頼区間を与えるためには、次が成立している必要があります:
パラメータθ₁のみを値a₁に設定したモデルの確率分布(ただ一つに決まらない)で生成された仮想的なデータXについて、a₁∈CI₁(X)となる確率は95%で近似される。
Nov 8, 2025 · 12:13 PM UTC
#統計 (θ₁,…,θᵣ)の区間の直積型95%信頼領域
CR(X)=[L₁(X),U₁(X)]×⋯×[Lᵣ(X),Uᵣ(X)]
のθ₁部分[L₁(X),U₁(X)]は一般にはθ₁の95%信頼区間を与えません。
だから、解説時には、[L₁(X),U₁(X)]をθ₁単独の信頼区間だと絶対に誤解しないように厳しく注意警告しておく必要があると思いました。
#統計 どういう「工夫」を想定しているかが分からない。
男と女の2分割でも、男と未成年女と成人女の3分割でも、男の割合単独の信頼区間は同じものです。
3分割の場合での複数のパラメータの同時信頼区間(区間の直積型の信頼領域)はそれらとは異なります。
私の方が誤解しているなら教えて下さい。
#統計 信頼領域として区間の直積型領域を考えることは、対応するP値関数の視点から見ると、十分に自然なものにはなっていないと思う。
目的に合わせて注目するパラメータの個数を2個まで減らして、より自然な信頼領域をグラフで図示するようにした方が良い場合もあると思った。
#統計 パラメータ(θ, η)の自然な信頼領域を図示すれば、パラメータ(θ, η)のどの値がデータの値と比較的相性が良いかがぱっと見て分かるようになる。
例
↓
#統計 ヒートマップでの色をP値ではなく、S値=-log₂(P値)でつけた場合の
95%信頼領域 = P値≥5%となる(a,p)の値全体
のグラフ。P値=100%とP値=5%に対応するS値はそれぞれ0bitと約4.3bitなのでその間の部分に色がつけられています。
github.com/genkuroki/public/…

