nkhrlab~

140字超の記事

女装男子には長男が多い?

本記事の目的

次のツイートは,女装男子の続柄 (長男かそうでないか) についてアンケートをとったものである.本記事では,この結果を真実として,女装男子に長男が多いといえるか仮説検定をおこなう.


アンケートの結果のまとめ

アンケートの結果から女装男子であると回答した分のみ抽出してまとめると,次のようになる.ここで,Twitterのアンケート機能の仕様上,正確な度数は表示されず,割合は1%単位でしか知ることができないため,投票総数と割合から度数を概算している.また,この影響により度数に端数が出ているが,ここでは補正は行わない.

(ツイートに表示されている) 割合 度数
女装男子の合計 64% 867.84
- 長男合計 54% 732.24
- - 長男 (第一子) 43% 583.08
- - 長男 (姉がいる) 11% 149.16
- 次男以降 10% 135.60
女装男子じゃない人 36% 488.16
総計 100% 1356

男児に占める長男の割合

検定を行うためには,比較対象となる「男児に占める長男の割合」が必要になるが,残念ながら男性に対し「長男か次男以降か」を直接質問したアンケートの結果を見つけることはできなかった.そこで,いくつかの統計資料をもとにこれを概算する.

1994年の出生男女比

1994年の人口動態調査によれば,この年の出生数は 男: 635915, 女: 602413, 計: 1238328で,男児が約51.4%の確率で出生したことがわかる.この値は年度によってほとんど変動しない.アンケートに回答した年齢層では,性差による寿命の違いの影響は十分に小さいと想定できるので,この値をこの年齢層全体に占める男性の割合とする.
人口動態調査 人口動態統計 確定数 出生 年次 1994年 | ファイル | 統計データを探す | 政府統計の総合窓口

2015年の出生子ども数分布

2015年の出生動向基本調査によれば,夫婦の出生子ども数分布は次のようになっている.

人数 割合
0 6.2%
1 18.6%
2 54.1%
3 17.8%
4以上 3.3%

完結出生児数は,結婚から15~19年を経過した夫婦の平均出生子ども数と定義される.2015年の調査では1.94が報告された.
第15回出生動向基本調査(結婚と出産に関する全国調査)|国立社会保障・人口問題研究所

ここで,出生子ども数分布の階級「4以上」を「4」に読み替えて完結出生児数を計算すると,1.934となり,実際の値である1.94より少なく計算されてしまう.そこで,1.94を完結出生児数の真の値として,子ども数分布を補正する.6人以上の子どもを持つ夫婦がないものとすると,階級「4以上」の割合についての条件と完結出生児数についての条件を連立して,ちょうど4人,ちょうど5人の子どもがいる夫婦の割合がそれぞれ2.7%, 0.6%と計算される.補正後の分布は次のようになる.

子どもの人数 夫婦の割合
0 6.2%
1 18.6%
2 54.1%
3 17.8%
4 2.7%
5 0.6%

長男の割合の概算

これらのデータを用いて男性全体に占める長男の割合を概算しよう.
ある夫婦に長男がいる確率は,その夫婦に1人でも男児がいる確率に等しい.したがって,1からその夫婦の子どもがすべて女児である確率を減じることでこれを計算できる.子どもの人数によって長男がいる確率は次のようになる.ただし,子どもの性別は互いに独立に決定されるものと仮定する.

子どもの人数 長男がいる確率
0 0%
1 51.35%
2 76.33%
3 88.49%
4 94.40%
5 97.28%

また,期待値の線形性から,各夫婦の男児の人数の期待値は子どもの人数と子どもに占める男児の割合の積で計算できる.したがってその値は子どもの人数によって次のように計算できる.

子どもの人数 男児の人数の期待値
0 0
1 0.5135
2 1.0271
3 1.5406
4 2.0541
5 2.5676

子どもの人数と長男がいる確率に対し2015年の出生子ども数分布のデータ (補正後) で重みづけをして和をとると,平均的に69.73%の夫婦には長男がいることがわかる.長男は夫婦ごとに高々1人だから,夫婦ごとの長男の人数の期待値が0.6973であるともいえる.同様に,男児の人数の期待値に対し重みづけをして和をとると,夫婦全体では男児の人数の期待値は0.9962と計算できる.したがって,男児全体に占める長男の割合は  p = 0.6973 / 0.9962 = 69.99\% と計算できる.次男以降の割合は  1 - p = 30.01\% と計算できる.すなわち, (寿命の影響が小さい年齢層の) 男性のほぼ70%が長男である.

仮説検定

本節では,二項検定によってアンケートの結果女装男子には長男が多いといえるか,検証する.

まず, n = 867.84とする.これはアンケートで女装男子であると回答された度数の概算値である.このアンケートに回答した人と同程度の年齢層の男性を無作為に n人 ( nは整数ではないが,まだ補正はしない.) 選び,長男の人数 Xを調べることを考える.このとき,確率変数 Xは二項分布 B(n, p)に従うと考えられる.

二項分布 B(n, p)はその平均 \mu = np,分散 \sigma^2 = np(1-p)が十分に大きいとき正規分布 N(\mu, \sigma^2)で近似できる.こうすることで, nの補正を行うことなく検定を行うことができる.本記事ではこの近似を用いる.

前節で概算した長男の割合についての結果を代入すると, \mu = 607.44, \sigma^2 = 182.26, \sigma = \sqrt{\sigma^2} = 13.50が得られる.一方で,冒頭のアンケートの結果からは X = 732.24を得ている.確率変数 X正規分布 N(\mu, \sigma^2)に従うとき, X \geq 732.24となる確率は P[X \geq 732.24] = \displaystyle \frac{1}{\sqrt{2\pi}}\int_{\frac{732.24 - \mu}{\sigma}}^{\infty}e^{\frac{-x^2}{2}} で表せる.

積分を数値的に行うことで, P[X \geq 732.24] = 1.2 \times 10^{-20} \approx 0 が得られる.これは一般的に仮説検定時の有意水準として選ばれる 5\%, 1\%などの値に比べてはるかに小さい値である.すなわち,無作為に男性を選んでも,冒頭に示したような結果 (あるいは,それよりさらに長男に偏った結果) が得られる見込みはほとんどなく,(アンケートに協力した) 女装男子に長男が多いということは確からしいといえる.

まとめ

本記事では,日本における長男の割合を概算し,その結果とアンケートの結果を合わせて「女装男子には長男が多い」という仮説を二項検定によって確かめた.その結果,女装男子には長男が有意に多いことが確かめられた.

ただし,より正確な長男の割合の計算,アンケートの手法の変更などによって,この結果は結論を含めて変わる可能性がある.特に,Twitterでのアンケートはアンケートを投稿したアカウントによる標本の偏り,真実でない回答などの存在に注意する必要がある.

謝辞

本記事はむっくん (@Muggusan) 様のご協力のもと作成されました.ありがとうございました.