京都新聞のコロナ日報に書かれた死者数を読んで、ふと死亡率が気になったので、京都市の人数で計算してみた。
まず人数は、
感染者累計982人
亡くなられた方19人
検査累計件数(結果判明分) 16,695件
新型コロナウイルス感染症 最新の動向
京都市情報館 2020年8月25日
計算式: 死者数÷感染者数×100=%
死亡率: 19÷982×100=1.93%
意外に高いな…と思ったところで、京都市の人口と検査件数を比較してみる。
京都市の人口は、
1,468,980人
平成29年(2017年)京都府統計書 2-5表
京都市オープンデータポータルサイト
平成30年10月1日時点
計算式: 検査累計件数÷人口×100=%
人口に占める検査を受けた人の割合: 16695÷1468980×100=1.13%
検査件数には重複があると思うけど、わからない。
…ん? 何かおかしいな。感染者数の人口中の割合は、
計算式: 感染者数÷人口×100=%
の人口中の割合: 982÷1468980×100=0.06%
一見少ないものの、統計学的には、感染者中の死者数を計算するために必要なサンプルサイズは超えているみたい。条件(入力値)が正しいかは知らないけど、フォームの結果を見る限り、十分足りている。
母集団の規模: 1468980
信頼レベル (%): 95
許容誤差 (± %): 5
回答比率: 0.5
必要なサンプルサイズ: 384.05956274311194
【自動計算フォーム有】アンケート調査に必要なサンプルサイズは?
ところが、一般論として、統計は「信頼できるデータ」に基づいて計算される必要がある。自覚症状がある人々のみから取ったデータが正しいとはとても思えない。
死亡率を計算する前に、全数検査を繰り返し実施するべきだ。正しい対策のためには正しいデータが必要だ。
統計の世界には「ゴミのようなデータを使っていくら解析しても出てくる結果はゴミばかりだ」という格言がある。
ウィキペディア 統計学