TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
現代数学の系譜 古典ガロア理論を読む35
京大生以外は数学語るな
13×小学校のかけ算順序問題
線形代数で最初に習う互換ってまじ意味ないだろ
人工知能・機械学習のスレッド@数学板
Inter-universal geometry と ABC予想 16
最古の未解決問題が解決されたのか
現代数学の系譜11 ガロア理論を読む31
岡潔について教えて
Inter-universal geometry と ABC 予想 45

数学 統計に詳しい人が語るコロナウイルス


1 :2020/02/29 〜 最終レス :2020/06/21
東大数学科卒の元官僚はこう分析してるが、お前らはどうなると思う?
http://www.zakzak.co.jp/soc/news/200220/dom2002200003-n2.html
中国国外感染者の中国国内との比率をみると、
1月20日の数字公表以降は、0・8〜2・6%で比較的安定している。
これは、新型肺炎の感染者のほとんどは中国国内、それも湖北省に集中しているからだ。
ちなみに中国国外での感染者数は、中国国内の1・1%だ(2月16日現在)。
本コラムで紹介したが、現時点では、最終的な中国国内の感染者数は20万人超と筆者は推計している。
となると、中国国外の感染者は数千人程度になるだろう。
中国国外のうち日本の比率は1割弱なので、日本の感染者数は数百人程度であろう。
その場合、死者も数人から10人程度になるだろう。
こうした推計をすると、今の感染者は氷山の一角だと思われるが、今後の増加ペースはどうなるだろうか。
新型コロナウイルスの検査は簡単に行えるので、今後、日本での感染者数は増えていくだろう。
ある時点ではそれがネズミ算的に増えるかのように思える局面もあるだろうが、
筆者の推計が正しければ、現時点ではせいぜい数百人が一つのメドだ。

2 :
誰もいないのか

3 :
高橋洋一(統計数理研究所→大蔵省)、望月衣塑子らが引用する上昌広(サンモニ御用医師)の統計学上の間違いを解説
https://youtube.com/watch?v=qa880UYrQIw

4 :
閣議決定
歩いている人は高齢者ではない

5 :
新型コロナ問題、メディアに出て来る「専門家」の発言は信じられるか
3/6(金) 6:01配信
https://headlines.yahoo.co.jp/article?a=20200306-00230888-diamond-soci

記事によると、上氏は、厚労省が1日3830件のPCR検査が可能と言いながら、
韓国などに比べても圧倒的に少ない検査実施にとどまっている背景などを問われるなかで、
「厚労省がよほど(検査を)やりたくないのだなあと。そういうニュアンスを感じます」と発言。

その背景に、厚労省が民間の検査会社を使わない自前主義などの「省益」があることや、
「予算の問題と、もう一つは感染者を多く見せたくないんじゃないかというウラがあるように感じます」などと答えている。

そこには、「新型コロナウイルスのpcrの陽性的中率の議論。私は風邪患者の2割程度は新型コロナウイルスだと考えています。
感度7割、特異度9割で陽性的中立は8割です。何が問題なのかな?」と書かれていた。

陽性適中率というのは、検査で陽性だった人のうち罹患している人の割合なので、14人/22人=64%となり、「8割」は間違っているという結論になる。
単なる計算間違いなのかもしれないが、専門家として政府の対応を厳しく批判しながら、途中で「1+1は3ですから」と言われたような気分だ。

「NEWS23」での上氏の発言が間違いということにはならないが、これまでの意見に間違いがある場合、一般的な推論法からいっても、信憑性が問われるのではないか。
メディアは陽性適中率などの数字にあまり関心がないのか、理解できないのかは知らないが、こうした間違いをする「専門家」を番組で使って大丈夫なのかと筆者は心配になる。

6 :
日本内部の状態なんてわかるわけない検査も実施してないんだから
統計に出来ることなんて各種の不連続の情報をモデリングによって連続的に扱えるようにするだけ
過去の断片的情報から未来の状態は推定出来るが過去の情報もないんじゃ無理

7 :
連日早朝からNHK実況に入り浸り、時間が空くと近隣のガソリン価格を調査する春日井のキチガイデブ
himucchiことYou Give Me All I Need(通称:雪見オナニー)
http://hissi.org/read.php/livenhk/20200228/b2xSTlZOdCs.html
http://hissi.org/read.php/livenhk/20200229/Ni9jZG1TYXg.html
http://hissi.org/read.php/livenhk/20200302/K3JsaE80MU4.html
http://hissi.org/read.php/livenhk/20200303/SEdUSVI5OTE.html
http://hissi.org/read.php/livenhk/20200305/YUN5TzJtWkE.html
himucchiさん
https://gogo.gs/user/himucchi
https://b.imgef.com/qQVnBfY.jpg
以前の車
https://d3rr6qn2571boz.cloudfront.net/images/user/himucchi-1356324134.jpg
現在の車
https://b.imgef.com/VnXdKYs.jpg
※自らネット上に本名を晒す救いようのない馬鹿
https://mixi.jp/show_friend.pl?id=5652001
https://b.imgef.com/BnHUoY5.jpg
himucchiことYou Give Me All I Need(通称:雪見オナニー)
昭和49年2月8日生まれ
昭和61年 名古屋市立栄小学校卒業
平成元年 名古屋市立前津中学校卒業 
現在 46歳素人童貞

8 :
収束時期のシミュレーションなら可能。

SEIRモデルで有病率を1%に固定して、集団のサイズを変化させてシミュレーションしてみたけどピークは変わらないな。
このモデルでは集会規模の大小には影響されないということになるな。

https://i.imgur.com/343K91V.png

有病率を変化させて流行の変遷をグラフにすると、

https://i.imgur.com/SZ15LKT.png
https://i.imgur.com/gnJVFnd.png

有病率を40%くらいに引き上げるとオリンピックのときには流行が収束していることになるw

9 :
>>5
陽性的中立は陽性的中率のことだけど、有病率がわからないと計算できないね。

10 :
感度70%特異度90%で
有病率と陽性的中率・陰性的中率の関係をグラフにしてみた。
https://i.imgur.com/HGqPv2y.jpg

陽性的中率が0.8になるのは有病率が0.63のとき

そのRのコードはこれ。
rm(list=ls())

pr2pv <- function( # prevalence to predicative value
pr ,# prevalence
sn=0.7, # sensitibity=TP/(TP+FN)
sp=0.9) # specificity=TN/(TN+FP)
{
N=1 # polutaion million, billion,or any proper unit
si=pr*N # sick population
he=(1-pr)*N # healthy population
TP=si*sn
FN=si*(1-sn)
TN=he*sn
FP=he*(1-sn)
PPV=TP/(TP+FP)
NPV=TN/(TN+FN)
PV=c(PPV=PPV,NPV=NPV)
return(PV)
}

prev=seq(1e-7,1,length.out = 1000)
plot(prev,sapply(prev, function(x) pr2pv(x)['PPV']),bty='l',type='l',
ylab='predicative vale',xlab='prevalence(log)',main='sensitity=0.7,specificity=0.9',log='x',lwd=2)
lines(prev,sapply(prev, function(x) pr2pv(x)['NPV']),lty=3,lwd=2)
legend('center',bty='n',legend=c('Posivive Predicative Value','Negative Predicative Value'),lty=c(1,3),lwd=2)

abline(h=0.8,col='gray')
uniroot(function(x) pr2pv(x)['PPV']-0.8, c(0,1))

11 :
"
SEIR MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R + nu*S(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
"
SEIRモデルのパラメータ

SEIR2 <- function(
# Parameters
contact_rate = 10, # number of contacts per day
transmission_probability = 0.01, # transmission probability
beta = contact_rate * transmission_probability, # tranmission rate
infectious_period = 20, # infectious period
gamma = 1 / infectious_period, # Prob[infected -> recovered]
latent_period = 5, # latent perior
sigma = 1/latent_period, # The rate at which an exposed person becomes infective
mu = 0, # The natural mortality rate
nu = 0 , # vaccination moves people from susceptible to resistant directly, without becoming exposed or infected.

Ro = beta/gamma, # Ro - Reproductive number.

# Initial values for sub-populations.
s = 99, # susceptible hosts
e = 0, # exposed hosts
i = 1, # infectious hosts
r = 0, # recovered hosts
# Compute total population.
N = s + i + r + e,
# Output timepoints.
timepoints = seq (0, 365, by=0.5),
...
)

有病率を1%とすると、3000人にクルーズ船でも100人の屋形船でも感染者のピークは変わらないな。
同一時間あたりのcontact_rateとtransmission_probabilityが宴会での方が高いからだろうな。

パラメータを変えてグラフを書いてみた。

https://i.imgur.com/hCfBTyc.png

12 :
ためになる

13 :
少し前、C国から「14%が再陽性」という報告があったが、
再感染? 再燃? 等と取りざたされていた。
しかし、そのようなことを仮定せずとも、PCR検査の感度が低いことを考えれば、全く問題ない。
病状は安定はしているものの、実は31%程は、まだウイルスを持っている集団があったとする。
そこに、感度40%、特異度100%のPCR検査を行い、二回続けて陰性と出た場合、退院できるとすると、
69%+31%×(6/10)^2 = 69%(陰性) + 11.16%(偽陰性) =80.16%
が退院してくる。
しかし11.16/80.16=93/668≒13.922%≒14% は完治していない。
退院してもいいかも、と判断し、退院を目的としたPCR検査を施した集団の罹患率や、
PCR検査機器の感度や特異度の正確な値は判らないが、上のような数値を用いれば、十分説明がつく。
もっと、PCR検査の感度が低いことを認識すべき

14 :
>>10
有病率そんなに高い必要ないだろ?
37%だろ

15 :
>>13
感度40%なら検査で+なら感染なし、-なら感染していると判定すれば感度60%になるぞ。感度が50%以下はありえん。

16 :
>>14
ご指摘ありがとうございます。

プログラムにバグがありました。
>10は撤回します。

正しくは

https://i.imgur.com/jO5diiG.jpg

pr2pv <- function( # prevalence to predicative value
pr ,# prevalence
sn=0.7, # sensitibity=TP/(TP+FN)
sp=0.9) # specificity=TN/(TN+FP)
{
N=1 # polutaion million, billion,or any proper unit
si=pr*N # sick population
he=(1-pr)*N # healthy population
TP=si*sn
FN=si*(1-sn)
TN=he*sp
FP=he*(1-sp)
PPV=TP/(TP+FP)
NPV=TN/(TN+FN)
PV=c(PPV=PPV,NPV=NPV)
return(PV)
}

ご指摘のとおり、有病率36.36%のときに感度0.7,特異度0.9で陽性的中率が0.8になりました。

17 :
PCR検査の感度を0.7、特異度を0.9とする。
広島県で第一号の感染発見例は
県の検査で1回陰性、病院の検査で2回陽性、症状軽快した現時点で陰性(何回やったか報道がないので1回陰性とする)であるという。
ここで問題:
検査前の感染確率の分布が一様分布であると仮定して、
現在患者が感染している確率とその95%CIを計算してみた。
"

https://i.imgur.com/4CzTEWA.jpg

sn=0.7 # sensitivity
sp=0.9 # specificity
plus=2 # how many positive result?
minus=2 # how many negative result?
n=1e7 # how large the simulation
p0=runif(n,0,1)
oz0=p0/(1-p0) # prob -> odds
pLR=sn/(1-sp) # TP/FP
nLR=(1-sn)/sp # FN/TN
oz1=oz0*pLR^plus*nLR^minus # Bayesian formula
p1=oz1/(1+oz1) # odds -> prob
BEST::plotPost(p1,showMode =T) # show mode instead of mean
BEST::plotPost(p1,showMode =F)
HDInterval::hdi(p1) # Highest Density Interval
quantile(p1,c(.025,0.5,.975)) # 95%CI by quantile
summary(p1) # mean, median
MAP <- function(x) {
dens <- density(x)
mode_i <- which.max(dens$y)
mode_x <- dens$x[mode_i]
mode_y <- dens$y[mode_i]
c(x=mode_x, y=mode_y)
}
MAP(p1)['x'] # show mode

18 :
肺がある、ということは新型コロナ肺炎の診断に感度100%である。
しっぽがある、ということは新型コロナ肺炎の診断に特異度100%である。

19 :
>>15

感度というのは、病気の人を正しく陽性と判定する確率
特異度というのは、正常の人を正しく陰性と判定する確率

感度40%で陰性が出たからといって、60%の確率で陽性だなんて、あり得ない。
病気でない人を、正しく陰性と判断したのか、病気の人を誤って陰性と判断したのか、区別がつかないのだから。

感度を1から引いた方が、いい精度になるなんて、まるっきり判っていない人の発言。

20 :
混同行列は最低限の知識として知っておくべきだな

21 :
>>19
まるっきり判っていない人=あんた

22 :
>>19
病人を100人集めたら10人が左利きであった。
左利き試験の感度は10%、右利き試験の感度は90%
ただ、これだけのこと。

23 :
>>22
1000人の集団があり、900人は右利き、100人が左利きだったとする。
ここに「左利き検定機器」というものがあり、感度が40%で、特異度が90%だとする。するとこの機器は、

100人の左利きの内の40人に対して「左利きだ」と正しく判定し、60人に対して「左利きだとは断言できない」と判定する。
900人の右利きの内の90人に対して「左利きだ」と誤って判定し、810人に対して「左利きだとは断言できない」と判定する。

左利き率10%、感度40%、特異度90% という組み合わせでは、
陽性と判断されたもののうち真の陽性は 4/13
陰性と判断されたもののうち真の陰性は 81/87
となる。

これが、正しい感度、特異度の意味。それを、>>22のように解釈しているあなたは、間違っていますよ。

24 :
>>19
病人を100人集めたら10人が左利きであった。
左利きなら病人と判定するのが左利き試験。
右利きなら病人と判定するのが右利き支援。
左利き試験の感度は10%、右利き試験の感度は90%
ただ、これだけのこと。

新型コロナ肺炎の診断に肺があるという所見は感度100%

25 :
罹患率の事を感度だと勘違いしてる?
プログラムするなら、言葉をきちんとしらべないと。

26 :
>>17
数値を変化させてグラフ化できるように関数化
事前分布は一様分布でなくJeffereysを採用
必要に応じて指定

"
PCR検査の感度を0.7、特異度を0.9とする。
広島県で第一号の感染発見例は
県の検査で1回陰性、病院の検査で2回陽性、症状軽快した現時点で陰性(何回やったか報道がないので1回陰性とする)であるという。

検査前の感染確率の分布が一様分布であると仮定して、
現在患者が感染している確率とその95%CIを計算してみた。
"
PCR2prob <- function(
sn=0.7, # sensitivity
sp=0.9, # specificity
plus=2, # how many positive result?
minus=2, # how many negative result?
n=1e5,
p0=rbeta(n,0.5,0.5), # prior : Jeffreys' distribution
print=TRUE) # how large the simulation
{
oz0=p0/(1-p0) # prob -> odds
pLR=sn/(1-sp) # TP/FP
nLR=(1-sn)/sp # FN/TN
oz1=oz0*pLR^plus*nLR^minus # Bayesian formula
p1=oz1/(1+oz1) # odds -> prob
if(print & length(p0)>1){ # p0 ~ some distribution
BEST::plotPost(p1,showMode =T) # show mode instead of mean
print(HDInterval::hdi(p1)) # Highest Density Interval
print(quantile(p1,c(.025,0.5,.975))) # 95%CI by quantile
print(summary(p1)) # mean, median
dens = density(p1) # print mode
mode_i = which.max(dens$y)
print(c(Mode=dens$x[mode_i]))
}
if(length(p0)==1) print(p1) # when p0 is point-designated
invisible(p1)
}

PCR2prob()
PCR2prob(p0=rbeta(1e5,1,1)) # p0 ~ uniform distiribution
PCR2prob(p0=0.5) # point probability
PCR2prob(minus=3) # one more negative result
PCR2prob(minus=4) # two more negative result

27 :
>>25
罹患率と有病率は別の概念。
感度・特異度に有病率は不要。
的中率の計算には有病率が必要。

28 :
インフルエンザ迅速検査キットの感度が50%ならコインを投げてインフルエンザかどうか決めてるのと同じ。

29 :
>> 罹患率と有病率は別の概念。

はい、その通りですが何かありました?

問題にしているのは、検査機の性能(正しくは病気との組み合わせで決定される性能)。
つまり、陽性とすべきものを、正しく陽性と判定するか、陰性とすべきものを、正しく陰性と判定するか、
その正確度が、それぞれ感度、特異度と呼ばれると言うことです。
この認識をあなたは間違っていますよと指摘しています。

30 :
>>19
病人を100人集めたら10人が左利きであった。
左利きなら病人と判定するのが左利き試験。
右利きなら病人と判定するのが右利き支援。
左利き試験の感度は10%、右利き試験の感度は90%
ただ、これだけのこと。

31 :
>>29
頭があるということは髄膜炎の診断に感度100%って理解できている?

32 :
>>29
これ、理解できてる?

肺がある、ということは新型コロナ肺炎の診断に感度100%である。
しっぽがある、ということは新型コロナ肺炎の診断に特異度100%である。

33 :
正確度って何?

肺がある試験は新型コロナ肺炎の診断に感度100%である。
しっぽがある試験は新型コロナ肺炎の診断に特異度100%である。

どちらも100%だが、何の役にもたたんぞ?

正確度の定義をまず、書いてくれ。

34 :
私は、感度と特異度の説明を何度も与えている。
あなたの、「感度」を説明して欲しい。
でなければ、何も議論できないだろう。

35 :
>>34
感度sensitivityはtrue positive rateであるくらい誰でも知っている。

頭があるということは髄膜炎の診断に感度100%って理解できている?
頭がある試験が陽性であった髄膜炎患者の人数/頭がある試験を受けた患者の髄膜炎の患者人数=1
感度100%

あんたのいう正確度って何?

36 :
>>あんたのいう正確度って何?
私が正確度という言葉を使ったのは、29だけだとおもわれる。
23の内容を読み解けば、正確度の意味は自ずとわかるはずですが、判らないのですか?

改めて言います。

私は、感度と特異度の説明を何度も与えている。
あなたの、「感度」を説明して欲しい。
でなければ、何も議論できないだろう。

37 :
>>36
感度はtrue postive rate、どの教科書にでも書いてあんだろ。
頭があるということは髄膜炎の診断に感度100%
誰にでも頭はあるから、当然 感度=true postive rate 100%だぞ。

正確度って何だよ?

38 :
specificity=TP/(TP+FN)
正確度って何だよ?

39 :
感度が50%のインフルエンザ迅速検査キットと感度が40%のインフルエンザ迅速検査キットとどちらが有用か?
感度40%の検査結果を逆に判定すれば感度60%になるから後者の方が有用。
正確度って何だよ?

40 :
>>38
間違えた
sensitivity = TP/(TP+FN)
specificity = TN/(TN+FP)
正確度って何だよ?

41 :
病人を100人集めたら10人が左利きであった。
左利きなら病人と判定するのが左利き試験。
右利きなら病人と判定するのが右利き支援。
左利き試験の感度は10%、右利き試験の感度は90%
ただ、これだけのこと。

42 :
新型コロナ肺炎の診断に 「肺がある」という試験は感度100%。
新型肺炎患者を100人集めれば100人肺があるから100人陽性で感度は100%。
診断の何の役にもたたんぞ。
んで、正確度って何だよ?

43 :
感度は価値判断ではなくて単なる割合。
正確度って何だよ?

44 :
>>30や>>15を記述するときの時の「感度」の認識と、
>>37のスレ記述時の「感度」の認識は同じですか?
感度を正しく認識している人が、30や15のような
記述をするとは思えません。どこかで、改めたのではないですか?
15で書いた内容は、未だに正当な指摘だと思っていますか?

45 :
未だに、>>39のようなことを思っているのですか?

100万人の中で1000人がインフルエンザに感染しているとします。

感度50%、特異度99%のインフルエンザ迅速検査キットを使うと、
陽性は、1000×(0.5)+999000×(0.01)=500+9990=10490 人でます。
陰性は、989510 人です。

感度40%、特異度99%のインフルエンザ迅速検査キットを使うと、
陽性は、1000×(0.4)+999000×(0.01)=400+9990=10390 人でます。
陰性は、989610 人です。


さて、どちらが優秀なのですか?

46 :
>>45
それは陽性的中率での評価。
感度が高いことが優秀とは別の話。
finger 10 testという試験、患者の指が10本あれば疾患があるとするテスト。
あらゆる疾患に100%近い感度を持つ。
それが優秀かどうかは別。

47 :
正確度というのを数式で書いてくれ。

48 :
検査が優秀というのは尤度比で考えるべき、感度だけで考えるのは間違い。
頭があるということは髄膜炎の診断に感度100%である。

49 :
RPAスレのセキュリティ意識高い系がここでも暴れてんのか?

50 :
>>ID:hVKkfTiV
>>39
>>感度40%の検査結果を逆に判定すれば感度60%になるから後者の方が有用。
検査キットの結果を普通に解釈すると10390人を疑わしいと見ますが、
45の設定で、あなたの上の記述を信用すると、989610人を疑わしいとみると言うことになりますね。
実際は10390人の中に400人の真陽性がて、989610人の中に600人の偽陰性(=病人)がいます。
確かに、989610人の中には1.5倍の病人がいますが、集団の数は1.5倍どころか95倍います。
このような転換が「後者の方が有用」になる素晴らしい発想なんですね。どうぞ独自の道を歩み、頑張ってください。
何でそんなに、日常用語の正確度にこだわるのか、話題そらしのテクニックとしか思えませんが、回答します。
>> つまり、陽性とすべきものを、正しく陽性と判定するか、陰性とすべきものを、正しく陰性と判定するか、
>> その正確度が、それぞれ感度、特異度と呼ばれると言うことです。
このように書きました。読めば判ると思うのですが、感度の正確度は、
「陽性とすべきものを、正しく陽性と判定するか」における「正しく」の割合を指します。
つまり、「(陽性と判定された数)/(陽性とすべきものの数)」です。
同様に、特異度の正確度は、「(陰性と判定された数)/(陰性とすべきものの数)」です。
時間も無駄なので、最後になると思いますが >>15の指摘は明らかに間違いです。
それを認められず、話題をそらし、ぐだぐだと書き込みをするような方とはまともな議論はきません。

51 :
>>26
ベイズ扱いたいなら軽快という状態ももなんらかのパラメータおいて更新させないとだめでしょ
あきらかにinformativeを無視してるのは数字遊びといわれる

52 :
感度の正確度?
頭があるということは髄膜炎の診断に感度100%である。
100%だから最も正確なのか?

53 :
>>51
ご指摘通り。
それどころか陰性陽性の順番も考慮してないのも数字遊びではある。

54 :
有病率が異なる集団がたとえば自覚症状やスクリーニング後だったりするなら、ppvを求めるときに同一感度特異度を使うのは強い仮定かもね

興味がある集団に対しての真の感度と特異度はわからないだろうけれども
参照した感度はどういう集団に対してのものなのかを把握するのは大切かと思います

55 :
体調が悪くなった時コロナウイルスに感染している確率を計算してみた(確率的思考入門)
https://wakara.co.jp/mathlog/20200310

56 :
某国の新型コロナ感染症の有病率を0.1、PCR検査の感度を0.7 特異度を0.9とする
検査陽性陰性の人を無作為に50人ずつ集めて、カレーを頻回に食べているかを調査した結果が
以下の通りであった。
検査陽性 検査陰性
カレー頻食 a(=18) b(=30)
カレー稀食 c(=32) d(=20)
カレーを頻食する新型コロナ感染に罹りにくいと結論できるか? 危険率0.05で検定せよ。

57 :
>>56
訂正
カレーを頻食すると、新型コロナ感染に罹りにくいと結論できるか? 危険率0.05で検定せよ。

58 :
僕は新型コロナはアメリカ軍による攻撃だと信じています。疑問に思っているのは、
・他のウイルスも含めて危険なウイルスの遺伝子の分布を図にできないか?
・報道がコロナに集中してマスクなどの株価を予想する様子をマルチエージェントシミュレーションにできないか?
・新型コロナは、物理的にどこのどういう部分が、上手く人をRようにできているか?
質問は難しいものであり、答えれなくても構いませんが、専門家はどのように考えているんですか?

59 :
東大の数学科って頭良いんですか?なんか答え出せ。出ないと量子コンピュータで
殺します。

60 :
僕は宇宙人に指令されてます。

日本を動かすための量子大域最適文章は?
「大嫌警察死麻薬」
=(大嫌いなのは警察が死ぬことと麻薬だ|
大嫌いなのは警察、死と麻薬こそが信条だ|
(検死)台にKira、警察が死んで、それがすっげーおもしろ!)

61 :
大場つぐみを動かすための量子大域最適文章は?
「ゲッいずみ緑」
=(月、أسمي、グリーン姉さん|これが本名か。)

私を殺して地獄へ落としなさい。

62 :
99 117: 名無しさん@1周年 [sage] 2020/03/14(土) 19:39:12.52 ID:XAHjOrxJ0
ここまで統計学の専門家が声をあげていないことがムカつく
統計学者って安部に忖度してんの?自民党のサポーターなの?超絶糞バカなの?

63 :
検査数は増えてるが、感染者数の伸びはそうでもない
http://or2.mobi/data/img/274348.png

新型コロナウイルス国内感染の状況
https://toyokeizai.net/sp/visual/tko/covid19/

64 :
instaでこんなの見つけた
https://i.imgur.com/ibZUgtN.jpg
https://www.instagram.com/p/B9s971RJ7gI/

65 :
2020/03/13 11:00時点で東京都で1524人検査して87人陽性と報告されている
# https://data-science.gr.jp/theory/tpd_negative_binomial_distribution.html
発見率を87/1524は一定仮定して
新型コロナ陽性患者を10人集めたいとする。
必要な被検者数の期待値と95%信頼区間を求めよ。
シミュレーション解は
> mean(re)
[1] 175.306
> HDInterval::hdi(re)
lower upper
77 278

# simulation
sim <- function(){
i=0
s10=0
while(s10!=10){
i=i+1
s10 = s10 + sample(1:0,1,prob=c(p,1-p))
s10 == 10
}
i
}
k=1e4
re=replicate(k,sim())
mean(re)
HDInterval::hdi(re)

66 :
>>65
発見率は平均値87/1524、0.01-0.10の区間の二項分布に従うと仮定する。
新型コロナ陽性患者を10人集めたい。
必要な被検者数の期待値と95%信頼区間を求めよ、とすると。

期待値175人 95%CIは142−210人

67 :
https://blogos.com/article/443001/
■英国政府の分析と方針 名無しさんが作成したまとめ

・ピークは10〜14週間後にやってくると分析
・海外への修学旅行の中止や基礎疾患のある人のクルーズ船旅行の自粛を呼びかけ
・イギリスの実際の感染者は他国の検査数と陽性率を見ると5000人から1万人
・もはや感染を止めることは不可能なのでゆっくり感染して集団免疫を獲得すること目指す
・来シーズンにはワクチンが開発されている可能性があるため
 感染して免疫を獲得した人とワクチン接種を受けた人の割合をコントロールしながら60%に持っていく戦略
・今封じ込めすぎて感染のピークがNHS(国民医療サービス)の繁忙期である冬にやって来ると大変なので
 一番暇な夏に来るようにコントロールする
・最悪シナリオの罹患率はドイツの70%を上回る80%に設定して実行計画を立てている
・一斉休校はしない
 休校は効果はあるものの最小限であり、効果を上げるのは13〜16週間以上の休校が必要になる
 効果より害の方が大きい
・フライト制限についても中国便を95%削減してもエピデミックを1〜2日遅らすぐらいの効果しかなく
 50%ぐらい減らすのがちょうど良い
・イギリスの感染はイタリアより4週間遅れて進んでいる
・基本戦略
 (1)ハッピーバースデーを2回歌いながら石鹸と温水で手を洗う
 (2)熱や咳の症状がある人は1週間、自宅で自己隔離→ピークを20〜25%削減
 (3)家族全員を自宅で隔離→ピークを25%削減(未実施)
 (4)新型コロナウイルスに脆弱なお年寄りをケア→死亡率を20〜30%削減
・集団免疫を獲得するまで先は長いので今からあまり頑張りすぎないように

68 :
国内で患者数が大幅に増えたときに備えた医療提供体制の確保について
今後、国内で新型コロナウイルス感染症患者数が大幅に増えたときに備え、各都道府県、保健所設置市及び特別区(以下「都道府県等」という。)における外来を受診する患者数等について、以下の数式を用いて計算いただき、ピーク時の医療需要の目安としてご活用の上、必要な医療提供体制を確保していただくようお願いいたします。
(1)(ピーク時において1 日あたり新たに新型コロナウイルス感染症を疑って外来を受診する患者数)=(0-14 歳人口)×0.18/100+(15-64 歳人口) ×0.29/100+(65 歳以上人口) ×0.51/100
(2)(ピーク時において1 日あたり新型コロナウイルス感染症で入院治療が必要な患者数)=(0-14 歳人口)×0.05/100+(15-64 歳人口)×0.02/ 100+(65 歳以上人口) ×0.56/100
(3)(ピーク時において1 日あたり新型コロナウイルス感染症で重症者として治療が必要な患者数)=(0-14 歳人口)×0.002/100+(15-64 歳人口) ×0.001/100+(65 歳以上人口) ×0.018/100
注1)ピーク時は、各都道府県等において疫学的関連性が把握できない程度に感染が拡大した時点から概ね3か月後に到来すると推計されている。ただし、公衆衛生上の対策を行うことにより、ピークが下がるとともに後ろ倒しされる。
注2)重症者とは、集中治療や人工呼吸器を要する管理が必要な患者を指す。
注3)当該計算式は、都道府県等の単位以下における医療提供体制を確保するためのものであるとともに、各都道府県等によってピークを迎える時期が異なるため、全国の人口を用いて計算することや単純に各自治体が算出するピークの数値を足し合わせることは、不適切な取扱いとなることに留意いただきたい。なお、当該計算式については、今後新たな知見等により変更される可能性がある。
注4)実際には、ピーク時に至るまでの日々の患者数の増加はばらつきがあり、増加曲線は推計通りの形にならない可能性が高いため、現実の患者の発生動向も踏まえて適切に体制を確保することが必要。
注5)当該計算式については、今後新たな知見等により変更される可能性がある。

69 :
この行列を使って何か引き出せるだろうか?

> v=c(0.18,0.29,0.51,
+ 0.05,0.02,0.56,
+ 0.002,0.001,0.018)
> (mat=matrix(v,3,byrow=T))
[,1] [,2] [,3]
[1,] 0.180 0.290 0.510
[2,] 0.050 0.020 0.560
[3,] 0.002 0.001 0.018
> mat*100
[,1] [,2] [,3]
[1,] 18.0 29.0 51.0
[2,] 5.0 2.0 56.0
[3,] 0.2 0.1 1.8
>

70 :
単なる連立方程式を解くだけだから、つまらんね。

問題 : ある都市でピーク時に外来1000人、入院600人、重症20人であったとすると、この都市の14歳以下の人口は何人と推測されるか?

v=c(0.18,0.29,0.51,
0.05,0.02,0.56,
0.002,0.001,0.018)
(mat=matrix(v*100,3,3,byrow=T))
# https://www.toukei.metro.tokyo.lg.jp/juukiy/2019/jy19qa0200.xls
(x=matrix(c(1601348,9035668,3103714)/1e4,ncol=1))
(y=round(mat%*%x))
solve(mat,y)

y=matrix(c(1000,600,20))
solve(mat,y)

71 :
「安倍晋三」を動かすための量子大域最適文章は?
「アベシトミナミヘイケ」
=(安倍氏と低学歴な大学である南カリフォルニア大学へ行け。|
安倍氏、富、並、へ行け。
あべし、と、南アフリカ共和国へ行け。)
「新型肺炎の強制入院」を動かすための量子大域最適文章は?
「哈佛死吧」
=(ハーバード大学はRばいいんじゃね?|統合失調症。)

72 :
僕は星籍を地球からアルファ星に変えました。地球を量子で軍事威嚇します。

73 :
申し訳ございません。僕の統合失調症の陽性症状の急性期でした。数学板的には
ジョン・ナッシュとして定義があるでしょうか。でも僕の中国の友達も困ってるみたい
なので書き込みさせていただきました。情報としては、流行ってる地域と報道され
てるのに、その友達の友達に感染した人はいるか?と聞いても、いない、と返って
来ました。僕は一旦落ちますね。

74 :
【y=X^2】イタリアさんの死者数と感染者数、指数関数的に増えていた
https://hayabusa9.2ch.sc/test/read.cgi/news/1584296919/

75 :
前川喜平氏が説く「数学必修廃止論」に疑問 出会い系バーでの「貧困調査」の具体的な成果なぜ示さないのか
 前川喜平・前文部科学事務次官が週刊東洋経済4月14日号で、貧困対策の一つとして、「高校中退をなくすには数学の必修を廃止するのがいい」と発言している。
 高校中退を防ぐという方向性はいいだろう。低学歴者は低所得になりがちで、犯罪率も高いことは各種の調査で示されている。
 せっかく「貧困調査」で出会い系バーに通ったのだから、前川氏には延べ何人の女の子を調査し、その中で高校中退の数は何人だったのかを示してもらいたかった。
さらに、高校中退の理由はどうだったのか。これも貧困調査を行ったのならば当然示せるだろう。そうした調査の成果が具体的に示されていないので、実のところ、前川氏が説く数学必修廃止論の理由はよく分からない。
数学をある程度知らないと、自然科学のみならず多くの社会科学を習得することはできない。数学の必修廃止は日本の国力を低下させることにつながるのではないか。特に、社会に必要なエンジニアの育成にも支障が出るだろう。
 文部科学省による調査をみても、高校の中退理由は、「学業不振」が1割弱、「学校生活への不適応」が4割、「進路変更」が3割強である。
つまり、数学必修を廃止しても、中退理由の1割も除くことができない。数学の必修化をやめれば中退が少なくなるとの結論を導き出すことはできないだろう。
 これらの理由の推移をみると、かつては学業不振が多かったが、最近は低下しており、学校生活への不適応が徐々に増えている。
 他校への転校などの進路変更はいいとして、学校生活の不適応をいかに減らすかが、中退を防ぐためには重要だろう。前川氏の出会い系バーにおけるフィールドワークに基づく具体的な対策を聞いてみたい。
https://www.zakzak.co.jp/soc/amp/180417/soc1804170006-a.html

76 :
ソースTBS
上昌広先生と森永先生
「ランダムに1000人にPCR検査すれば統計学的に市中感染率はわかるんですよ」

Twitterの東大生
「PCR検査が6割程度しか正確じゃないのに、なんでそんなことが言えるんだ」


どっちがただしい?
東大生が正しい場合、6割だとして、
何人に検査すれば信頼区間99%に収まる?

77 :
>>68
https://www.mhlw.go.jp/content/000605276.pdf
これか。厚労省もけっこう悲惨な事態を想定してんだな

78 :
>>76
PCRで診断確定するのに偽陰性ってどういうこと?
偽陰性と言われた人はどうやって新型コロナ肺炎だと確定されたんだ?

79 :
都道府県ごとのシミュレーションによる検討
ttps://www.fttsus.jp/covinfo/pref-simulation/

80 :
>>76
感染率をθとして検体をn回とった時の陽性者の数Xは
感度をp、(感染者が陽性と判定される確率)
特異率をq (非感染者が陽性と判定される確率)
とするとXの分布は平均が
pθ+q(1-θ)
となるのでこの値を推定すればθの値も推定できます。
感度-特異率
が正の値なら回数を増やせばいくらでも小さい99%信頼区間に入れることができます。
千回のとき実際どれくらいの市中感染者数をどれくらいの信頼度で測れるかは計算機ないとわかんね

81 :
確率微分方程式ですね

82 :
>>80
特異度qはTN/(TN+FP)だから
偽陽性率は1-qなので
X 〜 pΘ+(1-q)(1-Θ)
では?

83 :
>>80
特異度は「陰性のものを正しく陰性と判定する確率」です。(wikiより引用)
認識が間違っていたため、式も間違っているパターンですね。
82さんの式が正しい。

84 :
ありゃ?
記憶と反対だったか。

85 :
まぁそれなら
感度+特異度>1
のときは検査数を上げていいなら望むだけ市中感染率を正しく推定できる
ですな。
なので上先生の勝ち。
東大生の負け。

86 :
カレーで免疫ができるかの検定

某国の新型コロナ感染症の有病率を0.1、PCR検査の感度を0.7 特異度を0.9とする

検査陽性陰性の人を無作為に各々100人ずつ集めて、カレーを頻回に食べているかを調査した結果が
以下の通りであった。
カレーを頻食する新型コロナ感染に罹りにくいと結論できるか?

検査陽性 検査陰性
カレー頻食 a(=36) b(=60)
カレー稀食 c(=64) d(=40)

   PCR(+)  PCR(-)
Exposed 36 60 96
Nonexposed 64 40 104
Total 100 100 200

にPPV(陽性的中率),NPV(陰性的中率)を使って計算すると
Disease Nondisease Total
Exposed 17.89286 78.10714   96
Nonexposed 29.42857 74.57143   104
Total 47.32143   152.67857   200

検査陽性は有意にカレー暴露が少ないといえるが、
感染に関しては有意にカレー暴露が少ないとはいえない、

という結論になった。

p値は 各々 0.0007032002 と0.1092375975

達人の検算を希望。

87 :
r=x/nとして
Θ = (q + r - 1)/(p + q - 1)

88 :
>>85
プログラムを組んで計算させてみた(有病率の事前分布は一様分布を仮定)

感度0.7 特異度0.9として
100人に1人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(100,1)
mean median mode lower upper
0.0196 0.0166 0.0101 0.0004 0.0464

1000人に10人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(1000,10)
mean median mode lower upper
0.0110 0.0107 0.0099 0.0050 0.0175

10000人に100人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(10000,100)
mean median mode lower upper
0.0101 0.0101 0.0100 0.0082 0.0121

100000人に1000人陽性だった場合の有病率の期待値、中央値、最頻値、95%信頼区間
> sim(100000,1000)
mean median mode lower upper
0.0100 0.0100 0.0100 0.0094 0.0106

89 :
>>85
感度+特異度>1 の条件は必要?
感度0.4 特異度0.5でシミュレーションしてみたけど
nを増やせば信頼区間が狭くなっていく


> sim(100,1,sen=0.4,spc=0.5)
mean median mode lower upper
0.0196 0.0166 0.0102 0.0004 0.0463
> sim(1000,10,sen=0.4,spc=0.5)
mean median mode lower upper
0.0110 0.0107 0.0099 0.0050 0.0176
> sim(10000,100,sen=0.4,spc=0.5)
mean median mode lower upper
0.0101 0.0101 0.0101 0.0082 0.0121
> sim(100000,1000,sen=0.4,spc=0.5)
mean median mode lower upper
0.0100 0.0100 0.0100 0.0094 0.0106

90 :
>>89
ああ、p+q<1だと逆にあてにならなすぎて逆張りしてθが推定できるんだな。

91 :
プログラムにバグがあったので修正というより、stanでのMCMCに変更。

> PCR(100,1)
mean lower upper
0.01497496587 0.00004299248 0.04480331292
> PCR(1000,10)
mean lower upper
0.001642898836 0.000001299175 0.004982795701
> PCR(10000,100)
mean lower upper
0.000174692810 0.000000052897 0.000560041026
> PCR(10000,1000)
mean lower upper
0.003876080828 0.000002574352 0.010176384444

まあ、nを増やすほど信頼区間が狭くなるという結論には変わりない。

92 :
【富山県最強伝説】新型コロナウイルスPCR検査件数 54人 陽性0人
https://asahi.2ch.sc/test/read.cgi/newsplus/1584811696/
ある集団から54人を無作為に選んでPCR検査したら陽性0であった。PCR検査の感度0.7 特異度0.9としてこの集団の有病率の期待値と95%信頼区間を求めよ。

93 :
>>92
> PCR(54,0)
mean lower upper
0.0282436750 0.0000053869 0.0839653803

94 :
日本人の平均身長を推測するのにその値は1〜2mの間であるという弱情報事前分布は合理的。
現時点での新型コロナの有病率は0.1未満の一様分布という弱情報事前分布として
【富山県最強伝説】新型コロナウイルスPCR検査件数 54人 陽性0人
ある集団から54人を無作為に選んでPCR検査したら陽性0であった。感度0.7 特異度0.9としてこの集団の有病率の期待値と9信頼区間を推測する。
事前分布のパラメータを変えるとstanだとコンパイルが必要になるのでjagsでプログラムを組んでみた。



# 感度SEN, 特異度SPCの検査でN人中X人が陽性であったときの推定有病率prevalence
# 弱情報事前分布はprevalence ~ dunif(0,UL) , UL:上限
library(rjags)
PCRj <- function(N,X,UL=1,SEN=0.7,SPC=0.9,verbose=TRUE){ # UL:upper limit of dunif(0,UL)
modelstring=paste0('
model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
prev ~ dunif(0,',UL,')
}
')
if(verbose & UL!=1) cat(modelstring)
writeLines(modelstring,'TEMPmodel.txt')
dataList=list(n=N,x=X,sen=SEN,spc=SPC)
jagsModel = jags.model( file="TEMPmodel.txt" ,data=dataList,quiet=TRUE)
update(jagsModel)
codaSamples = coda.samples( jagsModel ,
variable=c("prev","p"), n.iter=1e6, thin=10)
js=as.matrix(codaSamples)
BEST::plotPost(js[,'prev'],xlab='prevalence',showMode = TRUE) ; lines(density(js[,'prev']),col='skyblue')
round(c(mean=mean(js[,'prev']),HDInterval::hdi(js[,'prev'])[1:2]),10)
}

実行結果
> PCRj(54,0,UL=0.1)

model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
prev ~ dunif(0,0.1)
}
|**************************************************| 100%
mean lower upper
0.0245104429 0.0000003782 0.0703606657

95 :
統計のことははぜんぜんわからんが、確率論的には
検査陽性率の期待値=有病率×感度+(1-有病率)×(1ー特異度)
なんだから、
有病率<<1なら、検査陽性率の期待値≒有病率×感度+(1- 特異度)
っちゅうことで、感度70%で特異度が100%なら検査陽性率の3割増し
が有病率だとみなせばよろしいんでしょ。
一方、特異度が90%しかなかったりすると陽性率の期待値が10%も
水増しされちゃうから、有病率の推定が大幅に困難になる。
つまり、特異度がよほど高くなければ(99%とかね)、有病率が数%以下
の状況でランダム検査しても偽陽性が真陽性を上回って混乱をきたす。
(見かけ上致死率は下がる、ってのが南朝鮮の状況か)

96 :
>>95
同感。
有病率0.1%で特異度0.9なら偽陽性だらけになるんだよね。

97 :
>>95-96
疾病率=陽性率、すなわち無作為抽出ならその算段も成立するかもね。
現行の制度では推定される市中感染率が1/10000程度で陽性率が5%ほどらしいから現行制度下での検査はうまく行ってますね。
ただ感度+特異度が1.7位あるので検査数増やした方が有益である事は間違いがない。

98 :
>>95
誤解や、誤解を引き起こしかねない内容があったので、勝手に補足させていただきます。
>>っちゅうことで、感度70%で特異度が100%なら検査陽性率の3割増し
>>が有病率だとみなせばよろしいんでしょ。
この場合、検査陽性率の期待値=有病率×感度 なのだから、1/(0.7)=1.4285...
3割増しではなく、4割強増しと言うべき。
>>一方、特異度が90%しかなかったりすると陽性率の期待値が10%も
>>水増しされちゃうから、有病率の推定が大幅に困難になる。
感度70、特異度100で、有病率 1%、0.1%、0.01%、0.001%の時、10万人に検査したときの
検査陽性者数は700,70,7,0.7人です。 有病率に比例して増減し、これらは、はっきり見極めできます。
一方、感度70、特異度90で、同じ事をすると、それぞれ、10600,10060,10006,10000.6人です。
有病率に応じて差はあるのですが、常に偽陽性が約10000人いて、誤差を考えると、見極めは困難です。
「陽性率の期待値が10%も水増しされちゃうから」と書かれていますが、これは、
検査対象者10万人に対する約10%=1万人が常に水増しされているのであって、
陽性と判定される人の数が10%水増しされていると誤解しないよう、補足しておきます。

99 :
>>98
心配性だねw
3割が4割でもたいして変わらんがな。
陽性率の期待値が10%水増しってのも、期待値の10%じゃなくて、
期待値そのものが10%上昇するんだってことくらい、元の式見りゃ
自明だしね。

そもそも感度や特異度の具体的な数値はよくわかんないんだから、
具体的な数字にこだわってもしょうがない。
有病率が低いときの、有病率と陽性率と特異度の関係がわかれば
よろし。

100 :
こういう計算が必要になる。
事前分布を選択する(例. 有病率は高々10%として(0.0.1]の一様分布とする)、
陽性確率は真陽性確率と偽陽性確率の和、
陽性数はこの確率で二項分布、
以上を実際に得られた検査数と陽性数から最尤値となるパラメータとして有病率の分布を出して期待値や信頼区間を出す。
手計算では無理。

101 :
感度0.7 特異度0.9でコンピュータに計算させると

陽性率が30%なら有病率の推測値は

> PCRj(100,30)
mean lower upper
0.3396123 0.1994400 0.4964517

> PCRj(1000,300)
mean lower upper
0.3343576 0.2876152 0.3832246
> PCRj(10000,3000)

mean lower upper
0.3333387 0.3186388 0.3481056
> PCRj(100000,30000)
mean lower upper
0.3332425 0.3286774 0.3380952

と 期待値も信頼区間もそれらしい値になるが、


陽性率が1%なら有病率の推測値は偽陽性が増えまくるので陽性率と有病率が乖離する、
> PCRs(100,1)
mean lower upper
0.01497496587 0.00004299248 0.04480331292
> PCRs(1000,10)
mean lower upper
0.001642898836 0.000001299175 0.004982795701
> PCRs(10000,100)
mean lower upper
0.000174692810 0.000000052897 0.000560041026
> PCRs(100000,1000)
mean lower upper
0.000016780530193 0.000000002738145 0.000051489256688


陽性率が60%なら、今度は偽陰性が増えまくるので偽陰性が増えまくるので陽性率と有病率が乖離する。
> PCRs(100,1)
> PCRs(100,60)
mean lower upper
0.8280581 0.6766480 0.9764282
> PCRs(1000,600)
mean lower upper
0.8335023 0.7826355 0.8825766
> PCRs(10000,6000)
mean lower upper
0.8334634 0.8187334 0.8492064
> PCRs(100000,60000)
mean lower upper
0.8332873 0.8289242 0.8379535

102 :
Rとstanでベイズ統計ができるなら、以下のコードで実行可能。
パッケージ rstan と BEST(信頼区間グラフ描出用)が必要


library("BEST")
library("rstan")
rstan_options(auto_write = TRUE)
options(mc.cores = parallel::detectCores())
options(scipen = 5)

model.string='
data{
int n; // sample size
int x; // number of positive test
real<lower=0,upper=1> sen; // sensitivity 0.7
real<lower=0,upper=1> spc; // specificity 0.9
real<lower=0,upper=1> ul; // uniform(0,ul)
}

parameters{
real<lower=0,upper=1> prev; // prevalence
}

transformed parameters{
real<lower=0,upper=1> p;
p = prev*sen + (1-prev)*(1-spc) ; // probability of positive test result
}

model{
x ~ binomial(n,p);
prev ~ uniform(0,ul);
}

'
writeLines( model.string , con='model.stan' )
corona1.model=stan_model('model.stan')
# saveRDS(corona1.model,file='corona1.rds')
# corona1.model=readRDS('corona1.rds')

PCRs <- function(N=1000,X=10,UL=1,SEN=0.7,SPC=0.9,verbose=FALSE,...){
data = list(n=N,x=X,sen=SEN,spc=SPC,ul=UL)
fit.corona = sampling(corona1.model, data=data,
seed=1234,control=list(adapt_delta=0.99),...)
if(verbose) print(fit.corona, prob=c(0.025,0.5,0.975),pars=c('prev'),digits=8)
ms=rstan::extract(fit.corona)
BEST::plotPost(ms$prev,showMode = T,xlab='prevalence') ; lines(density(ms$prev),col='skyblue')
c(mean=mean(ms$prev),HDInterval::hdi(ms$prev)[1:2])
}

103 :
>>102(補足)

非対称分布の信頼区間計算にパッケージHDIntervalも必要。

104 :
>>76
偽陽性率が現時点での有病率を大きく上回るから東大生の言い分が正しい。
有病率が3割程度になれば上先生の言い分が正しい。

105 :
>>104
1000人調べたときの検査陽性率と推定陽性率をグラフにしてみた。
灰色直線は検査陽性率=推定陽性率の直線
検査陽性率が低いときは過小評価、高いときは過大評価する。
https://i.imgur.com/wmOAj5i.png

106 :
何言ってんの?
市中感染率をいくらでも正しく推定できるかなんでしよ?
結論のために問題変えるなよ。
政治の話をここに持ち込むなよ。

107 :
>>104
上の言い分も一理あるし、東大生の言い分も一理あるw
特異度が90%を越える高い値だという前提があればこうなる。
1)検査陽性率が低く(数%以下)、特異度がほぼ100%でないの
 なら、市中感染率を推定するのは難しい。とはいえ、上限は
 (検査陽性率/感度)程度で抑えられる。つまり10%以下くらいの
 ことは言えるが、0%かもしれない。
2)一方、検査陽性率が高ければ(数十%以上)、下限は検査
 陽性率程度と見込めるが、市中感染率は感度に依存して大きく
 変化する。つまり、数十%以上とは言えるが100%近いかどうか
 までは不明。
ってことで、検査陽性率からある程度市中感染率の目安は立つが、
それがどこまで意味があるとみなせるかは疑問。TPO次第か。

108 :
あと、補足すると、感度と特異度が正確にわかっているのなら、
統計学的に市中感染率を推定することはある程度可能だけど、
実際はそうではないから、上様の言い分には意味がない。

109 :
>>105
感度と特異度を変化させて、検査陽性率と推定有病率の関係をグラフにしてみた。
https://i.imgur.com/YEtcSfn.png

110 :
だから自分の言いたい結論が先に決まっててそれに合わせて好き勝手に問題読み替えてるだけじゃん?
そんな考え方しかできないなら理系板に来んなよ。

111 :
>>108
感度も特異度も定数でなく何らかの分布に従うパラメータとしてモデルを組めばいいだけの話だろ。

112 :
感度が最頻値0.7 標準偏差0.05のベータ分布β(58.229, 25.527 )
特異度が最頻値0.9 標準偏差0.05のベータ分布β(36.172, 4.908)
に従うと過程して
model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
sen ~ dbeta(sn[1],sn[2])
spc ~ dbeta(sp[1],sp[2])
prev ~ dunif(0,ul)
}
こういうモデルでMCMCすれば可能。
実行結果
> PCRj2(1000,10) # 陽性率1%で有病率を推定
mean lower upper
0.001667604624 0.000000053909 0.004956969423
> PCRj2(1000,300) # 陽性率30%で有病率を推定
0.33414 0.28797 0.38253
> PCRj2(1000,600) # 陽性率60%で有病率を推定
mean lower upper
0.83296 0.78428 0.88496

113 :
β分布のパラメータを出すRスクリプト
# a,b to Mode,mean,variance
ab2Mmv<-function(a,b){
M<-(a-1)/(a+b-2)
m<-a/(a+b)
v<-a*b/((a+b)^2*(a+b+1))
cat('Mode =',M,'mean =',m,'variance =',v,'\n')
invisible(c(Mode=M,mean=m,variance=v))
}
# Mode,kappa to mean,variance
Mk2mvab= function( mode , kappa ) {
# if ( mode < 0 | mode > 1) stop("must have 0 <= mode <= 1")
# if ( kappa <2 ) stop("kappa must be >= 2 for mode parameterization")
a = mode * ( kappa - 2 ) + 1
b = ( 1.0 - mode ) * ( kappa - 2 ) + 1
m=a/(a+b)
v=m*(1-m)/(a+b+1)
return( c( mean=m , variance=v,a=a,b=b ) )
}
# Mode,variance to a,b
Mv2ab = function(mode,vari){
f=function(kappa) Mk2mvab(mode,kappa)[2] - vari
kappa=uniroot(f,c(2,10000))$root
ab=Mk2mvab(mode,kappa)[c('a','b')]
ab2Mmv(ab[1],ab[2])
return(ab)
}
(sn=Mv2ab(0.7,0.05^2))
curve(dbeta(x,sn[1],sn[2]),bty='l')
(sp=Mv2ab(0.9,0.05^2))
curve(dbeta(x,sp[1],sp[2]),bty='l')

114 :
上記の準備をして以下で実行
PCRj2 <- function(
N,X,
UL=1,
SEN=0.7,
SPC=0.9,
SD=0.05,
print=TRUE){
# UL:upper limit of dunif(0,UL)
library(rjags)
library(BEST)
sn=Mv2ab(SEN,SD^2)
sp=Mv2ab(SPC,SD^2)

modelstring=paste0('
model
{
x ~ dbin(p,n)
p <- prev*sen + (1-prev)*(1-spc)
sen ~ dbeta(sn[1],sn[2])
spc ~ dbeta(sp[1],sp[2])
prev ~ dunif(0,ul)
}
')
writeLines(modelstring,'TEMPmodelj.txt')
dataList=list(n=N,x=X,ul=UL,sen=SEN,spc=SPC,sn=sn,sp=sp)
jagsModel = jags.model( file="TEMPmodelj.txt" ,data=dataList, quiet=TRUE)
update(jagsModel)
codaSamples = coda.samples( jagsModel ,
variable=c("prev","p","sen","spc"), n.iter=1e5, thin=5)
js=as.matrix(codaSamples)
if(print){
BEST::plotPost(js[,'prev'],xlab='prevalence',showMode = TRUE)
lines(density(js[,'prev']),col='skyblue')}
re=c(mean=mean(js[,'prev']),HDInterval::hdi(js[,'prev'])[1:2])
return(re)
}
options(digits = 5)
options(scipen = 5)
PCRj2(1000,10) # 陽性率1%で有病率を推定
PCRj2(1000,300) # 陽性率30%で有病率を推定
PCRj2(1000,600) # 陽性率60%で有病率を推定

115 :
>>99
期待値というのは、無次元量ではない。観測値とか物理量と同じように単位をつけて議論できる量。
従って「期待値が10%増える」等という言葉があれば、期待値が1.1倍になるのだろうと感じるのが普通。
そのような性質を持つ期待値に対し、「10%増える」と表現し、
「期待値の値そのものが、0.1増えることを意味している」
と説明しなければならないならば、やはり誤解を招きやすい表現だと思う。
今回の期待値は比率であり、無次元量であったから、「10%」と言うのが、
どちらの意味としても、通用したため発生したとは言えるが、読み手の立場に立った表現を望む。
似た議論に、選挙時の投票率がある。前回の投票率が40%。今回の投票率が50%だとする。
「前回に比べ、今回は10%増えました」
「前回に比べ、今回は25%増えました」
どちらも、言い得る表現。聞き手の混乱を避けるため、前者の意味で使う場合、
「10%ポイント増えました」とコメントするのを最近聞くようになった。
私にはよい傾向と感じるが、中には、違いは何かとか、混乱の源の存在さえ意識していない人もいるようだ。
「3割増も4割強増も大した差ではない」には、「式が違っても結果が誤差範囲なら問題ない」
という考えが背景に見える。そのような方が、混乱を引き起こしかねない表現を用いた。
だから、補足した。果たして本当に杞憂だったのだろうか?

116 :
富山では62人PCR検査して陽性0人(3月22日までの集計)有病率を推定とその信頼区間を推定したい。
http://www.pref.toyama.jp/cms_pfile/00021629/01366377.pdf
PCR検査の感度は最頻値0.6標準偏差0.1、特異度は最頻値0.9標準偏差0.05のベータ分布(正規分布は負になったり1を超えるので不適)、
有病率は一様分布として、推定される有病率の期待値と95%を計算せよ。
図示するとこんな感じ。
https://i.imgur.com/Ip6gSCa.png
stanのモデルのスクリプトはこれ
sn,spはβ分布のパラメータ、その計算法は既述
data{
int n; // sample size
int x; // positive test result
real<lower=0,upper=1> ul; // uniform(0,ul)
real<lower=0> sn[2]; // sen ~ beta(sn[1],sn[2])
real<lower=0> sp[2]; // spc ~ beta(sp[1],sp[2])
}
parameters{
real<lower=0,upper=1> prev; // prevalence
real<lower=0,upper=1> sen; // sensitivity
real<lower=0,upper=1> spc; // specificity
}
transformed parameters{
real<lower=0,upper=1> p;
p = prev*sen + (1-prev)*(1-spc) ; // probability of positive test result
}
model{
x ~ binomial(n,p);
prev ~ uniform(0,ul);
sen ~ beta(sn[1],sn[2]);
spc ~ beta(sp[1],sp[2]);
}

117 :
>>116
ここで問題
感度特異度の分布はそのベータ分布として
何人陰性が続けば95%信頼区間の上限が0.05を下回るか?

118 :
>>117
感度、特異度の分布???

119 :
>>118
何でも確率変数にするのがベイズ推計。
p値の分布すら考えるぞ。

120 :
PCR検査の感度は最頻値0.6標準偏差0.1、特異度は最頻値0.9標準偏差0.05のベータ分布を事前分布にしたけど、
事後分布はstanによるMCMCで
感度は期待値0.57 95%信頼区間は[0.37,0.77]
特異度は期待値0.96 95%信頼区間は[0.91,0.99]
とコンピュータが計算してくれる。

121 :
>116のように弱情報事前分布を設定することで事後分布は次のように描ける。
https://i.imgur.com/J1Xqdfj.png

122 :
>>54
いや、特異度の事前分布を設定することで事後分布をMCMCで求めることができる。
>116の設定での結果が>121

123 :
>>122
結局事前分布の設定次第ってことはないの?

124 :
>>123
日本人の平均身長を推測するのにその値は1〜2mの間であるという弱情報事前分布は合理的。
感度特異度の分布に正規分布を使うのはアホ。
負になったり、1を超えたりするから。

125 :
>>123
感度を0.4-0.8の一様分布、特異度を0.8-1.0の一様分布にしても有病率の推定値は
> round(re$mci,5)
mean lower upper
0.02827 0.00000 0.08592
であまり変わらないね。

126 :
sensitivity ~ N(m=0.6,sd=0.1) specificity ~ N(m=0.9, sd=0.05)
にしても推測有病率は平均3%弱で 95%CIは0-8%とあまり分布の形にはよらないね。
mean lower upper
0.026841384 0.000000153 0.081071379
確率だと定義域が0-1で計算しやすいのでβ分布を使うことが多い。

127 :
>>119
そう?
統計の推定の理論で推計する母数は確率変数ではないと習ったけど?

128 :
>>127
時代は頻度主義統計からベイズ統計だよ。

129 :
頻度主義統計でも最尤推定では
データを固定してパラメータを動かすだろ。

130 :
>>127
階層ベイズモデルを扱ったことないの?
>112は簡単な実例。

131 :
>>128 >>130
何を持ってベイズ統計っていってんのか知らん。
pcr検査の感度とは被験者が感染者である場合の検査結果が陽性となる条件付き確率でしょ?
条件付き確率の分布ってどういうことよ?
確率がまた確率になるってなんの話してんの?
変数Xの平均とか分散とかは統計学においては推定すべき定数であって確定値。
それの分散なんて数学的に意味不明。
一体どこの統計学の教科書にそんなデタラメ書いてあんの?

132 :
まちがえた。
確率の平均がまた確率変数になるってどういうことよ、ね。
式でかけば確率変数Xの平均E(X)の分散ってなんの話ってことになる。
確率変数Xはある標本空間上の関数だけどE(X)は実数だよ?

133 :
>>131
ベイズ階層モデルも組めない奴とは議論にならんね。
分散の事前分布に逆ガンマ分布でなく半コーシーを使う方がいいとかいう議論も理解できんだろ。

134 :
>>131
ベータ分布は定義域が[0,1]で二項分布の確率の確率密度関数としてベイズ階層モデルでは頻用されるよ。
ベイズ階層モデルを使わずにこの計算できるならやってみてくれ。
020/3/24 11:00時点で検査人数での陽性率は171/2013であるという。
新型コロナ肺炎のPCR検査の感度は5〜7割、特異度は9割前後らしい。幅をもたせた値を使って検査をうけたグループの有病率を計算せよ。

135 :
>>133
まぁ言わんとする事はもちろんわかるし伝わるけど、疫学だから数学やってる人間がなんとなく伝わるではダメだろ?
数学だけの話ではなく、疫学は実社会とキチンと繋がってるんだから?
統計学ではあくまで検定する母数は定数。
それは確率モデルでは実数値であり、定数。
そして統計データを確率変数に割り当てる。
当然それらの確率変数は一つの測度空間の一つしかない確率変数であり、平均も分散もひとつしかない定数値。
それらをいっぱい考えてどうこう言ってるんだろうとは思うけどそんなの統計学や疫学の一般的な考えにはない。
何故なら現実世界はひとつしかなく、確率変数に対応している統計量も一個しかない。
もちろん母数がめちゃめちゃ大きい統計量で例えば10000個のデータを100こずつ切って100個の統計量を100の世界からとってきたなんて考えが無理クリできなくはないが、そんな考え方は普通しない。
それはあくまで100個ずつに区切られた10000個の一つの世界の確率変数としか扱わない。
そういうオリジナルな考えで捉えたいならそれは勝手だけど、それならそれで話の中で明示しないとダメ。
数学の世界なら言わずもがなの話は言わなくてもエスパーしてもらえても、疫学、統計学の世界では実社会とつながる話だからダメ。

136 :
>>135
能書きいいから、

ベイズ階層モデルを使わずにこの計算できるならやってみてくれ。

020/3/24 11:00時点で検査人数での陽性率は171/2013であるという。
新型コロナ肺炎のPCR検査の感度は5〜7割、特異度は9割前後らしい。幅をもたせた値を使って検査をうけたグループの有病率を計算せよ。

137 :
>>136
こういう判断が現実には必要。
検査特性を無視して単純な割り算だと検査を受けた人の有病率は8.5%弱になるけどこれは過大評価か過小評価か?

138 :
検査感度が5-7割、特異度が9割前後なら
検査陽性率=有病率とすると常に過大評価かどうか気になったので陽性数を変化させて計算してみた。
検査感度はmode=0.6,sd=0.1 特異度はmode=0.9,sd=0.05のベータ分布に設定してJAGSでベイズ階層モデルをたてて計算。


https://i.imgur.com/zTdxRrb.png

陽性率が20%未満のときは過大評価、それ以上のときは過小評価である、という結論になった。

ベイズ統計を理解できている人の検証希望。

139 :
>>138
プログラムの練習がてらに、
MCMCのアルゴリズムの異なるstanでベイズ階層モデルを組んで検証。
当然ながら、同様の結果。 検査陽性率が20%を境に過大評価と過小評価が入れ替わる。
https://i.imgur.com/ItSNWdD.png

140 :
>>136(自己レス)

今日の都の発表で(171+41)/(2013+89) に検査陽性率が増えたので再計算。

https://i.imgur.com/THdYDqT.png

141 :
>>138
サンプリング回数を増やしてグラフを完成。

https://i.imgur.com/kLjCD2y.png

142 :
>>140
89は検査数で検査人数は74という。
計算し直すと
> PCRj2(N,r,SEN=0.6,SD1=0.1,SPC=0.9,SD2=0.05,N.ITER=5e5)
|**************************************************| 100%
mean lower upper
0.05720165 0.00000015 0.1332385

143 :
41/74の推測有病率は
mean lower upper
0.8121975 0.5957315 0.9999992

144 :
オリンピック延期発表後の検査陽性率は88/169で52%だが、
PCR検査の感度と特異度がはっきりしないので、検査陽性率をこの集団の有病率とするのは正しくない。
88/169のときの感度・特異度と推定有病率の関係をグラフにしてみた。
https://i.imgur.com/iQC88tZ.png
感度0.6、特異度0.9のときの推定有病率は85%で陽性率からの憶測は過小評価といえる。

145 :
検査陽性率が小さいときには、実際の有病率より過大評価してるし、
検査陽性率が高いときは、過小評価してるだろうってことでしょ。
そのくらいは定性的に理解できる。

146 :
>>145
どこが境目かは直感じゃわからんね。

147 :
そりゃ感度や特異度次第だからな。

まあ、数%と数十%では違うんだということがわかればいいんじゃね?
境目なんかどうでもいいでしょ。

148 :
陽性率が15%でこれを有病率の推測値に使うのは過大評価なのか過小評価がわからんのはまずいね。

149 :
オリンピック延期決定以後の検査数と陽性数
subjects=c(74,95,87)
positives=c(41,47,40)
PCRs3(subjects,positives,iter=10000,warmup=1000)
として、
感度・特異度を考慮した推定有病率は
mean lower upper
0.77417 0.56756 0.99944
>
日々の陽性数が二項分布に従うとして計算。

150 :
志村けんみたいな有名人がコロナに感染してることから日本全体のコロナ感染者数を推定してみる。

まず、日本の有名人が1000人いるとしよう。
つぎに、日本でコロナに感染していない確率をxとしよう。
すると、有名人1000人が一人も感染していない確率は、xの1000乗となる。これをyとおこう。すると、有名人が一人でも感染している確率は(1-y)となる、これをzとおこう。
まとめると以下の関係がなりたつ。

・コロナに感染しない確率:x
・有名人が一人もコロナに感染しない確率:y=x^1000
・有名人が一人でもコロナに感染している確率:z = 1-y

151 :
志村は感染したわけなので、以下、2つのケースにわける

ケース1: zが10%のとき
z=0.1, 故にy = 1-0.1=0.9
故にx = y^0.001よりx=0.9^0.001=0.999894
これがコロナに感染していない確率なので、
コロナ感染確率は、1-0.999894=0.000106
よって日本のコロナ感染者数は推定
120,000,000*0.000106=12,720人

ケース2:zが50%のとき
ケース1と同様の計算で、
日本のコロナ感染者数は推定
120,000,000*0.000693=83,160人

152 :
検査が少ないから感染者増が緩やか?数学的に検証してみた
http://agora-web.jp/archives/2045047.html

主な関係国について、新型コロナ感染者数の片対数グラフがある。
http://agora-web.jp/cms/wp-content/uploads/2020/03/WS000876.jpg
FT.comより

感染者数の伸びが日本は緩やかと解釈するのが普通だが、検査が少ないからとする解釈もある。本当はどうなのか計算してみる。

結論を先に書くと、検査が多いか少ないかは関係ない。

153 :
対数をとると係数(感染者の発見率)は定数項になり、今回の片対数グラフの整理法の前提としてキャンセルされる
日本が展開しているのは患者認定の精度上昇であり、医療リソースの効果を最大化して死者数を低く抑えている要因の一つといえる

154 :
キャバクラ客100人から無作為に5人から検体を採取してこの検体を混合攪拌してコロナ検査したところ陽性であった。

(1)100人のキャバクラ客の陽性数の期待値と95%信頼区間を求めよ。
(2)PCR検査の感度0.6、特異度0.9として100人のキャバクラ客の感染数の期待値と95%信頼区間を求めよ。

155 :
>>151
> m=1000 # 有名人の人数
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 63590201/1002
> as.numeric(E)
[1] 63463.27

6万3000人と計算された。

156 :
>>155
良く分からんが、ありがとう。
こちとら高校レベルの確率の知識しかないもんで。

157 :
>>156
n(=10)人の中にi人の感染者がいるとき無作為にm(=2)人を選ぶ。
選ばれた2人の中に少なくとも一人の感染者がいる確率をP[x]として、
n個からr個選ぶ組み合わせの数をChoose(n,r)で表すと

P[xi]=1- choose(10-x,2)/choose(10,2)

xを0から10まで変化させて、

Σx*P[x]/(ΣP[x])で

期待値が求まる。

158 :
タイプミス修正

P[x]=1- choose(10-x,2)/choose(10,2)

159 :
何このアホスレ?

160 :
有名人の数を増やしてみても同様の結果になった。

> # 有名人が感染
> library(gmp)
> m=18200 # 有名人の数(桜を見る会参加人数)
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 1154070201/18202
> as.numeric(E) # E=63463.27 (m=1000) , E=1154070201/18202=63403.48(m=1.268e5)
[1] 63403.48

161 :
>>160
なんだってー。直感に反するな

162 :
>>161
総人口100人として有名人の数を1〜100人まで変化させて、有名人に感染者がいたときの100人中の感染者の数をグラフにすると

https://i.imgur.com/SMFnNNl.png

有名人の数を変化さえても期待値にさほどの変化はない。

163 :
>>162
感染者が1名以上という条件だと、
有名人の割合が一定以上になると飽和するんだな。

164 :
Ax: x人の感染者がいる(x=0〜n)という事象
B:最低一人の感染陽性判定という事象
Pr[Ax|B]=Pr[B|Ax]Pr[Ax]/Pr[B]
Pr[Ax]:事前確率
Pr[B|Ax]:尤度
Pr[B]:周辺尤度(規格化定数)

求めたい期待値Eは
Σ(x*Pr[Ax|B])/ΣPr[Ax|B] = Σ(x*Pr[B|Ax]Pr[Ax])/Σ(Pr[B|Ax]Pr[Ax])
Pr[Ax]がxにかかわらず定数であれば
E=Σ(x*Pr[B|Ax])/Σ(Pr[B|Ax])

事前確率分布を一様分布と仮定しての計算
つまり、感染者が1人の確率も50人の確率も100人の確率,....も一定という前提での計算。

165 :
>>163
そうみたいですね。

> data.frame(有名人=1:10,期待値=sapply(1:10,function(x) fn(100,x)$mean))
有名人 期待値
1 1 67.00000
2 2 62.75000
3 3 60.20000
4 4 58.50000
5 5 57.28571
6 6 56.37500
7 7 55.66667
8 8 55.10000
9 9 54.63636
10 10 54.25000
> data.frame(有名人=1:10*10,期待値=sapply(1:10*10,function(x) fn(100,x)$mean))
有名人 期待値
1 10 54.25000
2 20 52.31818
3 30 51.59375
4 40 51.21429
5 50 50.98077
6 60 50.82258
7 70 50.70833
8 80 50.62195
9 90 50.55435
10 100 50.50000

166 :
「有名人」を「wikに載ってる人」と定義し
その数を10000人としてそのうち4人(志村、藤浪、長坂、伊藤隼人)
感染したとしても結果は変わらない

167 :
昨日の東京のコロナ陽性者は87人検査して63人陽性であったという。
検査の感度0.6 特異度0.9と仮定して、87人中に感染者は何人と推定されるか?

真陽性率=感度=0.6
偽陽性率=1−特異度=0.1

87人中の感染者数をxとすると

陽性者数= 感染者数*真陽性率 + 非感染者数*偽陽性率

63=x*0.6+(87-x)*0.1

これを解くとあり得ない答になる。

168 :
>>166
総人口n人、有名人m人、そのうち感染者k人とすると
n人中の感染者の期待値は
x = 0 〜 nとして 、xCkはx人からk人選ぶ組み合わせの数を表す

Σ(x*(xCk/nCm))/Σ(xCk/nCm) = =Σ(x*(xCk))/Σ(xCk)
となるのでmの値には依存しない。



 

169 :
>>168
するとこの計算で出てくる推定感染者数6万人って値は意味ない感じですか?

170 :
>>167

陽性者数が87人中63人になるような感度と特異度を最小二乗法で求めると。

> (opt=optim(c(0.6,0.9,63),nazo,method='CG'))
$par
[1] 0.916014625 0.779617519 63.002729987

171 :
学術の巨大掲示板群 - アルファ・ラボ
ttp://x0000.net

数学 物理学 化学 生物学 天文学 地理地学
IT 電子 工学 言語学 国語 方言 など

172 :
>>170
初期値に依存するから意味のないスクリプトであると判明したので撤回します。

173 :
>>169
単なる数字の遊びだろうね。

174 :
>>169
前提となっているのが、
日本人1億2680万人いるとして
日本人の感染者数が1人である確率も1億人である確率も同じと、一様分布を仮定しているのが現実離れしている。
よって現実的には意味がない。

175 :
https://youtu.be/WUMN_71p3Js?t=56

専門家会議がモデルを出したから議論してくれ

176 :
>>175
Reed Frost モデルかな?
何を使ったかには言及がなかった。

177 :
Reed -Frostはパラメータが1個ですむから推定しやすいんだろう。

178 :
>>76
54119人という値になった。
計算プログラムは以下の通り。

# width of 99% confidence interval when 1000 subjects are examined
p2w <- function(
prevalence,
subjects=1000,
sensitivity=0.6,
specificity=0.9,
conf.level=0.99){
# prevalence -> width of 99% confidence interval
n=subjects
p=prevalence*sensitivity+(1-prevalence)*(1-specificity) # positive rate=prev*TP+(1-prev)*FP
q=1-p
2*qnorm(1-(1-conf.level))*sqrt(p*q/n) # width of 99%CI

}

p2w=Vectorize(p2w)
prevalence=seq(0,1,by=0.01)
plot(prevalence,p2w(prevalence),bty='l',type='l',lwd=2,ylab='99%CI width',
main='subjects:1000\nsensitivity:0.6\nspecificity:0.9')
optimize(p2w,c(0,1),maximum=TRUE)
#
sj2w <- function(subjects){ # subjects -> maximum 99%CI width & its prevalence
optimize(function(prev) p2w(prev,subjects),c(0,1),maximum = TRUE)
}
# at how many subjects 99%ci width equals 0.01
uniroot(function(x,u0=0.01) sj2w(x)$objective-u0,c(1000,100000))

179 :
上って、灘校東大理IIIの超秀才のはずなのに、なんで
あんなに頭の悪い発言ばかりしてんの?

変な宗教にでも取り憑かれて理性が狂わされてるのかな?

180 :
日本人1億2680万人からX人を無作為に抽出してPCR検査して、感染者数(≠検査陽性者数)を信頼区間99%誤差±1%で検定したい。
PCR検査は感度0.6,特異度0.9とする。

何人を抽出すれば十分といえるか?

54000人程度になったけど、あってる?

181 :
>>179
超秀才は理Iに行くんじゃないの?

182 :
>>180
感染率の程度、感度・特異度の値の精度の言及無しに出された結論に、ほとんど説得力は無い。

183 :
>>182
感度 beta(13.6991,9.4661)でmode 0.6 sd=0.1
特異 beta(36.172,4.908) でmode 0.9 sd=0.05
でベイズの階層モデルを組んでみるかな。

184 :
>>183
そのβ分布を弱情報事前分布に設定して、乱数発生させて計算すると

54000人で99%信頼区間の幅の分布は

> summary(s2w(54000))
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.008144 0.009912 0.009981 0.009927 0.010005 0.010011

となるから、まあ、概ねあっていると思うな。

185 :
最も重要なファクターは事前感染率。
事前感染率はいくらに設定したの?

偽陽性が調査対象の10パーセント程含まれる。

医者が怪しいと判断した場合にのみ検査をする場合は、真陽性が調査対象の数十パーセントが期待できる。
このような場合は、真陽性は偽陽性より多数であることが期待でき、検査対象の正確な感染率は把握できるが、
「日本人1億2680万人からX人を無作為に抽出」のような方法だと、感染率0.01%(←現在確認できている感染者の
7倍程度が実際の感染者数に相当)辺りが妥当だと思われるが、この場合、五万人調査して、真陽性5人、偽陽性5000人
のような数字が出てくる。感染率0.02%だったとすると、真陽性10人、偽陽性5000人だ。
中央値のみで判断すると、例えば、5005人の陽性が出ると、0.01%で、5010人の陽性者が出ると0.02% のような
データが出てくる。誤差との見極めは困難。
このような数字から、信頼できる感染率が出せるのか?

186 :
>>185
一様分布

187 :
確率の分布を考えずにスポットで考える思考のやつとは議論にならんな。
ベイズ階層モデルやったことないの?

188 :
0%〜100% までの一様分布のようだな。
つまり、事前確率全く不明だから、1/2教の経典に従い、0.5=50%でやったということ。
医者が検査を行った方がよいと判断した集団でも、なかなか有病率50%はいかない。
そのような結果は、無作為抽出で必要なの調査人数はどれくらいか等という議論では使えない。
全住民を対象にした無作為抽出なら、十万人に一人 以上いる(いた)のは確実だった一方、
百人に一人 という程たくさんはいないだろう と見積もれる。0.001%〜1% 辺りで行うべき。
ちょっと考えれば判ることを指摘しているに過ぎない。
調査対象の有病率0.01以下の集団に対し、特異度90%の性能の機器で調査しても、ほとんどがエラー。
せめて 有病率 は、 1-特異度 と同じオーダーか、1-特異度 より大きくないと、扱えない。
特異度99.99%の機器を用意するか、でなければ、有病率を10パーセント程度以上に煮詰めてからやれというお話。

189 :
>>188
東京都の行政検査では陽性率が50%を越える日があるぞ。

190 :
有病率の事前分布を一様分布として
日々の陽性数は二項分布に従うとして
オリンピック延期決定後の検査を受けた集団での有病率をMCMC出だすと
(感度特異度は既述のβ分布を仮定)
> subjects=c(74,95,87,143,244,330)
> positives=c(17,41,47,40,63,68)
> PCRs3(subjects,positives,iter=10000,warmup=1000)
mean lower upper
0.37288732 0.09822213 0.63719043

191 :
>>188
別に有病率を(0,0.1)の一様分布にしても計算できるけど
都の行政検査も陽性率が50%を越える日もあったから一様分布でいいと思うね。行政検査に回った集団の話だけど。
感度・特異度も弱情報事前分布が設定できる。

192 :
一変数のポイント確率しか計算できない奴との議論は不毛だね。

193 :
結局なんの疫学データにも基づかない、疫学データで追試することもできない、なんの理論的根拠もない統計仮説下のお話なんて統計学、疫学できないな意味なんかないんだよな。
計算機で遊んでる以上の意味なんかない。

194 :
>>189
だからきちんと「なかなかいかない」と書きました。

>>191
目的が「日本人1億2680万人からX人を無作為に抽出してPCR検査して、感染者数(≠検査陽性者数)
を信頼区間99%誤差±1%で検定したい。 」なのだから、あなたの主張は前提を無視ししている。

195 :
>>193
計算機で遊ぶこともできずに電卓で計算して必死で書いていて虚しくない?

CTの診断能を検討した論文。

https://doi.org/10.1148/radiol.2020200823

誰でも鑑別できるのか疑問に思った

このペーパのTable 3に3人の読影医の結果が載っている。

TP FP TN FN sen spc PPV NPV accuracy
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60

陽性尤度比、陰性尤度比、Diagnostic Odd Ratio(陽性尤度比/陰性尤度比)を計算して加えると

TP FP TN FN sen spc PPV NPV acc PLR NLR DOR
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83 11.4 0.30 38
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80 6.1 0.32 19
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60 1.2 0.25 5

PPV,accuracy,DORから読影医3が劣っているようにみえる。

PPVで三者を検定してみる。多重比較になるので一番厳しいBonferri法で補正

Pairwise comparisons using Pairwise comparison of proportions

data: TP out of TP + FP

1 2
2 0.4 -
3 1e-15 2e-11

明らかに3が劣っている。

196 :
読影医1,2を加算して計算すると
感度72% [67-76]
特異度91% [88-94]
という結果が得られた。

しかし、現実には何でもコロナと診断する傾向のある読影医3も紛れこむからこういう読影医も加算して計算しないと現実的でないね。

問題
3人を統合したときの感度・特異度とその95%信頼区間を述べよ。

197 :
昔パソコンは習うより慣れろ、理屈なんかわからなくても使ってたらわかるってのがあったけど、まさに正反対の方向にダメダメだな。
学問に対するなんの畏敬の念もない。

198 :
>>197
>学問に対するなんの畏敬の念
ひょっとしてアホなの?

199 :
Housefield数の計算原理がわからなくても
この画像が新型コロナ肺炎かどうか、診断できる方が有用なんだよな。
https://pubs.rsna.org/na101/home/literatum/publisher/rsna/journals/content/radiology/0/radiology.ahead-of-print/radiol.2020200823/20200309/images/medium/radiol.2020200823.fig3d.gif
中心極限定理の証明できなくても、学問への畏敬とかなくても、二項分布を正規分布で近似して計算できる。

200 :
>>168 他皆様

有名人の感染者が増えてきましたが
市中感染率に影響はないという県警でよろしいのでしょうか?

201 :
>>200
サンプルサイズは期待値の信頼区間幅に影響するけど期待値そのものに影響しないってことでは?

202 :
市中感染率が増加の時はもちろんそうだが、一定、あるいは、減少傾向であっても、
経過日数が多くなれば、感染者数は多くなる。

例えば、十日に一人有名人の感染が報告されるというのが継続されていたなら、感染率は一定と
考えられるが、それが、一週間に一人 → 五日に一人 → 三日に一人 → ほぼ毎日 →...
のように、報告されるペースに変化があると、感染率も変化していると考えられる。

203 :
補足だが、あまりにも、有名人感染の報告頻度が多くなると、ニュースとしての価値が低くなり、
以前であったら報告されていたであろうケースが報告されなくなるということもあるので、
その辺も考慮して考える必要はある。

204 :
横浜市立大学データサイエンス学部佐藤彰洋教授のCOVID-19(新型肺炎)の感染拡大抑止に関する研究・検討資料内容を共有するページ
https://www.fttsus.jp/covinfo/#Tokyo
矢原 徹一:九州大学理学研究院教授の試算
https://jbpress.ismedia.jp/articles/-/59942

205 :
SEIR MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R + nu*S(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
の微分方程式の数値解を使ってシミュレーション
対策しない(外出を控えず、マスクもしない)方が患者や死者は増えるけど早く収束するな。
contact_rate と trannsmission_probabilityを変化させてグラフにしてみた。
https://i.imgur.com/6OgJkDb.png

206 :
一次産業ごと消滅していいならそうかもな

207 :
オリンピック延期決定以後の東京都の行政PCR検査での陽性率をグラフにすると
https://i.imgur.com/XMKErLV.png
(陽性数より検査件数の公表は2〜3日遅れる)

PCR検査は感度60%、特異度90%くらいなので検査を受けた集団の有病率はもっと多いはず。
感度(最頻値0.6 標準偏差0.1)、特異度(最頻値0.9 標準偏差0.05)のベータ分布に設定、有病率は(0,1)の一様分布でMCMCしたみた。
https://i.imgur.com/1ZkOk33.png

有病率40%くらいありそうだな。   

208 :
新型コロナ肺炎に再感染があるとして流行具合をシミュレーションしてみた。
赤が感染者
上:再感染率0%
中:再感染率1%
下:再感染1%に治癒確率を5倍にする治療薬がある場合
https://i.imgur.com/nhCe0aZ.png

209 :
>>208
準拠したモデルはこれ
SEIRS MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t) + rho*R(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R(t) + nu*S(t) - rho*R(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
rho:再感染率(R->S)
Rのスクリプトはここに置いた
https://egg.2ch.sc/test/read.cgi/hosp/1584050953/417-420

210 :
>>207
疑い例だけに絞って検査してるんだから、有病率が高いのは当たり前。
検査を拡大すれば感染者数は増えるが、有病率はぐっと下がるだろう。

211 :
>>210
検査を受けた集団の有病率の事前分布を(0,0.2)に設定して実行すると

https://i.imgur.com/QSd9OAj.png

MCMCで感度や特異度の事後分布が出せるのが面白い。

212 :
>>209
基本的に鎖国しているモデルだから、
入国者や出国者による人口増減とその保菌率・感染率を組み込んだモデルにしないと実態にそぐわないな。
昨今、輸入されているコロナの発症率・回復率などが異なるとすると益々、複雑なモデルになっちゃう。

213 :
死者数が少ないのは注目すべきことだけど、それもいつまで続くか、、、
発症から集中治療室に入るまで2週間弱。死ぬまでがさらに一週間。
ってことは、この2週間での感染者激増が死者数に反映するまで、
あと一週間かかるってこと。
重症者の激増もそろそろ始まることだと思われる。
検査数とか感染者数、重症者数etc.を可視化したデータってここくらいか?
https://toyokeizai.net/sp/visual/tko/covid19/

214 :
韓国は46万件の検査で感染者が1万人。
感染かどうかをどう確定したのか知らないけど、有病率が2%だと
すれば、特異度がよほど高くないと、陽性者のかなりの割合が
偽陽性ってことになりそう。

215 :
>>207
東京都は陽性者数は公表しても検査人数を迅速に公表しないのでRのパッケージAmeliaを使って多重代入法による欠測データ処理してみる。

#
subjects=c(74,95,87,143,244,330,41,145,164,469,NA,NA,NA)
positives=c(17,41,47,40,63,68,13,78,66,97,89,117,143)
(dataset=data.frame(subjects,positives))

# 検査実施人数を欠測データとしてAmeliaで推定
library(Amelia)
na.idx=which(is.na(subjects))
M=1000
set.seed(1234) ; a.out=amelia(dataset,m=M)
imp=a.out$imputations
NAsubject=NULL
for(i in 1:M){
NAsubject=rbind(NAsubject,imp[[i]][na.idx,1])
}
missing.data=round(apply(NAsubject,2,mean))
subjects[na.idx]=missing.data
PCRs3(subjects,positives,iter=10000,warmup=1000,verbose=TRUE)


行政検査例の有病率と95%信頼区間
mean lower upper
0.3745734 0.1048757 0.6575508

https://i.imgur.com/DxVNXad.png

216 :
4月5日の陽性者数が検査人数より多いのは単純ミス?

https://stopcovid19.metro.tokyo.lg.jp/

Ameliaでの欠測推測を確認しようと思ったのにもとのデータがあてにならない。

217 :
晋型コロナ肺炎に感度0.9,特異度0.9の迅速検査が開発されたと仮定する。
日本人1億2595万人からX人を無作為抽出して有病率を推定したい。
有病率の99%信頼区間幅を1%以内で検定したい。
何人を抽出すれば十分といえるか?

218 :
>>76
感度0.6 特異度0.9として1000人検査したときはの有病率の99%信頼区間幅は何%以内におさまるか?

219 :
>>216
検査結果の集計日と、対応する検査数の集計日が揃ってないからかもね。
データがあてにならないのはその通りかも。

220 :
https://imgur.com/3TTYKk8
スプレッドシートのgrowthで予測してみると、9月には人類滅亡しそうです。
元データは
https://www.worldometers.info/coronavirus/coronavirus-death-toll/

221 :
ソース不明な数字だけど

"名前:名無しさん@1周年[sage] 投稿日:2020/04/07(火) 20:29:49.57 ID:GcsEpAfR0 (PC)
他国の総感染者数が今の日本と同程度の時の死者数


イタリア, 感染3089人 死者107人
スペイン, 感染2965人 死者 84人
アメリカ, 感染3499人 死者 64人
イラン  , 感染3513人 死者107人
フランス, 感染3661人 死者 79人
日本   , 感染3123人 死者 77人
"
country=c('イタリア','スペイン','アメリカ','イラン','フランス','日本')
infected=c(3089,2965,3499,3513,3661,3123)
dead=c(107,84,64,107,79,77)

df=data.frame(country,dead,infected)
df
re.lm=lm(dead~infected,data=df)
summary(re.lm)
chisq.test(dead,infected)
names(infected)=country
names(dead)=country
pairwise.prop.test(dead,infected)

> chisq.test(dead,infected)

Pearson's Chi-squared test

data: dead and infected
X-squared = 24, df = 20, p-value = 0.2424

Warning message:
In chisq.test(dead, infected) : Chi-squared approximation may be incorrect
> pairwise.prop.test(dead,infected)

Pairwise comparisons using Pairwise comparison of proportions

data: dead out of infected

イタリア スペイン アメリカ イラン フランス
スペイン 1.00000 - - - -
アメリカ 0.00066 0.11005 - - -
イラン 1.00000 1.00000 0.01762 - -
フランス 0.01843 0.79242 1.00000 0.24130 -
日本 0.24724 1.00000 0.79242 1.00000 1.00000

P value adjustment method: holm

222 :
アメリカの致死率高くない?
現時点での死者数と感染者数からだと3%くらいなんだが、これは
見かけ上の数値で、実際には発症から死亡まで2週間以上かかかる
から、10日くらい前の感染者数を分母にしないと見誤る。
で、このタイムラグを考慮にいれると少なくとも10%くらいの致死率
になりそ。日本の2,3倍になる計算だ。

223 :
>>221
その数字もタイムラグを考慮に入れないと致死率を見誤るよ。
感染者の増大率が大きいところでは、死者数を過小評価する。
たとえば2週間後の死者数で比較すべき。

224 :
>>223
感染から死亡までの期間は一定でないからどうだろね。

225 :
SEIRモデルに再感染(免疫を失ってR からSへの変遷)があるとしてグラフ化してみた。

1万人に1人の感染者と9人の保菌者がいるとして、

再感染率0%のとき
https://i.imgur.com/XWzQN7I.png

再感染率0.1%(1000人に1人の割合で免疫を失う)場合
https://i.imgur.com/EdxIhMT.png

再感染率0.1%で外出自粛等で接触が8割減になった場合
https://i.imgur.com/sDppUfY.png

226 :
>>224
まあ、発症してすぐ感染が発覚するわけでもないから、
症状がある程度続いてから陽性判定されるとすれば、
10日前後のディレイかな。しかも、どのくらいの分散
かわかんないけど、正規分布で畳み込んだ感じで。

227 :
英国もフランスも致死率高いな。
のきなみ10%越え。

228 :
英国とフランスは医療崩壊してるの?

229 :
しらんがな

230 :
これこそ、国を守るってことだな。
キューバ政府は2020年3月24日(火)以降、外国人観光客の入国を認めないと発表しました。
キューバに入国できるのは居住者のみで、これには出張で短期または長期滞在する外国人も含まれます。
加えて、キューバに入国する人は全員14日間隔離されます。
商業活動は維持されますが、商船や航空機の乗務員の移動は制限されます。キューバの領空は封鎖されません。
今回の制限措置は30日間有効で、状況に応じて延長される可能性もあります。

231 :
>>216
オリンピック延期決定以降のデータで検討

陽性人数が検査人数を上回るデータは検査人数を欠測データ(NA)として計算する。
dates subjects positives
1 2020-03-24 74 17
2 2020-03-25 95 41
3 2020-03-26 87 47
4 2020-03-27 143 40
5 2020-03-28 244 63
6 2020-03-29 330 68
7 2020-03-30 41 13
8 2020-03-31 145 78
9 2020-04-01 164 66
10 2020-04-02 469 97
11 2020-04-03 551 89
12 2020-04-04 NA 117
13 2020-04-05 NA 143
14 2020-04-06 356 83
15 2020-04-07 271 79
16 2020-04-08 NA 144
その設定で
# LittleのMCAR検定 データが MCAR または MAR であるという帰無仮説のもとで検定
library(BaylorEdPsych)
LittleMCAR(dataset)$p.value
LittleMCAR(dataset)$p.value
this could take a while[1] 0.004907289
有意差がでて出鼻をくじかれた

232 :
https://twitter.com/koheikana/status/1248093870287499264
(deleted an unsolicited ad)

233 :
日本もすでに欧州同様指数関数ラインにのってる模様、
https://i.imgur.com/qAJa2Ty.png
欧州並になるのは文字通り時間の問題かと
日本のコロナ感染発覚者数
3月24日 1193
3月25日 1307
3月26日 1387
3月27日 1499
3月28日 1693
3月29日 1866
3月30日 1953
3月31日 2178
4月 1日 2384
4月 2日 2617
4月 3日 2935
4月 4日 3139
4月 5日 3654
4月 6日 3906
4月 7日 4257
4月 8日 4667
オリンピック延期決定した3月24日をDay1として線形回帰すると
https://i.imgur.com/Q45Xo8V.png
y=c(1193,1307,1387,1499,1693,1866,1953,2178,2384,2617,2935,3139,3654,3906,4257,4667)
z=as.Date("2020-03-24")+ 0:(length(y)-1)
plot(z,y,bty='l',pch=19)
x=1:length(y)
plot(x,y,bty='l')
(re.lm=lm(log(y)~x))
b0=re.lm$coef[1]
b1=re.lm$coef[2]
names(b0)=''
f <- function(x) exp(b0)*exp(b1*x) # 1059.063*exp(0.09231543*x)
curve(f(x),add=T)
n=1:50
plot(n,f(n),bty='l')
f1 <- function(y) print(log(y*exp(-b0))/b1 + as.Date("2020-03-24"),quote=F)
f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8))
感染者が5千、1万、5万、10万、50万、百万、1千万、1億、1億2595万人に達する日は
> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8))
[1] 2020-04-09 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28

234 :
>>233
1日ずれていた。

> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8,77e8))
[1] 2020-04-10 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28 2020-09-10

世界の人口77億人にたっするのは9月10日となった。

235 :
>>216
行政検査人数と医療機関の行った検査も含めて、陽性者数を公表しているだけみたいだな。
これじゃぁ、陽性率も有病率も何の解析もできない。

236 :
https://toyokeizai.net/sp/visual/tko/covid19/
のデータ使って
全国と東京の線形回帰の係数を比べると

全国
Call:
lm(formula = log(y) ~ x)

Coefficients:
(Intercept) x
6.84962 0.09253

東京
Coefficients:
(Intercept) x
5.1707 0.1332

東京の方が感染者増加速度が速いね。

東京都の人口13,951,636(令和2年1月1日現在) に達する日は
> f1(13951636)

2020-06-15
となった。

237 :
今日の東京の感染者予想人数は

> d2i("2020-4-10")
daily total
241.1515 1934.2759

238 :
https://pbs.twimg.com/media/EVKznQlUEAEJpgl?format=jpg&name=900x900

このグラフを見ろ

239 :
>>238
だから何なの?

240 :
感染者数の増加は直線より指数関数の方がフィットするな。

https://i.imgur.com/EeGBVJW.png

241 :
>>238
エクセルのグラフって、マークと曲線がちょっとずれるよね。
ってか、凡例までそうなってて、すっごく気持ち悪い。
なんでだろ?

242 :
有名人の感染がボチボチ出てくるってことは、市中感染率も
それなりに高いんだろうな。0.1%は超えてそう。

243 :
>>242
120万人罹患してるってこと?
発症者が5000人いってないのに?
発症率0.4%しかない雑魚ウィルスならサイトカインストームなんて起こさないでしょ?
これウィルスが強すぎて免疫系が異常に発動して起こるもんらしいから。

244 :
あ、0.1%か。
12万人で発症率4%。
どのみちないだろな。

245 :
>>244
0.1%ってのはあくまで都内や大阪を想定した推測ね。

246 :
>>216
これひどいよなぁ
陽性率隠しの一環にしか見えない
そもそも陽性者数と検査数って普通に検査してりゃ一対一で対応するだろ
各検査機関がそれらを普通に出せば足し合わせるだけでいい

247 :
そういうミスは統計資料にはつきもの。それでもデータさえ
多ければ大勢に影響なし。

248 :
>>8
優秀ですね

249 :
東京都のこのデータを使って
https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
オリンピック延期決定前後で陽性者の増え方に違いがあるかをグラフにしてみた。
https://i.imgur.com/DG2Kohu.png
黒塗り丸が延期決定前で黒線がその回帰曲線1日毎に1.078594 倍に増加
赤丸が延期決定後で赤線がその回帰曲線 1日毎に1.136801 倍に増加
青は全体での回帰曲線 1日毎に1.088687 倍に増加

250 :
>>247
集計ミスじゃなくて、集計デザインそのものに問題があるよ。
陽性数は東京都全部の集計なのに、検査数は行政検査だけで指定医療機関での検査を除外している集計している。
これじゃ陽性率から有病率を推測するのも不可能。

251 :
風邪ひいたみたい。感染予防には抜かりはないのに、

252 :
ランダムに検査して、感染者数を推定してほしいんだけな

253 :
オーストリアがやったらしいよ。

それによりますと、全体のおよそ0.3%が陽性と判定され、分析の結果、この時期に少なくとも1万200人、最大で6万7400人が感染していた可能性があることがわかったということです。

オーストリアの人口はおよそ890万人で、政府は最も可能性が高い数字として、この時期におよそ2万8500人が感染していたと推定しています。

254 :
>>253
コピペしそこなったけど、検査は1533人に施したそうだ。
感度100%、特異度100%の完璧な検査だったと仮定して、サンプルサイズ1500と
サンプル比率0.3%で、信頼度95%で推定すると母集団での比率は0.12%〜0.7%
くらいだと推定できるから、オーストリア政府発表と一致するね。そういう
単純な計算なのかねぇ?

255 :
もひとつコピペし忘れた、判明している感染者数は12,200人ね。
特異度が100%って考えにくいから、まあ、結構な捕捉率じゃねーの?

>当時医療機関などで確認されていた感染者はおよそ1万2200人だったことから、
>政府は、実際に感染していた人は公表の2倍以上に上るとみられるとしています。

256 :
>>254
1533*0.3/100=4.6だけど陽性は5人?

257 :
>>254
95%信頼区間も計算方法がいくつかあるよね。

> binom::binom.confint(5,1533)
method x n mean lower upper
1 agresti-coull 5 1533 0.003261579 0.0011557601 0.007850672
2 asymptotic 5 1533 0.003261579 0.0004073974 0.006115760
3 bayes 5 1533 0.003585398 0.0009655853 0.006611832
4 cloglog 5 1533 0.003261579 0.0012670654 0.007342721
5 exact 5 1533 0.003261579 0.0010598477 0.007594894
6 logit 5 1533 0.003261579 0.0013582045 0.007811457
7 probit 5 1533 0.003261579 0.0013079622 0.007530462
8 profile 5 1533 0.003261579 0.0011715789 0.006997012
9 lrt 5 1533 0.003261579 0.0011411357 0.006992346
10 prop.test 5 1533 0.003261579 0.0012013872 0.008065116
11 wilson 5 1533 0.003261579 0.0013939315 0.007612501

258 :
有病率:一様分布
感度:最頻値0.6標準偏差0.1のベータ分布
特異度:最頻値0.9標準偏差0.05のベータ分布
として検査陽性数は有病率*感度+(1−有病率)*(1−特異度)の確率に従う二項分布

というモデルでMCMCすると

https://i.imgur.com/Ay0I4Wx.png

有病率
mean lower upper
0.002678327 0.000029215 0.005582318

感染者数
> c(0.002678327, 0.000029215, 0.005582318)*8900000
[1] 23837.11 260.01 49682.63

という結果になった。

検査陽性数が少ないから信頼区間幅が広くなるなぁ。
エントリーに5以下があると正規分布での近似が悪くなると習ったような記憶がある。

259 :
>>256
それは書いてないけど、そうなるよね。陽性は4人か5人だろうね。

260 :
>>258
意外と特異度が高いんだよねぇ。99%をゆうにこえるとは...。
ってことは、検査数を増やしても偽陽性に惑わされる心配はあまりないってことか。
この調査から言えることは、検査の特異度がかなり高いってことと、有病率の上限
が1%には届かないと見積もれることかな?

261 :
最終的に陽性と判断されたのは、1500件中、4,5件だと思われるが、
これは、PCR検査機器の性能チェックじゃ無く、有病率の調査なんだから、
陽性とでた場合には、PCR機器をもう一度回したかもしれないし、
その人を呼んで、再度検体を採取してチェックしたのではないか?
具体的には、一次検査では、1500件中150件ほど陽性が出る。
この150人に対し、再調査を指示して、20件ほど陽性が出る。
この20人に対し、三次検査、四次検査を行って、最終的に4件程が陽性だと判断したと。
検査機器自体の特異度が高いのではなく、運用による効果だと考える方が無難では?

262 :
ドメイン知識ゼロ感

263 :
>>260
特異度の事前分布を最頻値0.9標準偏差0.05にした影響かと思って

特異度の事前分布を最頻値0.5 標準偏差0.2にしてMCMCしても同様の結果だった。(感度は最頻値0.6標準偏差0.1で同じ設定)


PCRs2(1533,5,SEN=0.6,SPC=0.5,SD1=0.1,SD2=0.2)$fit
Inference for Stan model: model3.
4 chains, each with iter=2000; warmup=1000; thin=1;
post-warmup draws per chain=1000, total post-warmup draws=4000.

mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
prev 0.00273 0.00005 0.00249 0.00010 0.00200 0.00912 2406 1.0011
sen 0.57489 0.00205 0.10047 0.37477 0.57377 0.76629 2403 1.0009
spc 0.99592 0.00004 0.00182 0.99181 0.99613 0.99882 2203 1.0007
p 0.00559 0.00003 0.00185 0.00258 0.00539 0.00975 3191 1.0000
lp__ -72.11408 0.03392 1.22437 -75.33316 -71.80596 -70.68418 1303 1.0048

prev:prevalence 有病率
sen : sensitivity 感度
spc : specificity 特異度

264 :
以前、>>188 で
>>せめて 有病率 は、 1-特異度 と同じオーダーか、1-特異度 より大きくないと、扱えない。
と指摘したことがあります。>>260や、>>263の結果は、将にこれを実証したといえそうですね。
主語を、特異度に変えると、
「特異度は 1-有病率 と同じオーダーか、1-有病率 より大きくないと、扱えない。」となります。

265 :
上の 260へのリンクは、>>258の間違いです。

266 :
>>264 さらに訂正
誤:「特異度は 1-有病率 と同じオーダーか、1-有病率 より大きくないと、扱えない。」
正:「1-特異度は 有病率 と同じオーダーか、有病率 より小さくないと、扱えない。」

267 :
1−特異度=偽陽性率

268 :
HIV検査などは有病率<偽陽性率だが、だからといって扱えないわけではない。

269 :
陽性(陰性)的中率や精度は有病率に左右されるけど、陽性(陰性)尤度比や診断的オッズ比は有病率には左右されない。
ただ、これだけの話。

270 :
臨床の世界では、陽性尤度比が10以上、陰性尤度比が0.1以下なら有用な検査とされる。
5以上、0.5以下なら、参考にはなるという程度だな。

Evidence-Based Physical Diagnosis, 4e だと3以上、0.3以下としている。

271 :
>>268
>>188などの書き込みは、>>180の問いに対する流れで書かれたものであって、
そこで書かれた「扱えない」は、「有病率の調査として誤差が大きすぎて使えない」という意味。
「検査自体が無意味」等というような意味で使っていたかのような誤解を与えかねない268の書き込みは、
話のすり替えであり、不適当であることを指摘しておく。

272 :
>>269
思うに、臨床の場では陽性が疑わしい患者をみるから、
「市中での」有病率はあまり関係ないってことなんじゃ
ないかな?

陽性かどうか五分五分という状況で検査すると思えば、
事前確率が50%という仮定(有病率50%に対応)になって、
陽性判定が真の陽性である確率と偽の陽性である確率との
比は感度/(1-特異度)になる。これが陽性尤度比だよね?

273 :
感度0.6 特異度0.9の検査で1533人検査して3例陽性であった、有病率を計算せよ
という問題をやってみるといいね。
解答不能になる。

274 :
1533例中5例陽性のとき、弱情報事前分布を以下のように
有病率:一様分布
感度:最頻値0.6標準偏差0.1のベータ分布
特異度:最頻値0.5標準偏差0.2のベータ分布
として検査陽性数は有病率*感度+(1−有病率)*(1−特異度)の確率に従う二項分布
としてJAGSでMCMCしてみた。的中率・精度・尤度比・診断的オッズ比の分布も出してみた。
https://i.imgur.com/GvruV3M.png
https://i.imgur.com/XXOqQGr.png

275 :
>>273
>253の数字だと陽性数は5人なので1533人検査して5人陽性とする。
有病者の人数をxとすると 0.6x+(1-0.9)(1533-x)=5を解くとありえない数値になるね。
感度0.6特異度0.9という前提が間違っていると考えると、どんな値が尤もらしい値なのかを探求したくなる。
MCMCはその手段を与えてくれる。

276 :
>>275
よくわかんないのは、たとえサンプル集団の有病者が0でも、特異度が
99.5%なら陽性判定は7人出るはずなので、陽性5人だとXは解無しに
なるんじゃね?それでも特異度が99.5%である確率はゼロではないって
なんか不思議。

277 :
>>276
あ、わかった、そのサンプルではたまたま特異度が99.7%より高い
試行にあたったと考えりゃいいわけね。
スマソ。

278 :
>>277
なんでもかんでも確率変数にして
実測値から確率分布がどう変化するかをみるのがベイズだと思っている。
件の話では感度も特異度も定数とは考えないで話を進めちゃう。

犬三匹本のKruscke 曰く
The role of data is to re-allocate credibitity across possibilities.
We reallocte credibitility to paramete values that are consistent with the data.

p値ですら確率分布を考えうる。
p<0.05だから有意差あり、とドヤ顔で言っている奴にp値の95%信頼区間はどれくらいですかと聞くと唖然するね。
(アホ扱いされないように自分で計算してからすべき質問)

なんでも確率変数と考えるとこんなのもあり。

平均100 標準偏差15で定義される知能指数で
 標準大学の新入生の知能指数の平均が100
 裏口医大の新入生の知能指数の平均が85であったとする。
どちらも新入生は100人として各大学から1/10を無作為抽出して知能指数をt検定したときのp値の期待値、中央値を求めよ。
また、p値が0.05以上になって裏口医大の新入生の知能指数は統計的に有意差はないと主張できる確率はいくらか?

知能指数が正規分布するとして乱数発生させてシミュレーションしたら
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000002 0.0092459 0.0388977 0.1082749 0.1295300 0.9942922
とう結果が得られた。

279 :
typo 修正

We reallocate credibitility to parameter values that are consistent with the data.

280 :
>>278
なるほどね。
>なんでもかんでも確率変数にして
でも、それぞれの確率変数がどういう意味を持つのか
いちいち考えないと気がすまないのが物理屋。

281 :
たとえば、定数であることだけは既知であるが、その値が
分からないという場合、確率変数にしちゃって問題ないのか
って気はする。
検査の感度や特異度は確かに定数とは限らんからいいけど
(一回一回の検査ごとに違っててもいい)。

282 :
p値が確率変数なのはベイズじゃなくても当たり前というか、そう考えないと理論が組み立てられんだろw

283 :
>>282
でもp値の分布とかは、頻度主義統計では考えていないのじゃないかな?

284 :
まあ、円周率の1億桁目がわからんから、0〜9の一様分布とするのはどうかとは思うが、
こういう問題
あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間(信頼区間)を求めよ。
をベイズで解くときは、
60台〜100台である確率を一様分布として処理している。

285 :
>弱情報事前分布
これが情弱事前分布に見えてしょうがないw

286 :
>>283
もちろんその通り

287 :
>>283
教科書には載ってないだけで、ちゃんと研究はされてるぞ。

288 :
https://youtu.be/67FGN9RKmqw
この人が言っていることって正しいの?

条件付き確率なんて持ち出さなくても
疑わしい人を選んで検査したほうが
無作為に検査するよりも陽性の頻度が高まるのは
当たり前の話だと思うんだけど。

289 :
>疑わしい人を選んで検査したほうが
>無作為に検査するよりも陽性の頻度が高まるのは
>当たり前
その考え方がまさに条件付き確率だよ。

290 :
>>289
だーから、大層に数学的権威を持ち出さなくても
小学生にだって直感で分かることなのに。

で、それをもってどう検査数を疑わしいサンプルだけに絞ったほうが
その検査が持つ本来の精度が上がるという理屈は論理的に正しいの?

291 :
>>290
何をもって精度が上がるというのかによるけど、陽性と判定された
人が確かに陽性である可能性は高くなる。絞らないと、陽性だと言
われた人の中に相当数陰性の人が交じる可能性が高い。
ただし、陰性と言われた人が確かに陰性である可能性は低くなる。

292 :
【コロナ訃報】英数学者ジョン・ホートン・コンウェイ氏、コロナで死亡 82歳 ライフゲーム考案、超現実数の発明などで知られる

293 :
> だーから、大層に数学的権威を持ち出さなくても
> 小学生にだって直感で分かることなのに。
ワロタ

294 :
検査した場合、次の4パターンが考えられる。
(1)陽性判定(ほんとに感染者) 
    →隔離され、しばらく様子見(症状に応じて治療)→治れば解放

(2)陽性判定(実は感染してない)
    →隔離され、しばらく様子見→そこで他の感染者から感染

(3)陰性判定(ほんとに感染してない)
    →自主隔離で自宅で2週間程度様子見

(4)陰性判定(実は、感染)
    →自主隔離で自宅で様子見→状態が悪くなって再検査or自然治癒

疑い例に絞らず、市中感染率がいまのように低い状況で検査をすると、
(2)の割合が増えてかえって感染者を増やす可能性が高い。
疑い例に絞ると(4)の割合が相対的に増えるが、疑い例に絞らずに検査
した場合より実数として増えるわけではないので、問題ない。

295 :
>>291
> 何をもって精度が上がるというのかによるけど、

当然、PCR検査の対象者を陽性らしい人だけに絞れば
PCR検査が本来持つ精度そのものが上がるのかってことだよ。
直感的に考えたら上がらない。
条件確率を用いるとなぜ「PCR検査それ事態の性能が上がる」と
結論できるのか、それを説明できる人がいる?

296 :
>>293
実際そうでしょう。小学生にその質問をしてみるといいよ。

風邪っぽい症状がある人だけを集めたグループAと
そうじゃない人を当てずっぽうに集めたグループBがあって、
どっちの検査をしたほうが陽性の人がたくさん見つかるのかって。

ほとんどの小学生が計算なんかしなくてもグループAだと答えるでしょう。

297 :
>>295
精度の定義はなんなのかってこと。精度とか性能をきちんと
定義して考えないと、小学生の思考からは抜け出せないよ。
ってか、>>291に書いてあることは理解できたの?

298 :
>>296
やっぱり>>291に書いてあることが理解できてないみたいね。
ある人が陽性だと判定されたときに、その検査結果がどのくらい
信用できるかってことだよ。

299 :
検査の目的は、感染者をできるだけ発見すること。
そうすることで感染経路を追跡して虱潰しにできる。
それができると感染者が増えるのを抑制でき、肺炎で重篤化する患者も減らせる。
望ましくないのは、発見できていない感染者がどんどん増えること。
検査を手当たり次第にすれば偽陽性も含めて追跡できる。
感染しているのに追跡できない人が市中に増える確率は下がるはず。
偽陽性かどうかは他の症状や検査を繰り返すことでその不確実性を低減できるはず。
偽陰性の場合も他の症状との兼ね合いで不確実性を低減できるはず。
一度の検査を絶対視せず、それを重要な手がかりの一つと考えれば手がかりが増えることに貢献する。
このことから検査をしないほうが利得が高いとする根拠がどう見出されるのか疑問。

300 :
検査の目的は、感染者をできるだけ発見すること。
そうすることで感染経路を追跡して虱潰しにできる。
それができると感染者が増えるのを抑制でき、肺炎で重篤化する患者も減らせる。
望ましくないのは、発見できていない感染者がどんどん増えること。
検査を手当たり次第にすれば偽陽性も含めて追跡できる。
感染しているのに追跡できない人が市中に増える確率は下がるはず。
偽陽性かどうかは他の症状や検査を繰り返すことでその不確実性を低減できるはず。
偽陰性の場合も他の症状との兼ね合いで不確実性を低減できるはず。
一度の検査を絶対視せず、それを重要な手がかりの一つと考えれば手がかりが増えることに貢献する。
このことから検査をしないほうが利得が高いとする根拠がどう見出されるのか疑問。

301 :
>>300
検査をしない、じゃなくて、疑いがある場合だけに検査を絞るべきってこと。
その理由は >>294に書いてある。理解できなきゃ、自分の無能を嘆きなさい。

市中感染率が1%にも満たない世界で、無節操な検査を有効化するには、陽性
だろうが陰性だろうが軽症者は自宅隔離するという方法をとらないと駄目。
それでも、感染者が一定の割合で陰性判定されちゃうから、感染経路の
虱潰しなんてことは到底不可能。

302 :
>>300
>偽陰性の場合も他の症状との兼ね合い

無症状者も1割以上いるんじゃないか?

303 :
>>294
その(2)が起こっても隔離されているので市中感染は増えない。
(2)はそもそも検査それ自体の結果ではなく、検査の結果どのように扱うかの問題。
検査を制限すべき派はそこを巧妙に混同させて論理のすり替えを行っている。
>>302
症状のある人だけとか、症状のハードルを上げている場合、
無症状者も含めて検査場に連絡してこなくなるので当局が把握できない。
把握できない感染者がじわじわ増えていくことがいちばんやっかい。
その数をできるだけ抑えてその状態を長く保つには検査の制限は障害になる。

304 :
>>303
>(2)が起こっても隔離されているので市中感染は増えない。
あんたは感染してもいないのに感染の危険にさらされてもいいのかね?
運が悪かったと諦めろと?


>把握できない感染者がじわじわ増えていく
検査をむやみに増やしても、偽陰性でリリースされる感染者はかなりの
割合で存在するんだから、把握できない感染者は増える。
(4)のケースは疑いありの非検査者の場合なら自宅隔離させられるが、
誰でも検査の場合にはそういう歯止めもなくなる。

ってか、こういうことを議論するなら定量的にやれよ。数学や統計を
使わずに定性的な議論をしても無駄。

305 :
検査をもっとおこなった方がいいという人は、ほとんど、検査の正確性についての視点が欠落している。

有病率0.1%、感度70%、特異度90%という前提で、検査をおこなって、100人陽性と判断されたとする。
病室、あるいは、隔離管理されたホテル客室を100用意しなければならないが、本当に、感染している人は
何人いることが予想されるか?
答えは0.6958人だ。 一人いるかいないか。ほぼ確実に99室は無駄に使われる。

一方、クラスター発生時の濃厚接触者、あるいは、CTスキャンや、病状を見て、医者が疑わしいと判断
した場合の限定検査なら、事前の有病率はかなり高いことが期待される。
前者は対象者をどれくらいに広げるかによるが、10%程度、後者は50%位あるかもしれない。
有病率以外を同じ条件で、100人陽性が出た場合、有病率10%だと43.75人、有病率30%だと75人が
本当に感染している。有病率10%でも、用意した100室の内半分以上は無駄。
30%だと、1/4が無駄になるが、これくらいなら許容範囲かもしれない。

感度70%程度だから、10人真の感染者が検査をしに来ても、3人は、いわば「お墨付き」で市中に放たれてしまう。
一方、特異度90%だから、検査を受けに来た非感染者の1/10(←検査を受けた人の1/10にほぼ等しい)は、いわば、
「無実の罪」で、隔離生活を強いられてしまう。

これらを理解すれば、「希望者全員に検査を受けさせるべき」等という発言が如何に愚かか判るはず。

306 :
>>305
低学歴の空想

307 :
有病率r、感度p、特異度qのとき、 陽性的中率 は pr / (pr+(1-r)(1-q)) で与えられます。
p=0.7、q=0.9 なら、(陽性的中率) = 7r/(6r+1) です。
r=0.001 で、(陽性的中率) = 0.00695825
r=0.01  で、(陽性的中率) = 0.0660377
r=0.1  で、(陽性的中率) = 0.4375
r=0.3  で、(陽性的中率) = 0.75
r=0.5  で、(陽性的中率) = 0.875
です。空想ではありません。事実に基づいた定量的なお話です。

308 :
>>307
与えられねえよクソ低学歴
高校入学してから吠えろ知恵遅れ猿

309 :
>>307
r=1なら的中率が常に1だな
低知能に生まれてしまったことを呪いながら死にな役立たず生ゴミ

310 :
与えられて欲しくないという、あなたの願望ですか?
https://ja.wikipedia.org/wiki/陽性適中率
をご覧下さい。

311 :
IUTTでもおなじみフェセンコ氏がコロナのSIRモデル論じている
https://arxiv.org/abs/2004.04583

312 :
>>309
r=1 なら、全員が病気です。
検査によって、陰性と判断される人もいるでしょうが、
陽性と判断された人は、全て本当に陽性=病気です。
だから、的中しています。常に1で、問題ありません。

313 :
>>310
バカペディアをソースにしてる時点で無能低学歴確定

314 :
>>312
感度0なら陽性者0
バカ丸出しだろこの猿

315 :
>>310
出典なしの妄想がソースwwwwww
低知能低学歴って全てが空想なのなwwwww

316 :
>>310
このバカペディアを弄った低学歴猿って確実にベイズの定理を理解してない

317 :
医学誌BMJに掲載された記事によれば、
中国で新規に確認された感染者のうち78%は明確な症状を示さなかったという。
これが本当なら、検査に症状制限を高く設定している場合、
少なくとも78%は感染していても完全に検査体制から排除されていることになる。
偽陰性が野に放たれることを相対的に重大視する検査制限主義者が
これを無視するのはいったいどういう理屈からなのか。

318 :
>>304
> あんたは感染してもいないのに感染の危険にさらされてもいいのかね?
> 運が悪かったと諦めろと?
それは検査後の扱い、処遇の方法論の問題であって、
検査それ自体がもたらすリスクではない。
例えば、偽陰性の可能性があることを被験者に伝えれば、
検査期間が被験者に陰性のお墨付きを与えていることにもならない。
検査で陰性と出た人も症状があれば経過観察対象にできる。
検査をやれば、検査+診察+αで陽性者を漏らしてしまう確率は減る。
検査を制限する手法だと、
自覚症状の素人判断だけで疑わしい人を検証することすら放棄していることになる。

319 :
>>305
そもそも感度70%とか言ってる時点で論文読めない低学歴猿と確定するからな
http://iina-kobe.com/entry151/
完全なデマ

320 :
>>305
> 感度70%程度だから、10人真の感染者が検査をしに来ても、3人は、いわば「お墨付き」で市中に放たれてしまう。
>一方、特異度90%だから、検査を受けに来た非感染者の1/10(←検査を受けた人の1/10にほぼ等しい)は、いわば、
「無実の罪」で、隔離生活を強いられてしまう。
は?
お前の理屈なら感度70%なら10人の真の感染者が検査をしに来たら7人はちゃんと隔離されるんだが?
陰性的中率出してみろよ猿
そして首吊ってR

321 :
>>305さんの理屈は、
検査推進派が検査だけを拠り所にして結論を出す
という仮定を暗黙のうちにしていないか?
検査推進派がPCR検査だけを絶対視するとどこで主張している?
検査推進派はあくまでも無症状の人までも検査の機会を与える考えにすぎない。
PCR検査だけでお墨付きを与えるなどとは誰も主張していない。
検査推進反対派はここを巧妙にすり替えている。

322 :
>>321
そもそもこいつの陽性的中率自体に何の意味も無いけどな
陰性的中率とやらも出してみればわかる
片方だけ条件付確率で論理をでっち上げもう片方は条件付確率を使わないというトリック

323 :
>>321
しかも感度そのものがデマだし
http://iina-kobe.com/entry151/

324 :
感度90%特異度99%だろ
https://i.imgur.com/8WRKuMI.jpg

325 :
>>305
特異度90%のソースなし
捏造

326 :
>>304
> ってか、こういうことを議論するなら定量的にやれよ。数学や統計を
> 使わずに定性的な議論をしても無駄。
統計を使った言説のトリックというか詐術の多くは定性的な議論のところにある。
その詐術を数や式の権威を使って覆い隠すパターンがほとんど。
統計的言説で騙されていけないのはそこ。

327 :
a. 個人の自覚症状
b. 医師の診察
c. PCR検査
という3つのフィルターがあるとする。
検査制限派は、aかbの時点でPCR検査の機会を与えず門前払いする。
これが合理的であるためには、aやbがcよりも精度が高いという前提がなくてはならない。
検査推進派はa, b, cの機会をすべて与えようと努力する。
これら三つの検閲の組み合わせたほうがaとbで門前払いしてしまうより優れていると考えるから。

328 :
なお実際の精度は99.3%ある模様
https://finance.yahoo.com/news/todos-medical-3dmed-enter-coronavirus-170631267.html
3DMed test demonstrated 99.3% sensitivity and 100% specificity in Chinese clinical trial
Nucleic Acid test performed on proprietary automated platform to increase throughput
CE Mark and China FDA approval have been received; 3DMed in discussions with US FDA and WHO
Technology was deployed in Wuhan, China with over 100,000 tests completed
Combination coronavirus and influenza A/B testing novel among PCR approaches

329 :
>>307

>>328のソースによると感度99.3%特異度100%なので
有病率1%と仮定すると陽性的中率は100%やね

はいおつかれ
https://i.imgur.com/R45Rlaw.jpg

330 :
>>307
感度と特異度が確定しているという前提が空想だよ。
>274参照

331 :
(1)新型コロナ肺炎に感度100%の所見をひとつ述べよ。
(2)新型コロナ肺炎に特異度100%の所見をひとつ述べよ。

332 :
>>326
同意。これ!
“Statistics are like bikinis. What they reveal is suggestive, but what they conceal is vital.”

333 :
面白そうなスレだな
1から読んでみるわ

334 :
>>330
で各国の実データ使うとどうなりますのん?

335 :
>>332
ビキニ統計学って本書いてくれ

336 :
なんか、まともに議論も数学もできない、とてつもないバカが二人混じってるな。
(= >>335,326)
idなしのやつの方は人間として終わってるバカだがw
困ったもんだ。

337 :
>>326
君は降雨確率が30%という予報で、雨が降ったら騙されたって言う手合のようだねw
「世の中には3つの嘘がある。嘘、大嘘、そして統計である」という言葉があるが、
統計を理解してない人が統計を扱えばそうなっちゃう。

338 :
>>318
つ>>301

339 :
>>328
精度じゃなくて感度だよ。しかも試験管のテスト。
PCR検査で感度・特異度ともにどちらもほぼ100%になるのは常識。
検体採取の行程(ヒューマンエラーetc.)まで考慮にいれれば、
感度も特異度も下がる。特に感度のほうはスワブでちゃんと
検体が取れてるかどうかが怪しくて、かなり下がる。

340 :
特異度を下げるのはこういうコンタミが起きたりするから。
レアだけど無視できない。
>愛知県PCR検査ミス 陰性の24人を陽性と判定‥1人が陽性患者と同室に
https://hicbc.com/news/article/?id=0004D8E4

341 :
>>339
in Chinese clinical trial

342 :
>>339
検体はひとつでは無い
日本では6検体
無知が吠えんな

343 :
>>340
確率出してから吠えて

344 :
そのうち、過剰診断と言い出す予感。
福島の甲状腺がんみたいに。

345 :
>331に即答できる人いないの?

346 :
>>345
穿った質問に素直に時間かける阿呆が居ると思ってる奴

347 :
>>346
ロスマンの疫学を読んだことのある人なら答えられるし、
感度特異度の意味を理解していれば自分で答えが出せる。

348 :
サパイラ 身体診察のアートとサイエンスにも載っているが、こっちは100%の所見ではないな。

349 :
>>347
君が書いたらいい

350 :
サパイラ 身体診察のアートとサイエンスには
あらゆる疾患に感度の高い検査(所見)として 10 finger test が挙げられている。
すなわち、指が10本あれば疾患ありと判断する。
この検査の感度は100%に近い。新型コロナでも高感度。

351 :
身体診察のアートとサイエンス の 翻訳者のひとりには岩田健太郎がいる。
俺は旧版を原著で読んだ。 
引用すると、
A test with high sensitivity is not necessarily a useful test. The sign “10 fingers” would be
extremely sensitive for almost any disease because most patients with the disease will have ten
fingers. Very few patients with the disease will have a different number of fingers. Thus, the ratio of
true positives (number of patients with the disease who have ten fingers) to the sum of true positives
plus false negatives (where false negatives are people who have the disease and do not have ten
fingers) will usually be greater than 0.99 (except in a sanitarium for Hansen disease). Yet, common
sense tells us that the possession of ten fingers, however sensitive on paper, is not of great use to the
diagnostician. Why not? The reason is that most of the people in the world have ten fingers but do not
have the disease.

352 :
>>334
各国の検査数と陽性数のデータがあれば、
β分布のパラメータを以下のように設定してMCMCすれば出せる。
beta(13.6991,9.4661)でmode 0.6, sd = 0.1
beta(36.172,4.908)でmode 0.9 sd = 0.05
東京都で検査を受けたハイリスクグループでの陽性率を出そうしたんだが、
東京都は行政検査数しか公表しないので出す術がない。

353 :
コロナが苦手なものはなんだ? 相手の弱点をみつけようよ。乾燥に弱いとか、熱に弱いとか、なんかないの? 前に使った薬がなんで効いてるか、その仕組みがわかったらなぁ。治ってる人や症状改善した人がいるってところになにかヒントがあるよ。
]∩∩‖ □ ‖;;;;;\
(-_-))  ‖;;;;;;‖
(っγυ  。‖╂─╂‖
]`(_)_)ц~ ‖╂─╂‖
、■υυ■__‖\\\‖
`\\\\\\\\\`)
`\\\\\\\\\/|
`\\\\\\\\`/ |
_\\\\\\\\/ L
 ̄|\\\\\\/| /
]| ‖ ̄ ̄ ̄ ̄‖ | / /
__| ‖ □ □ ‖ |/ /
___`‖________‖/_/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄‖ /
__________________‖/

354 :
>>353
>コロナが苦手なもの
知性だな。
台湾の知性が制御している。

355 :
>>343
オープンなリソース管理はコロナの弱点だろうな
公務員が数ちょろまかしてるような国では強くなれる

356 :
>>354罰金刑か。前>>353結局罰金刑しかないか。逮捕して処刑するしかないかなとは思ってたんだ俺も。
‖∩∩‖ □ ‖;;;;;\
((-_-)  ‖;;;;;;‖
(っγυ  。‖╂─╂‖
■`(_)_)ц~ ‖╂─╂‖
\■υυ■_∩∩、\\‖
\\\\⊂(_ _ )`⌒つ)
\\\\\\\`υ、\/|
\\\\\`.,、、、\`/ |
__\\\\彡`-`ミっ/ L
 ̄|\_\\_U,~⌒ヾ /
]| ‖ ̄ ̄ ̄ ̄U~~U / /
__| ‖ □ □ ‖ |/ /
___`‖________‖/_/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄‖ /
__________________‖/

357 :
ベイズを議論している人に教えてほしいのだが
https://webronza.asahi.com/science/articles/2020032600006.html?iref=wrp_rnavi_new
でこの人の計算や解釈は正しいの?

358 :
>>ニュースなどで「クラスターで陽性が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。
>>1万人を検査すると、70人+198人が陽性と判定される。本当の陽性は70人だから、結果が正しい確率は70÷268=26%
>>正解は、約26%だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
明らかに誤っている部分がある。
市中感染率を1%と仮定し、その中から無作為に調査を行って、10人の陽性と判断される者を見つけた場合、
確かに、本当の感染者は2.6人程度。
しかし、クラスターが発見され、その周辺から、感染者を探す場合は、事前確率は1%ではない。
どの範囲まで、調査対象を広げるかにもよるが、50%とかが期待される。
仮に50%だとすると、87.5%、陽性と判断された結果は正しい。

359 :
pr2pv <- function( # prevalence to predicative value
pr ,# prevalence
sn=0.7, # sensitibity=TP/(TP+FN)
sp=0.9) # specificity=TN/(TN+FP)
{
N=1 # polutaion million, billion,or any proper unit
si=pr*N # sick population
he=(1-pr)*N # healthy population
TP=si*sn
FN=si*(1-sn)
TN=he*sp
FP=he*(1-sp)
PPV=TP/(TP+FP)
NPV=TN/(TN+FN)
PV=c(PPV=PPV,NPV=NPV)
return(PV)
}

> pr2pv(0.01,0.7,0.98)
PPV NPV
0.2611940 0.9969174
計算はあってる。面倒だから解説は読まない。

360 :
クラスターから何人検査して何人陽性であったのかによって結果が違ってくるね。

検査の感度を最頻値0.7標準偏差0.1
特異度を最頻値0.98 標準偏差0.01
有病率は(0,1)の一様分布
を弱情報事前分布(情弱事前分布w)として
クラスターから10人検査したら10人陽性であったとき stanでMCMCした結果
https://i.imgur.com/AaOB2LX.png
https://i.imgur.com/yeIgnCX.png

361 :
クラスターから100人検査して10人陽性だった場合


mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
prev 0.13475 0.00044 0.05797 0.04287 0.12754 0.27095 17334 1.00010
sen 0.66409 0.00074 0.10423 0.44686 0.67054 0.84855 20036 1.00010
spc 0.97580 0.00007 0.01006 0.95256 0.97714 0.99146 20272 1.00012
p 0.10797 0.00019 0.03044 0.05633 0.10530 0.17455 24621 1.00001
PPV 0.76071 0.00072 0.09797 0.53774 0.77243 0.91536 18317 1.00011
NPV 0.95986 0.00013 0.01749 0.91811 0.96260 0.98585 17185 1.00010
precision 0.94212 0.00013 0.01766 0.90229 0.94405 0.97089 19310 1.00010
pLR 33.28155 0.14736 18.25227 12.71591 28.84717 80.12622 15341 1.00013
nLR 0.34429 0.00075 0.10692 0.15527 0.33782 0.56712 20099 1.00010
DOR 114.74459 0.78412 97.10981 25.95828 89.02272 356.05482 15338 0.99996
lp__ -75.90415 0.01168 1.27866 -79.22234 -75.58340 -74.42549 11979 1.00024

PPVは0.76

362 :
>358の指摘の通り、陽性的中率はその集団の有病率の影響されるから、クラスターの有病率を1%にするのは間違い。
情報がないから、クラスター内の有病率の確率分布を一様分布として計算するとか、母集団の有病率の10倍以内とか設定すればクラスター内の有病率の確率分布が出せる。

クラスタ100人検査で10人陽性、クラスター内の有病率は母集団の10倍以内と設定すると
陽性的中率は、0.684 95%CI(0.497-0.857)と計算された。

363 :
結局、誤った解説を読む羽目になったw

364 :
>>358
有難うございます。
>>しかし、クラスターが発見され、その周辺から、感染者を探す場合は、事前確率は1%ではない。
この見積もりがキーですね。
>>359,360,361,362
計算有難うございます。

365 :
>>358
おいおい、なにも間違ったことは書いてないでしょ。
君の引用の仕方に問題があるんだよ。

>>ニュースなどで「クラスターで陽性が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。

で一旦段落は終わってるんだから、1万人を検査すると云々という、設定された
「問題」の答えとは直接リンクしてない。君のように勘違いする人はいるかも
しれないが、きちんと読めば間違ったことは書いてないことがわかるはず。
どこにもクラスターの有病率が1%だなどとは書いてない。

で、仮に有病率が50%でも、
>「クラスターで陽性が10人」=「10人が感染」
ではないわけで、引用元の著者の主張はまっとうなものだと思える。

>>364
だから、有病率が高いと見込まれる集団での検査であればいいわけで、
むやみに検査せずにある程度絞り込むべきだ(たとえば、クラスター
感染が疑われる集団を対象にせよ)とまで記事の中で述べられていれば
よかったんだろうけど、そこまで書かなかったのは片手落ちだったかもね。

366 :
もし、記事が、
「ニュースなどで「陽性判定が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。」
と書かれていたなら、あなたの指摘は正しいだろう。しかし、実際は
>> ニュースなどで「クラスターで陽性が10人」=「10人が感染」と素直に受け取ってしまう向きも多いだろう。
となっている。
クラスターとは、集団の存在、つまり、濃度の濃い部分があることを示唆したものであり、
母集団の感染率をそのまま用いるべきではない点を指摘した。
だから、非クラスターなら、正解だか、クラスターなら正解とは言えないという主旨で書いている。
換言すれば、問題の設定では、
「真の感染率=1%とする。(検査に至った経緯や、発熱・咳など他の所見は無視する)。」
と書いているのに対し、問題の解説では、「クラスター」を持ち出して解説しているのは、明らかに不適当。

367 :
>>366
クラスターですら、「陽性判定=感染」ってことではないんだから、その
一文で言いたいことに間違いはない。

でもって、著者は、クラスターの有病率が1%なんてことは一言も言って
ないし、そもそも、クラスターについての具体的な解説もしていない。単に
ニュースで扱われる文言の例としてそこで1回だけクラスターという言葉が
使われてるだけ。クラスターの検査を否定してる内容でもない。

有病率があがると的中率も大きくあがることについては、記事中のグラフで
示してあるから、情報が示されてないわけでもない。記事の主旨とは直接関係
ないので文章中では触れなかっただけでしょうね。

368 :
統計全然わからないんだけど、今行われてるPCR検査で陽性と判断されて、本当に罹患してる確率ってどの程度なの?

369 :
もし、筆者の伝えたいことが、「陽性判定は、即、感染者ということにはならない」 つまり、
「間違えることもある」という点にあるのであれば、あなたの言い分は通るかもしれないが、筆者の力点は、

>>正解は、約26%だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。

を見て判る通り、「陽性的中率が低い」というというところにある。
そのために、感度や特異度、真の感染率などに、具体的な数字を与えているし、問題設定の中では、わざわざ

>> (検査に至った経緯や、発熱・咳など他の所見は無視する)。
等と断り、終始定量的な説明が加えられている。

ならばこそ、なおさら、「クラスター」という言葉は使うべきでは無かった。
クラスター周辺での調査と、市中での無作為検査では、陽性的中率が変わってしまうのは、
全体を通して、筆者が言いたいことであっただろうに、にもかかわらず、問題の解説で
前提を崩してしまう「クラスター」という言葉を使ったのだから。

そもそも、ニュースでは、「PCRで陽性が○○人」等という使い方をしていただろうか?
単に「感染者○○人」だと思う。もちろん、この感染者の中には、偽陽性も含まれているだろうが、
検査陽性者数と感染者数の違いに注目を与えかねない「陽性者○○人」のような報道は記憶に無い。
そう考えると、「誤解の種」を自ら蒔いて、刈り取るかのような記事に見えてきた。

370 :
>>367
クラスターの有病率の事前確率を1%として計算してんじゃないの?
でなければ
>判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
ということにはならない。

371 :
クラスターで10人が陽性として検査した人数と陽性的中率PPVとの関係をグラフにしてみた。
灰色実線は95%信頼区間境界、灰色点線はPPV=0.26の線

https://i.imgur.com/T6TDh2r.png

全人口の有病率をクラスター内の有病率にすり替えて、10人陽性でも感染しているのは3人以下という間違った結論を出している。

わかっていて書いているのか、馬鹿なのか、どちらかは不明。

372 :
>>368
罹患の定義による。
他人のゲノムでコンタミネーションが起こったりしていなければ、
あるゲノムのシークアンスが検出されたら罹患というなら、罹患率は100%
ウイルスとして増殖能力を有しているかは不明、死骸の一部を検出しているだけかもしれない。

373 :
>>369
東京都の発表では 感染者数とせず、陽性患者数と表現している。

正確を期すなら陽性者数とすべきだろうな。

https://stopcovid19.metro.tokyo.lg.jp/

374 :
Natureのこの論文はエクセルとRのコードがついていて自分で再現できるので入力の手間が省ける。
https://www.nature.com/articles/s41591-020-0869-5
感染させる確率分布をガンマ分布を平行移動させた分布として想定して、データから最尤法でパラメータ算出している。

375 :
>>374
そのプログラムをみていくと
感染させる確率分布を
#--- infectiousness, gamma distribution ---
# gpar[1:2]: hyper-parameters (gamma)
# x : infection time of infectee w.r.t onset time of infector
f.Xc = function(x, gpar) { dgamma(x, gpar[1], gpar[2]) }
ガンマ分布にしているけど
一人が一人を感染させるモデルだから
形状パラメータgpar[1]は1で固定、つまり、指数分布だと思うんだがどうだろ?待ち時間の分布と同じ考え。
w.r.t = with reference to らしい

376 :
>>375
補足
ひとりが別の一人に一回感染させるというモデルなので待ち時間の分布の指数分布でいいと思う。
ガンマ分布の形状パラメータ=1とおけば指数分布になる。
プログラムを書き直してグラフにすると
https://i.imgur.com/paErvfa.png
発症前に感染させている確率は47%と原著とあまりかわらないが、そのピークは発症1.6日前という結果になった。

377 :
>>369
>>正解は、約26%だ。判定が「陽性」でも、本当の感染者は10人中3人以下ということだ。
ああ、確かにそこは問題だな。前段の「クラスターで陽性が10人」とリンクすると
思われても仕方がない。著者もうかつだとは思うが、有病率により的中率が変わると
いう話の内容は間違いではない。

378 :
>>371
元記事のグラフの有病率0.1のところをみれば的中率が80%越えになってるわけで、
単純に「クラスター」って言葉を軽んじてただけなんだろうね。
https://webronza.asahi.com/photo/photo.html?photo=/S2010/upload/2020032600006_3.jpg

379 :
>>375
たにんへの感染力の分布なんか数学的にわかるわけないやん?罹患して気道部にウィルスを放出できるくらいのウィルス量が繁殖するのは罹患していきなりなわけがない。

380 :
適当にSEIRモデル拡張してシミュレーションすれば分かるけどかなり自粛しても感染爆発は起こるよ

381 :
https://www.youtube.com/watch?v=4B5LTAdM0NE
東大数学科卒の高橋洋一氏が人との接触7割減」の根拠を数式から
語ってるがどう見る?

382 :
ガンマ分布:「一定期間に1回起きると期待されるランダムな事象が複数回起きるまでの時間の分布」
複数回でなくて1回だと指数分布だと思う。
何度も感染した症例を扱っているのではないのだから、ガンマ分布のパラメータを求める意味が理解できない。

383 :
>>380
SEIRモデルだと感染爆発させた方が早期に収束する。死者や感染者は増えるけど。
シミュレーションでは鎖国している前提で4割が感染すればオリンピックは可能だった。
SEIRモデルはEは感染力なし、Rは再感染しないというモデルだからなぁ。
モデルを修正してR->Sの再感染が0.1%あるだけで終焉しなかったな。
しかも、外部から感染力の強いキャリアー(保菌者)が入ってくることはモデルには組み込まれていない。

384 :
>>379
結局、一定期間に1回起きると期待されるランダムな事象として、その一定期間を推測しているんだろ?

385 :
>>381
SIRモデルって鎖国モデルだから結論は信用できん。

386 :
統計できる人尊敬するわ
MCMCとか訳分からん

387 :
>>386
統計ってある統計量がほんにゃら分布に従うというのを黙って受容しないと次に進めないよね。
郡内分散と郡間分散の比がF分布に従うとか言われても
どうしてかは理解していない。
stanのNUTSとかfrog leapとかわからんままにMCMCさせている。

388 :
こういうときこそコンピューターとかに頼らずに一つ一つ数をかぞえて方程式を立て、微分するべきだと思う。
‖∩∩‖ □ ‖   \
(-_-))  ‖______‖
(っγυ  。‖╂─╂‖
■`(_)_)ц~ ‖╂─╂‖
\■υυ■_∩∩、\\‖
\\\\⊂(_ _ )`⌒つ)
\\\\\\\`υ、\/|
\\\\\`.,、、、\`/ |
__\\\\彡`-`ミっ/ L
 ̄|\_\\_U,~⌒ヾ /
]| ‖ ̄ ̄ ̄ ̄U~~U / /
__| ‖ □ □ ‖ |/ /
___`‖________‖/_/
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄‖ /
__________________‖/

389 :
>>386
sirモデルでは罹患した患者が回復するまでの機会中常に一定の確率(感染率)で遭遇した感受受宿主に感染を広めると仮定して立式してる。
ザックリした傾向を見るならそれで十分だけど、実際のモデルではそんな事はありえない。
感染する確率は患者の体内で繁殖しているウィルス量の増加に従って増えるからその効果を勘案してΓ分布(というかt^c d^x なる形の関数)に応じて感染率が罹患した時点から変化するとするんでしょ?
もちろんコレでも大体の傾向見るにはコレで十分というモデルを臨床例から適当に選んでるだけでしょ?
実際には未来永劫感染力を持ち続けるなんて事があるはずないし、罹患初期のウィルス量の増え方はおそらく指数関数的に増えるものを採用すべきだろうし。

390 :
mcmc

391 :
>>388
無理無理。
カブトガニVSシオマネキ論争はコンピュータの計算結果で決着がついたよ。

392 :
週末は休むとか週間変動の影響を除くために1週間の移動平均で線形回帰して片対数グラフにすると
https://i.imgur.com/7VwfswD.png
自粛の効果がでてきているな。 多分、検査自粛の効果だろうな。

393 :
‖∩∩ ‖ □ ‖前>>388
((-_-)‖  ‖______
(っ⌒⌒゙  。‖╂─╂
■`(_)_)ц~ ‖╂─╂
\■υυ■_∩∩、\\\
\\\\⊂(_ _ )`⌒つ、
\\\\\\\`υ、\\\\\\\\\\\\\\\\`>>391カブトガニでもシオマネキでもシュクメルリでも微分するのがいちばん強力だと思う。

394 :
>>393
これを微分で解いたら、ネ申か狂人だろな。
AからHの8人はそれぞれ正直者か嘘つきであり、誰が正直者か嘘つきかはお互いに知っている。
A,B,C,D,Eは嘘つきなら必ず嘘をつくが、F,G,Hは嘘つきでも正しいことを言う場合がある。
次の証言から確実に正直者と断定できるのは誰か?
A「嘘つきの方が正直者より多い」
B「Hは嘘つきである」
C「Bは嘘つきである」
D「CもFも嘘つきである」
E「8人の中に、少なくとも1人嘘つきがいる」
F「8人の中に、少なくとも2人嘘つきがいる」
G「Eは嘘つきである」
H「AもFも正直者である」

395 :
CTとPCRの一致係数(κ値)を信頼区間つきでMCMCしようかと思ってスクリプトを書いたはいいが
肝心なデータがない :(
事前分布を一様分布にするのには異論があるかもしれん。
library(rjags)
kappa.model='
model{
A ~ dbeta(1,1) # A:Pr[CT+], 1-A:Pr[CT-]
B ~ dbeta(1,1) # B:Pr[PCR+|CT+]
C ~ dbeta(1,1) # C:Pr[PCR-|CT-]
p[1]=A*B # CT+PCR-
p[2]=A*(1-B) # CT+PCR-
p[3]=(1-A)*(1-C) # CT-PCR+
p[4]=(1-A)*C # CT-PCR-
y[1:4] ~ dmulti(p[],n) # multinominal distribution
po=(p[1]+p[4])/n # observed agreement
pe=(p[1]+p[2])/n*(p[1]+p[3])/n + (p[3]+p[4])/n*(p[2]+p[4])/n # coincidence
kappa=(po-pe)/(1-pe)
PABAK=2*po-1 # Prevalence Adjusted Bias Adjusted Kappa
}
'
writeLines(kappa.model,'kappaj.txt')

396 :
中国には特異度100%の検査キットがあるんだってね。
すべて陰性にでるようにセットされていると。

397 :
新型コロナ患者を治療している病院に100人の職員がいる。
検体採取器具は5人分、試薬は1回分しかないとする。
無作為抽出した5人の職員から採取した検体を混合して検査したら陽性であった。
職員の陽性者数の期待値を求めよ。
また、50人以上の感染者いる確率はいくつか?
検査の陽性率はハイリスク群に検査している東京の数値2457/6654を使って計算せよ。
https://i.imgur.com/zYK75Lo.jpg

398 :
>>397
こんなグラフになった。
https://i.imgur.com/gortYDb.png

399 :
>>397
これであってるかな?
> # 期待値
> integrate(function(x) x*pdf(x),0,100)$value
[1] 37.13
> # 50人以上の確率
> integrate(pdf,50,100)$value
[1] 0.0041903
> c(HPDI.lower=lwr,HPDI.upper=upr) # HPDI
HPDI.lower HPDI.upper
27.778 46.558

400 :
レベル低

401 :
慶応大の調査で、コロナ以外で来院した人をPCR検査したところ
4/67の確率で要請だった
東京都内1500万のうち何人くらいが感染しているか推定せよ

402 :
岩田健太郎・神戸大学教授『東京はすでに20万〜400万人感染の可能性』
https://leia.2ch.sc/test/read.cgi/poverty/1587664106/

403 :
>>401
ニュー速でやったが、ベイズでこんな感じ?(感染者率)
https://i.imgur.com/Nfs1vCm.jpg

404 :
>>397
混ぜて検査する方法の最適化問題ってのもあるね。
https://mobile.twitter.com/p_gotcha/status/1243501000943702017
(deleted an unsolicited ad)

405 :
>>401
これって東京の無作為サンプリングではなさそうだよね
病院に来たって事は熱が出てたのかもしれないし
想定できる母集団ってなんになるのだろうか

406 :
新型コロナ患者を治療している病院に100人の職員がいる。
検体採取器具は10人分、試薬は1回分しかないとする。
無作為抽出した10人の職員から採取した検体を混合して検査したら陰性であった。
職員の陽性者数の期待値を求めよ。
また、50人以上の感染者いる確率はいくつか?
検査の陽性率はハイリスク群に検査している東京の数値2457/6654を使って計算せよ。

407 :
>>401
95%CIで
> binom::binom.confint(4,67)
method x n mean lower upper
1 agresti-coull 4 67 0.05970149 0.019131154 0.1480232
2 asymptotic 4 67 0.05970149 0.002968439 0.1164345
3 bayes 4 67 0.06617647 0.015026904 0.1253507
4 cloglog 4 67 0.05970149 0.019283398 0.1337560
5 exact 4 67 0.05970149 0.016504404 0.1458632
6 logit 4 67 0.05970149 0.022588780 0.1485238
7 probit 4 67 0.05970149 0.020905075 0.1402573
8 profile 4 67 0.05970149 0.018970462 0.1332788
9 lrt 4 67 0.05970149 0.018929939 0.1332756
10 prop.test 4 67 0.05970149 0.019297952 0.1534709
11 wilson 4 67 0.05970149 0.023459351 0.1436950

408 :
>>401
まじか。
まあ、体調悪いから病院に行くわけで、バイアスかかってるとはいえ...。

409 :
>>404
ラテン方陣の問題?

410 :
>>403
事前分布にJefferey分布を使っているな。
https://i.imgur.com/m7kdY8Z.png
破線が事前分布、実戦が事後分布
curve(dbeta(x,0.5+4,0.5+67-4),bty='l',xlab='probability',ylab='density')
curve(dbeta(x,0.5,0.5),add=T,lty=2)

411 :
>>410
青実線が事前分布を一様分布(Beta(1,1))としたとき。
https://i.imgur.com/qUF1Fue.png
Jeffereyの方が95%CI幅が小さいな。
> binom::binom.bayes(4,67,prior.shape1 = 0.5,prior.shape2 = 0.5)
method x n shape1 shape2 mean lower upper sig
1 bayes 4 67 4.5 63.5 0.06617647 0.0150269 0.1253507 0.04999999
> binom::binom.bayes(4,67,prior.shape1 = 1, prior.shape2 = 1)
method x n shape1 shape2 mean lower upper sig
1 bayes 4 67 5 64 0.07246377 0.01876916 0.1338218 0.04999999

412 :
>>401
https://georgebest1969.typepad.jp/blog/2020/04/%E6%85%B6%E5%BF%9C%E3%81%AEpcr6%E3%81%AE%E6%84%8F%E5%91%B3.html
に準じて 東京都民の1395万人に当てはめると
> data.frame(method=ci[,1],round(ci[,4:6]*pop))
method mean lower upper
1 agresti-coull 832836 266880 2064924
2 asymptotic 832836 41410 1624262
3 bayes 923162 209625 1748642
4 cloglog 832836 269003 1865896
5 exact 832836 230236 2034792
6 logit 832836 315113 2071907
7 probit 832836 291626 1956590
8 profile 832836 264638 1859240
9 lrt 832836 264073 1859195
10 prop.test 832836 269206 2140919
11 wilson 832836 327258 2004545
岩田の計算は
5 exact 832836 230236 2034792

413 :
>>402
感度30-70%(最頻値0.5,標準偏差0.2のβ分布),特異度(最頻値0.9 標準偏差0.05のβ分布)に設定。
有病率の事前分布は0-1の一様分布にして 
MCMCしてみると
https://i.imgur.com/VfDTj51.png
という結果になった。
有病率の信頼区間は広すぎw
mean lower upper
0.22346412787 0.00000002913 0.83202346988

414 :
>>413
有病率の最頻値は
> density(prev)$x[which.max(density(prev)$y)]
[1] 0.019186

415 :
>>413
事前分布をJeffereyにしたら、
> js=PCRj4(67,4,SEN=0.5,SD1=0.2,SPC=0.9,SD2=0.1,N.ITER=1e6)$js
mean lower upper
1.4972e-01 6.3120e-14 8.5733e-01
> summary(prev)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0000 0.0111 0.0472 0.1497 0.1442 1.0000
> density(prev)$x[which.max(density(prev)$y)] # mode
[1] 0.0032278

416 :
>>415
この最頻値はオーストリアの0.3%という値に等しいな。

417 :
>>415
Jeffreys が正しいスペリングみたい。 Jefferey'sかと思っていた。

418 :
某医療センターでは治療後、2回連続してPCR検査陰性であれば退院させているとする。
PCR検査は
感度0.3~0.7 : β分布(2.625,2.625)相当
特異度 0.95~1.0 : β分布(26.5014,2.3422)相当
有病率は一様分布として
2回連続してPCR検査陰性の患者の有病率の期待値を求めよ。
2回連続検査陰性の患者が感染者である確率と有病率との関係をグラフにしてみた。
灰色点線は95%信頼区間
https://i.imgur.com/2U5HBmb.png

419 :
>>409
動的計画法を使うらしい。
https://qiita.com/p_gotcha/items/e2741b12b4f606b96136

420 :
スレチですが統計に詳しい方がいると思って伺いました。
工学系の大学院生で論文を読んでて、見慣れない記号や数式が出てきたので質問させてください。
この数式中のEは何を意味するのでしょうか?
Rの期待値的なものですか?
https://i.imgur.com/oVwva8r.jpg

421 :
院生でわからないってマジか
専門外の機械学習いきなりやらされたのかな?

422 :
有病率が0.3%(オーストリアの無作為抽出)や6%(慶応大学の入院患者無作為抽出)のときは
感度30〜70% 特異度90〜100%のPCR検査キットでは
陰性的中率は
オーストリアの例では 95%[87%〜99%]
慶応の例では 94%[86〜99%]になる。
すべて陰性にでる中国のイカサマキットなら
陰性的中率は
オーストリアの例では99.7%
慶応の例では94%になる。
有病率が10%くらいになればイカカマキットの方が陰性的中率の成績が劣る。

423 :
某医療センターでは治療後、2回連続してPCR検査陰性であれば退院させているとする。
PCR検査は
感度0.3~0.7 : β分布(2.625,2.625)相当
特異度 0.95~1.0 : β分布(26.5014,2.3422)相当
として
n回連続して陰性であれば退院とするとどれくらいの感染者が野に放たれるかを
有病率(=検査前確率)を変化させてグラフにしてみた。

https://i.imgur.com/fvNvXhX.png

424 :
https://www.researchgate.net/publication/340869568_Saliva_Sample_as_a_Non-Invasive_Specimen_for_the_Diagnosis_of_Coronavirus_Disease-2019_COVID-19_a_Cross-Sectional_Study/link/5ea19006458515ec3aff8f36/download
https://i.imgur.com/3GWmZz3.png
に有病率の低い群で行った唾液と鼻咽頭スワッブ200例のcross-section tableがあったので
これでKappa係数とPABAK(prevalence ad-justed bias adjusted kappa)とその信頼区間をstanのMCMCで出してみた。
swabと唾液でまあ、結果が合致している。

> print(fit.kappa,pars=c('kappa','PABAK'))
Inference for Stan model: kappa.
4 chains, each with iter=2000; warmup=1000; thin=1;
post-warmup draws per chain=1000, total post-warmup draws=4000.

mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
kappa 0.81 0 0.07 0.65 0.77 0.81 0.86 0.92 3540 1
PABAK 0.93 0 0.02 0.88 0.92 0.93 0.95 0.97 3342 1

JAGSでMCMCしてもほぼ同じ結果。
https://i.imgur.com/XKT53Fy.png

425 :
>>394
答えなくね?

426 :
>>425
正解。正直者が誰もいないようにプログラムした。
イナ師が微分で解いてくれるのを期待していたんだが。

427 :
PCR検査は
感度0.3~0.7 : β分布(2.625,2.625)相当
特異度 0.95~1.0 : β分布(26.5014,2.3422)相当
として、
http://statmodeling.hatenablog.com/entry/covid19-estimate-total-number-of-positives-in-japan
の設定を踏襲して、利用できるデータを更新して
推定陽性率は
> summary(p.pos) ; HDInterval::hdi(p.pos)[1:2]
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000031 0.000067 0.004681 0.005229 0.009325 0.016658
lower upper
0.00003082 0.01408833
推定有病率は
> summary(prevalence) ; HDInterval::hdi(prevalence)[1:2]
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.00000 0.00166 0.00529 0.01040 0.01129 0.16078
lower upper
0.0000005693 0.0305640211

428 :
>>426
正直者の確定が誰もいないというより、条件を満たす正直者・嘘つきの組み合わせが存在しないよね?
https://i.imgur.com/NJw3GJN.jpg

429 :
rRT-PRC検査の感度・特異度ともに90%以上です。

430 :
通常の医療でも臨床診断の5%は誤診だと推定されていたりする。
これを実際の数として見積もると膨大になる。

431 :
>>429
採取手技や採取時期で変動すると思う。
コンタミによる偽陽性もあるだろうし。

432 :
>>428
言っていることは同じ。
全部の条件を満たす組み合わせは存在しない。

433 :
>>427
このデータは再現性がないことがわかったので撤回します。

434 :
ふぉー
<新型コロナ>抗体検査5.9%陽性 市中感染の可能性 都内の希望者200人調査
https://www.tokyo-np.co.jp/s/article/2020043090070748.html

435 :
>>434
"検査結果では、一般市民の百四十七人の4・8%にあたる七人が陽性、
医療従事者五十五人のうち9・1%の五人が陽性だった。
https://www.tokyo-np.co.jp/s/article/2020043090070748.html
"
> r1=5;r2=7;n1=55;n2=147
> prop.test(c(r1,r2),c(n1,n2))
2-sample test for equality of proportions with continuity
correction
data: c(r1, r2) out of c(n1, n2)
X-squared = 0.679, df = 1, p-value = 0.41
alternative hypothesis: two.sided
95 percent confidence interval:
-0.052613 0.139194
sample estimates:
prop 1 prop 2
0.090909 0.047619
Warning message:
In prop.test(c(r1, r2), c(n1, n2)) :
Chi-squared approximation may be incorrect
> poisson.test(c(r1,r2),c(n1,n2))
Comparison of Poisson rates
data: c(r1, r2) time base: c(n1, n2)
count1 = 5, expected count1 = 3.27, p-value = 0.33
alternative hypothesis: true rate ratio is not equal to 1
95 percent confidence interval:
0.47778 6.98763
sample estimates:
rate ratio
1.9091

436 :
>>434
これの興味深いところは、陽性率の高さもさることながら、医療関係者の感染率が一般市民のそれよりも
(多分有意に)高いことだと思う。抗体検査の精度ってほとんどデータが無いに等しいけど、医療関係者の
感染者率が平均よりも多いのならば(実際そうなのだと思う)、このテストはそれを反映したものと言えて、
抗体検査の信頼性をある程度証明できるかもしれない。
そして、市中の陽性率の高さも。
この辺、ベイズで上手く検証できないかな。

437 :
>>436
>医療関係者の感染率が一般市民のそれよりも(多分有意に)高い

χ二乗検定では、p-value = 0.41 で 標本数が少ないから有意差がでない。
エントリーが5以下のときには信頼するなと習ったな。

まあ、ポアソンでもp-value = 0.33

>435にRの出力を貼っておいた。

438 :
>>436
55人中5人と147人中7人じゃ、有意差ないだろ。

と書こうと思ったら、 >>437氏に先を越されたwww

439 :
抗体検査キットの評価をしたら特異度はみな5/5だったらしいけど、サンプルが
5つだけって意味だとすると、せいぜい90%以上くらいのことしか言えないな。
特異度95%だとしたら、5%が陽性っていわれてもねぇw

440 :
>>436
事前分布にかなり影響をうけるが、
感度特異度とも50-70%(最頻値60%標準偏差10%のβ分布),
有病率は一様分布、
検査陽性数は陽性確率が 有病率*感度+(1-有病率)*(1-特異度)の二項分布に従う
というモデルでプログラムを組むと
model
{
for(i in 1:N) {
x[i] ~ dbin(p,n[i])
}
p = prev*sen + (1-prev)*(1-spc)
PPV=sen*prev/(sen*prev+(1-prev)*(1-spc))
NPV=(1-prev)*spc/((1-prev)*spc+prev*(1-sen))
precision=(prev*sen+(1-prev)*spc)/
((prev*sen+(1-prev)*spc + (1-prev)*(1-spc)+(prev*(1-sen))))
pLR=sen/(1-spc)
nLR=(1-sen)/spc
DOR=pLR/nLR
sen ~ dbeta(sn[1],sn[2])
spc ~ dbeta(sp[1],sp[2])
prev ~ dbeta(shape1,shape2)
}
結果は、
https://i.imgur.com/eKXLUXZ.png
有病率の期待値は2.3%、最頻値は0.31% 少数データなので信頼区間が広い。
有病率が平均値50%の一様分布というのは現実離れした分布だとは思う。

441 :
>>439
すべてが陰性に出るイカサマキットなら特異度が100%
>18参照

442 :
>55人中5人と147人中7人じゃ、有意差ないだろ。
その比率のまま、約4倍(3.87倍)になればχ二乗検定で有意差がでるね。
r1=5;r2=7;n1=55;n2=147
mat=matrix(c(r1,r2,n1,n2),2,b=T)
fn <- function(x) chisq.test(mat*x)$p.value
fn=Vectorize(fn)
uniroot(function(x) fn(x)-0.05,c(1,10))$root
fn(4)
> fn(4)
[1] 0.045678

443 :
>>440(追記)
>有病率が平均値50%の一様分布というのは現実離れした分布だとは思う。
オーストリアのデータ0.3%を参考に有病率の事前分布が0.2-0.4%
β(10.865, 3279.34)に相当として、MCMCしてみた。
感度と特異度の事前分布は前回と同じ。

https://i.imgur.com/dHcOxsR.png

さほど、有病率が高いという結論は引き出せないな。

444 :
自己流な検定
A群55人中5人とB群147人中7人に有意差はあるか?
モンテカルロ法で検証
A群もB群も同じ陽性率で、0.0594と仮定する
∵ 陽性率は、 12/(55+147) = 12/202 = 0.0594
モンテカルロ法100万回したら
B群の陽性者が7名となったのは、125238回
その内 A群の陽性が5名以上は、28293回
∴ P(55人中5人以上|147人中7人) = 28293/125238 = 0.226
∴ 有意差なし
EXCEL VBAソースコード概略
Dim I As Long
Dim J As Long
Dim K As Long
K = 1
For I = 1 To 1000000
A = 0
For J = 1 To 55
If Rnd(1) < 0.0594 Then '陽性
A = A + 1
End If
Next
B = 0
For J = 1 To 147
If Rnd(1) < 0.0594 Then '陽性
B = B + 1
End If
Next
If B = 7 Then 'B群の陽性者が7名の場合
Cells(K, "A") = A 'A群の陽性者の人数
K = K + 1
End If
B = 0
Next

445 :
β分布と乱数発生で比較。
一般人と医療従事者の確率分布に従う乱数を1000万個発生させて比率の分布をグラフにすると
95%信頼区間が1を挟むから有意差なし。比率が1以上となる確率も87.5%で95%を越えないから有意差なし。
https://i.imgur.com/8zFKODI.png
a=0.5 ; b=0.5
r1=5 ; r2=7 ; n1=55 ; n2=147
layout(1)
layout(matrix(1:2,2))
curve(dbeta(x,a+r2,b+n2-r2),0,0.3,bty='l',ann=F,lwd=2)
curve(dbeta(x,a+r1,b+n1-r1),col=2,add=T,lwd=2)
legend('center',bty='n',legend=c('general','medical'),lwd=2,col=1:2)
k=1e7
general=rbeta(k,a+r2,b+n2-r2)
medical=rbeta(k,a+r1,b+n1-r1)
BEST::plotPost(medical/general,compVal = 1)

446 :
>>441
すべてが陰性に出るなら陽性は0人だろw

447 :
>>446
偽陽性率0%だから特異度は100%

448 :
>>447
だから、陽性が何人か出てんだから感度0%のインチキじゃなかろうってこと。

449 :
最近の報道
インドは、中国企業から購入した中共ウイルス(新型コロナウイルス)の迅速スクリーニング検査キットの精度がわずか5%だとして、約50万個の注文をキャンセルした。
....
神戸市中央区にある市立医療センター中央市民病院の医師などのグループは、ことし3月末から先月7日にかけて、新型コロナウイルス以外の理由で外来を受診した患者から無作為に1000人を選び、血液中に新型コロナウイルスに感染したあとにできる「抗体」があるか調べました。
グループによりますとその結果、3.3%にあたる33人から抗体が検出されたということです。
以上を知ったある会社が
必ず陽性がでる試薬33個と必ず陰性がでる試薬967個を混ぜた1000試薬をセットにしてインドに売り込んだ。
問題
1試薬は1回しか検査できないとして
これがイカサマキットであることを証明する手段はあるか?

450 :
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku
昨年度の大学への数学(大数)での勝率は、
学コンBコースが 1/1 = 100% ,
宿題が 3/10 = 30% でした!
宿題の勝率が低すぎると思うので、
これからは一層精進していきたいです!
https://twitter.com/shukudai_sujaku
(deleted an unsolicited ad)

451 :
高橋洋一(統計数理研究所→大蔵省)
スウェーデンの感染症対策を解説
https://youtu.be/2bsYRuorwMI?t=192

452 :
https://toyokeizai.net/sp/visual/tko/covid19/
のデータを使って
P=14895/153581  # 2020/05/04
PCR検査の感度30-70%のモデルM1と感度70-90%のモデルM2のどちらが信憑性があるか、ベイズファクターで計算してみる。
M1は感度が最頻値60%標準偏差10%、M2は最頻値80%標準偏差10%のベータ分布に設定
特異度はいずれも最頻値95%標準偏差2.5%に設定し、有病率は一様分布を仮定
陽性数は、陽性率(P)=真陽性率+偽陽性率=有病率=有病率*感度 + (1-有病率)*(1-特異度)の二項分布に従うとする。
事後確率分布は
https://i.imgur.com/81bK4KE.png
陽性率P=14895/153581=0.09698465での事後確率分布の密度比(Savage-Dickey density ratio)でベイズファクターを出すと
> d1/d2 # Savage-Dickey densiti ratio = BF12
[1] 1.007722
まあ、ちょっぴり、感度30-70%のモデルの方がいいかも、という結果。
陽性数/検査数の時系列データでもあればもう少し差がでるかもしれん。
東京都のデータで計算させようかと思ったが、東京都は検査人数を隠蔽しているので使いものにならない。

453 :
訂正

陽性数は、陽性率(P)=真陽性率+偽陽性率=有病率=有病率*感度 + (1-有病率)*(1-特異度)の二項分布に従うとする

陽性数は、陽性率(P)=真陽性率+偽陽性率=有病率*感度 + (1-有病率)*(1-特異度)の二項分布に従うとする

454 :
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku
昨年度の大学への数学(大数)での勝率は、
学コンBコースが 1/1 = 100% ,
宿題が 3/10 = 30% でした!
宿題の勝率が低すぎると思うので、
これからは一層精進していきたいです!
https://twitter.com/shukudai_sujaku
(deleted an unsolicited ad)

455 :
>>449
抗体のはいったサンプルを2,30個試してみりゃわかんじゃないの?
いくらなんでも感度が3%じゃつかえねぇ。

456 :
イカサマキットの感度特異度の事前分布を一様分布に設定して
抗体のはいったサンプルを20個で全部陰性であったので30個試したら全部陰性であったとすると
感度・特異度の事後分布は
https://i.imgur.com/6ZYn34k.png

457 :
ところが、有病率33/1000であったときに無作為に20人および30人を選んで全部陰性であっても
感度・特異度の事後分布は
https://i.imgur.com/jWg4RgH.png

458 :
>>454
事後分布を一様分布に設定して、このコピペ小僧の正解率の期待値・最頻値・95%信頼区間を求めよ。
その結果、
https://i.imgur.com/M9SdCSL.png

459 :
>>458
ベータ分布の理論値
> HDInterval::hdi(qbeta,shape1=5,shape2=8)[1:2]
lower upper
0.1406542 0.6377277
> 5/(5+8) # mean
[1] 0.3846154
> (5-1)/(5-1+8-1) # mode
[1] 0.3636364

460 :
>>454
このコピペ小僧の正解率に学コンと宿題で差があるかを検定せよ。
事前分布にJefferysを用いた結果、
https://i.imgur.com/2yYagtX.png

461 :
>>456
感度が5%以下じゃつかいもんにならんわなぁ。インチキで確定。

462 :
https://www.buzzfeed.com/jp/naokoiwanaga/covid-19-antibody-test
大阪市立大学が一昨年の血液を使って検査したところ、偽陽性は1人もいなかったそうだ。

463 :
>>462
>2020年4月中の2日間に同大学の付属病院を、新型コロナウイルス感染症の診療以外で受診した
>患者を対象に、そこから無作為に312人を抽出・・・・312 人(年齢中央値 66.5 歳、
>男性:女性=154:158)のうち、3人が陽性であることがわかった。約1%の陽性率だ。
>統計的な誤差を考慮すると、95%の確率で0.33〜2.8%の間に入る・・・・・・・・・・・・
教えてエロい人
Q1統計的推定を述べるなら「95%の確率で」でなく「信頼率95%で」と書くのが適切ではないか?
Q2無作為抽出陽性率3/312=0.96%の母集団陽性率上側/下側信頼区間=0.96-0.33/2.80-0.96と
  上側区間≠下側区間で左右非対称分布想定は何故?
Q3サンプルサイズ312は過少では?過少に伴う推定誤差加算が必要では?

464 :
>>463
Wilsonの式を使ったんだろうね。

method x n mean lower upper
1 agresti-coull 3 312 0.0096 0.0019 0.029
2 asymptotic 3 312 0.0096 -0.0012 0.020
3 bayes 3 312 0.0112 0.0016 0.023
4 cloglog 3 312 0.0096 0.0027 0.026
5 exact 3 312 0.0096 0.0020 0.028
6 logit 3 312 0.0096 0.0031 0.029
7 probit 3 312 0.0096 0.0029 0.027
8 profile 3 312 0.0096 0.0024 0.025
9 lrt 3 312 0.0096 0.0024 0.025
10 prop.test 3 312 0.0096 0.0025 0.030
11 wilson 3 312 0.0096 0.0033 0.028

https://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A3%E3%83%AB%E3%82%BD%E3%83%B3%E3%81%AE%E4%BF%A1%E9%A0%BC%E5%8C%BA%E9%96%93

465 :
Wilsonの式での95%信頼区間幅を1%以内にしたいなら
サンプルサイズは38411が必要という計算になった。
Rでの算出プログラム
library(binom)
x=3
n=312
binom.wilson(x,n)
fn <- function(n){
x=0:n
l=binom.wilson(x,n)[,5]
u=binom.wilson(x,n)[,6]
max(u-l)
}
fn=Vectorize(fn)
n=seq(1000,50000,by=1000)
plot(n,fn(n))
abline(h=0.01,lty=3)
uniroot(function(x,u0=0.01) fn(x)-u0, c(10000,50000))

466 :
>>462
50人で0でしょ?
だったら、特異度として保証されるのはせいぜい98%程度じゃん。
1%の陽性率に対して、それでは不十分。

467 :
>>466
95%信頼区間の下限境界は

事前分布をJeffreysで
> qbeta(0.95,0.5+50,0.5,lower=F)
[1] 0.9624989
事前分布を一様分布で
> qbeta(0.95,1+50,1,lower=F)
[1] 0.942952

468 :
特異度の95%の信頼区間の下限値を0.99にするのに必要なサンプルサイズは
事前分布を一様分布で
> uniroot(function(x) fn(x)-0.99, c(100,500))$root
[1] 297.0728
Jeffreysで
> uniroot(function(x) fn(x,0.5,0.5)-0.99, c(100,500))$root
[1] 190.8606

fn <- function(x,shape1=1,shape2=1){
qbeta(0.95,shape1 + x, shape2, lower=F)
}
n=50:500
plot(n,fn(n),type='l', ylab='95%CI.lower')
abline(h=0.99,lty=3)
uniroot(function(x) fn(x)-0.99, c(100,500))$root
uniroot(function(x) fn(x,0.5,0.5)-0.99, c(100,500))$root

469 :
https://www.buzzfeed.com/jp/naokoiwanaga/covid-19-antibody-test
のデータを使って、不明なものは一様分布(ベータ分布の形状母数(1,1))に事前分布を設定してMCMCしてみる。
x=c(3,33)
n=c(312,1000)
m=50
N=length(n)
shape1=1
shape2=1
model{
for(i in 1:N){
x[i] ~ dbin(p,n[i]) # 二項分布
}
p <- prev*sen+(1-prev)*(1-spc) # 陽性=真陽性+偽陽性
sen ~ dbeta(shape1,shape2)
spc ~ dbeta(shape1+m,shape2)
prev ~ dbeta(shape1,shape1)
}
その結果
https://i.imgur.com/B7p825B.png

470 :
>>469
なにやってるかよくわからんので、見当外れの指摘かもしれんが、
大阪市大の3/312と神戸大の33/1000ってのは特異度も感度も異なる
であろう別種のキットによる検査結果なんで、一緒くたにしちゃ
まずいんでないの?

471 :
>>470
同一キットじゃないから、ご指摘の通り。
しかも神戸大の方では陰性検体での確認はされていないから、神戸大方の陽性率が高いのは偽陽性を含む可能性もあるね。

大阪市大だけのデータでやってみると。

https://i.imgur.com/njVQtRZ.png

472 :
>>471
使える情報が少なすぎて信頼区間が広すぎ。
有病率:0-87%
キットの感度:0-70%
ってコイントス変わらんな。

473 :
結局のところ、断定的な結論は出せないねということを数字で確認しているだけw

474 :
>>464
>>465
有難うございます。
二項分布下の母比率の信頼区間推定問題なんですね。
A2:正規分布近似法でなくWilsonの信頼区間法で解くから
  上側区間≠下側区間となり平均値まわり左右非対称信頼区間と
  なるのですね。

475 :
3月の宿題で(1)のみ正解の数弱@shukudai_sujaku
昨年度の大学への数学(大数)での勝率は、
学コンBコースが 1/1 = 100% ,
宿題が 3/10 = 30% でした!
宿題の勝率が低すぎると思うので、
これからは一層精進していきたいです!
https://twitter.com/shukudai_sujaku
(deleted an unsolicited ad)

476 :
>>474
Rのlibrary binomを使って binom::confint(3,312)で >464の出力が得られる
信頼区間をグラフにすると
https://i.imgur.com/Mlvv7bB.png
点線は3/312
正規分布近似のasymptotic以外は非対称。
どれを使うべきか? 好きなのを使えばいい、と思う。
但し、値が負になったり1を越えたりするのは不採用の方が賢明だとは思う。
Wilson法は値が0や1に近くても信頼できるという人がいるけど、どうやって検証するのかはよくわからん。

477 :
>>476
binom::confintはbinom.confint(3,312)の間違い
library("binom")
binom.confint(3,312)

478 :
レムデシビルで初のRCTが出たんだけど、
https://www.thelancet.com/pdfs/journals/lancet/PIIS0140-6736(20)31022-9.pdf
レムデシビルRCTで有意差だせず、症例数不足で検出力不足とか。
確かに、効力がわずからなら検出力不足
> n1=158
> n2=78
> pwr.2p2n.test(h=c(0.8,0.5,0.2),n1=n1,n2=n2,sig.level = 0.05,power=NULL,
+ alternative = "two.sided")
difference of proportion power calculation for binomial distribution (arcsine transformation)
h = 0.8, 0.5, 0.2
n1 = 158
n2 = 78
sig.level = 0.05
power = 0.9999336, 0.9508568, 0.3037150
alternative = two.sided
NOTE: different sample sizes

"
Remdesivir group (n=158)Placebo group (n=78)Difference
Clinical improvement rates
Day 7 4 (3%) 2 (3%) 0.0% (-4.3 to 4.2)
Day 14 42 (27%) 18 (23%) 3.5% (-8.1 to 15.1)
Day 28 103 (65%) 45 (58%) 7.5% (-5.7 to 20.7)
"
どの週においても両群で症状改善率は不変
症状改善率はどちらも一様分布を事前分布に仮定して
症状改善率の差δ=:0というモデルとδ≠0というモデルでのベイズファクター(周辺尤度比=エビデンス比)を求めると
> (BF01=d.post/d.prio)
[1] 1.01472
なので、どちらのモデルが得られたデータを説明するのに適しているかは判断できず、という結果になった。
検出力不足か、差がないのかには決着つかず。

479 :
library(pwr)
library(rjags)
library(polspline)
par(bty='l')
n1=158
n2=78
pwr.2p2n.test(h=c(0.8,0.5,0.2),n1=n1,n2=n2,sig.level = 0.05,power=NULL,
alternative = "two.sided")
pwr.2p2n.test(h=NULL,n1=n1,n2=n2,sig.level = 0.05,power=0.80,
alternative = "two.sided")
s1=c(4,42,103) # improvement with Remdesivir
s2=c(2,18,45) # improvement with placebo
# s1=103 ; s2=45 # Day 28
N=length(s1) # 3
shape1=1 # prior parameter in dbeta
shape2=1
data=list(n1=n1,n2=n2,s1=s2,N=N,shape1=shape1,shape2=shape2)
modelString='
model{
# data
for(i in 1:N){
s1[i] ~ dbin(p1,n1)
s2[i] ~ dbin(p2,n2)
}
# parameter
delta <- p1 - p2
# priors
p1 ~ dbeta(shape1, shape2)
p2 ~ dbeta(shape1, shape2)
# sampling from priors
pri.p1 ~ dbeta(shape1, shape2)
pri.p2 ~ dbeta(shape1, shape2)
pri.delta <- pri.p1 - pri.p2
}
'
writeLines(modelString,'tmp.txt')
n.iter=1e5 ; thin=1
jagsModel=jags.model('tmp.txt',data,inits = NULL,n.chains=4,n.adapt=n.iter/5)
update(jagsModel)
codaSamples=coda.samples(jagsModel,c('delta','pri.delta'),n.iter,thin)
# plot(codaSamples)
coda2summary(codaSamples)
js=as.data.frame(as.matrix(codaSamples))
BEST::plotPost(js$delta,compVal=0,xlab=bquote(delta))
fit.post=logspline(js$delta)
fit.prio=logspline(js$pri.delta)
curve(dlogspline(x, fit.post), -2,2, lty=2, xlab=bquote(delta),ylab='Density')
curve(dlogspline(x, fit.prio), add=T)
(d.post=dlogspline(0,fit.post))
(d.prio=dlogspline(0,fit.prio))
legend('topright', bty='n', legend=c('δ≠0','δ=0'), lty=1:2)
abline(v=0,col=8)
points(c(0,0),c(d.post,d.prio),pch=c(1,19))
(BF01=d.post/d.prio)

480 :
確率分布を図示すると
https://i.imgur.com/hfH7gZO.png

481 :
100例もやって差がでないのなら、はっきり言って効き目なしとかわらん。
むしろ副作用がこわい。
アビガンはどうなんだろうね。なぜか国内のまとまったデータがまだ出てこない。

482 :
まあ、軽症者が8割とかだと、早期投与の効き目を判定するには相当の
人数に使わないとわかんないだろうけど。

483 :
死亡率に関してはベイズファクターで推論できた。
Remdesivir group (n=158) Placebo group (n=78) Difference
Day 28 mortality 22 (14%) 10 (13%) 1.1(-8.1% to 10.3%)"
事前確率分布をどうするかだが、なんの情報もないので
実薬群も対照群も一様分布(もしくはJeffreys分布)とする。
死亡率の差δの事前分布と事後分布の確率分布曲線を描いてδ=0での確率密度比(Savage-Dickey density ratio)が
ベイズファクター(周辺尤度の比)になる。 
これをJAGSを用いたプログラムで計算すると、一様分布のとき8.34 Jeffrey分布のとき6.40となる。、
10を超えないいのでまあ、中程度の確信で検出力不足によるのではなく、もともと差がないのであろうと推論できる。
サンプルサイズを増やしてもレムデシビルは軽症・早期投与でも致死率を改善しないであろうと予想。

484 :
>どの週においても両群で症状改善率は不変
この前提はおかしいので週ごとに症状改善率が変わるようにモデルを変更
model{
# data
for(i in 1:N){
s1[i] ~ dbin(p1[i],n1)
s2[i] ~ dbin(p2[i],n2)
}

# parameter
alpha <- delta*sigma
for(i in 1:N){
p1[i] <- phi(x1[i]) # probit:pnorm(x)
p2[i] <- phi(x2[i])
# p1[i] <- ilogit(x1[i]) # logit:exp(x)/(1+exp(x))
# p2[i] <- ilogit(x2[i])
}
# model
for(i in 1:N){
x1[i] ~ dnorm(mu + alpha/2, pow(sigma,-2)) # alpha:difference of mean
x2[i] ~ dnorm(mu - alpha/2, pow(sigma,-2))
}

# priors
delta ~ dnorm(0,1)
mu ~ dnorm(0,1)
sigma ~ dt(0,1,1)T(0,)
}
ベイズファクターは
> (BF01=d.post/d.prio)
[1] 0.9976274
症状改善率に差がないというモデルも差があるというモデルも周辺尤度(エビデンス)はほぼ同じという結果。

485 :
あ、 >>482はレムデシじゃなくてアビガンについての話だかんね。
レムデシは重症者向けらしいけど、たぶん駄目だろ。

486 :
【政府が隠す3.11】 地震波形が、核実験と同じ
http://rio2016.2ch.sc/test/read.cgi/earth/1575170033/l50
sssp://o.2ch.sc/1nmad.png

487 :
5/10夜『NHKスペシャル』「新型コロナウイルス 出口戦略は」で
厚労省新型コロナ対策班西浦博北大教授と氏が分析中のノートPC画面が
映されていた。氏の使用解析ソフトウェア名は何というのでしょうか?

488 :
西浦先生はRじゃないかな。
今週ぐらいに、実効再生産数を算出するRのコードを公開できるかもと言ってた。
火曜にはニコ生があるから、そこでたっぷりと聞けるはず。
https://sp.live.nicovideo.jp/watch/lv325833316

489 :
>>488
>11に数式があるけど

490 :
>>489
いや、与えられた何日分かの新規患者数から再生産数とか回復率とかを推定するための数式じゃないの?

491 :
>>490
SEIRより単純なReed-Frostモデルだよな
https://en.m.wikipedia.org/wiki/Reed%E2%80%93Frost_model

492 :
>>489
自分で計算してみた人ならわかるけど、日々の再生算数を出すにはA「感染してから他人にうつすまでの日数の分布」が必要。西浦先生はこれをまず求めていて、その結果は割合と世界中で使われている。
加えてB「感染してから発表の数字に載るまでの日数の分布」も必要で、発表の数字をBで逆畳み込み積分してC「感染推定日毎の数字」に変換し、CをAで畳み込み積分したものでCを割れば日々のRtが求められる。
とは言うものの、そのままやると誤差で数字が発散するし、逆畳み込みは一意ではないのでどう推定するかは色々と考えなくてはならない。多分日本独自の事情もコードに入れなきゃいけない。大変だろうなあとは思う。

493 :
>>492
レスありがとうございます。
確かにSEIRモデルやSIRIモデルだと
「感染してから発表の数字に載るまでの日数の分布」って考慮されてないね。

494 :
>>488
公開されたぞー。StanとRだ。
https://nbviewer.jupyter.org/github/contactmodel/COVID19-Japan-Reff/blob/master/scripts/C.%20Calculating%20the%20Rt%20in%20Stan.ipynb

495 :
ウイルス感染のモデルも必要だと思うけど
社会経済活動の影響や
自粛解除した後の死者増加や
自粛継続した場合の法人の倒産や
治療薬やワクチンができた後の社会の経済や文化面の回復
そこまで考慮してどういう政策を選択したら
損失を最小化できるかという問題は解ける?

制約付きの最小化問題だと思う
数値化するのが難しい考慮要素もあるからその辺は仮の値とかで

496 :
>>495
モデルを精密複雑化すればするほど、必要なパラメータが増えて
それを弱情報事前分布にすると事後分布の信頼区間が広がるんだなぁと思う。

497 :
>>494
これにある、
JapaneseDataCOVID19
ってどこかからダウンロードできるんだろうか?

498 :
>>497
https://github.com/contactmodel/COVID19-Japan-Reff/tree/master/data

499 :
>>498
ありがとうございます。

500 :
親ディレクトリ(フォルダ)探せばよかったんだね。
https://nbviewer.jupyter.org/github/contactmodel/COVID19-Japan-Reff/tree/master/

501 :
>>495 >>496
パラメータを増やせば増やすほど、どんな仮説も否定できなくなる。
実験系の学界でよく使う手口だよね。

おや、誰か来たようだ…

502 :
>>494
これを走らせてみたい人いますか?
> datestar = as.Date("2020-05-10")
> datemin = as.Date("2019-12-25") # particular choice
> (tstar = as.numeric(datestar - datemin))
[1] 137
> (K = nrow(df_cases)) # 147
[1] 147
なので、
data {
int<lower = 1> K; //number of days
vector<lower = 0>[K] imported_backproj;
vector<lower = 0>[K] domestic_backproj;
int<lower = K> upper_bound;

int<lower = K> upper_bound;

Error in new_CppObject_xp(fields$.module, fields$.pointer, ...) :
Exception: modelf2b01ab215_fit_infection_namespace::modelf2b01ab215_fit_infection: upper_bound is 137, but must be greater than or equal to 147 (in 'modelf2b01ab215_fit_infection' at line 53)
upper_bound 137の下限を K 147にしているからみたい。

503 :
upper_boundの制限を外して
data {
// int<lower = K> upper_bound;
int upper_bound;
再生数の平均値を以下の出すブロックを加えて走らせてみた。
transformed parameters{
real mean_Rt;
real mean_Rt_adj;
mean_Rt = mean(Rt);
mean_Rt_adj = mean(Rt_adj);
}
その結果、
Inference for Stan model: fit_infection.
2 chains, each with iter=10000; warmup=2000; thin=5;
post-warmup draws per chain=1600, total post-warmup draws=3200.
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
mean_Rt 1.79 0 0.07 1.66 1.74 1.79 1.83 1.92 3122 1
mean_Rt_adj 1.79 0 0.07 1.66 1.74 1.79 1.84 1.93 3123 1

504 :
再生算数を0〜10人の一様分布にすると、収束しない。
> print(fit_u)
Inference for Stan model: fit_infection_u.
4 chains, each with iter=10000; warmup=5000; thin=5;
post-warmup draws per chain=1000, total post-warmup draws=4000.
mean se_mean sd 2.5% 25% 50% 75% 97.5% n_eff Rhat
mean_Rt 2.15 0.05 0.10 1.98 2.06 2.16 2.23 2.30 3 1.99
mean_Rt_adj 2.13 0.07 0.11 1.93 2.06 2.13 2.21 2.36 3 2.27
lp__ -789.19 7.18 14.43 -820.19 -797.69 -787.44 -779.42 -762.53 4 1.89
traceplotやchainの分布はこんな感じ、
https://i.imgur.com/z0RL1KW.png
https://i.imgur.com/VRrrsKw.png

505 :
>>501
否定できないけど実証もできないことになるのでは?
単純なモデルだと現実の問題を解決できない事もあるし

506 :
>>494
モデルで再生産数の事前分布は 平均2.5 標準偏差2.0の正規分布に設定されていたので
平均と標準偏差を変化させて、再生産数の事後分布を描出してみた。
かなり、事前分布の影響を受けるみたい。
https://i.imgur.com/OwqsFC1.png

507 :
どうも、こういう境地だなぁ。

断定的な結論は出せないということを数字で確認しているだけw

508 :
基本再生算数はウイルスの特徴で決まるもので
実行再生算数は更に環境や人の行動の影響で変化するものだと理解している
実行再生算数を減らすようにするには
どう行動したらいいか
かつ経済活動を出来るだけ下げずに

509 :
西浦モデル、一度感染日ごとの人数を最尤法で確定して、そこからベイズを回してRtを求めてるんだよなあ。
本来は、日々の感染者数も確率的に揺れがあるはず。だからRtの誤差幅は発表よりも多く見積もるべきかもしれん。

510 :
コードを解説してる人
http://mikuhatsune.hatenadiary.com/entry/2020/05/13/205824

511 :
再生産数の事前分布を色々かえて事後分布を出してみた。
https://i.imgur.com/CT2TRbg.png

512 :
>>504
切断分布だと収束しないみたいなので、
一様分布[0,10]に近そうな正規分布[5,3]
https://i.imgur.com/h8vMZUM.png
を事前分布にして走らせてみた。
https://i.imgur.com/O5s0Y8a.png

513 :
【新型コロナ】 東京0.6%、東北6県0.4%陽性・・・抗体検査1000人実施 [影のたけし軍団★]
https://asahi.2ch.sc/test/read.cgi/newsplus/1589502801/

複数の検査キットの性能評価と感染状況の確認が目的でしたが、東京都で献血した500人のうち3人、
東北6県で献血した500人のうち2人がいずれかの検査キットで陽性と判定されました。

満員電車など人との接触の多い東京とそうでない東北で陽性率に有意差はあるか?

514 :
>>513
検査キットの特異度が99.5%以上あることが検証されました。
ってだけの話じゃね?
まぁ、東北6県と東京が同じってことは、特異度はそれより
高くはないってことだろうね。

515 :
言い換えると、真の陽性率はわかりません、ってこと。

516 :
>>513
陽性率の確率分布を一様分布にすると事後分布は
https://i.imgur.com/YF6m869.png
なるけど、重なりの部分の面積が差がないことの度合いを示していると考えていいかな?

517 :
これは、味気がないな。
> Epi::twoby2(x)
2 by 2 table analysis:
------------------------------------------------------
Outcome : Col 1
Comparing : Row 1 vs. Row 2
Col 1 Col 2 P(Col 1) 95% conf. interval
Row 1 3 497 0.006 0.0019 0.0184
Row 2 2 498 0.004 0.0010 0.0158
95% conf. interval
Relative Risk: 1.5000 0.2517 8.9384
Sample Odds Ratio: 1.5030 0.2501 9.0339
Conditional MLE Odds Ratio: 1.5024 0.1713 18.0536
Probability difference: 0.0020 -0.0092 0.0139
Exact P-value: 1.0000
Asymptotic P-value: 0.6561
------------------------------------------------------

518 :
再生産数を計算するRのプログラムあったんだな
https://www.rdocumentation.org/packages/EpiEstim/versions/2.2-1/topics/estimate_R

519 :
>>509
後者の分析、RStan本の訳者が今やっているようだ。
https://twitter.com/hankagosa/status/1261430169283125248
(deleted an unsolicited ad)

520 :
>>519
https://twitter.com/hankagosa/status/1261426113374416897
(deleted an unsolicited ad)

521 :
>>520
アヒル本の著者だね。俺も読んだ。

522 :
4/2の時点で感染者数を6000くらいと見積もってるね。>アヒル本の人
実数の三倍程度。いい線かもしれない。

523 :
https://github.com/contactmodel/COVID19-Japan-Reff/blob/master/nishiura_Rt%E4%BC%9A%E8%AD%B0_12May2020.pdf

524 :
int<lower = K> upper_bound;

int upper_bound;
にしてもエラーがでる。
stan_dataで
upper_bound = 147 にすると動くけど、何をやってんのか自分でもよくわからん。

525 :
アヒル本ってなんですか?

526 :
>>525
名著として名高いStanの入門書
StanとRでベイズ統計モデリング (Wonderful R) (日本語) 単行本 ? 2016/10/25
表紙の色がアヒルのくちばしの色に似ているかららしい。

527 :
>>524
自己解決
select

dplyr::select
でちゃんと動作した

528 :
>>526
thx

529 :
R に EpiEstimというパッケージがあって、再生産数を算出する関数が搭載されている。
結局、infecterとinfecteeが発症するまでの期間serial intervalの分布をどう設定するかで結果が変わるみたいだなぁ。
Rのヘルプファイルを解読中。
Rのヘルプファイルは不親切設計で有名(理解できている人の備忘録みたいな性格だから)。

530 :
ここに居る人達って何者なの
学部の知識超えてるよね
統計でご飯食べてる人たち?

531 :
しかし、なんでも揃ってるなRって

532 :
>>529
Stanでの西浦モデルではinfecterとinfecteeが発症するまでの期間serial intervalの分布に
## Serial interval [Nishiura et al 2020 - only certain cases]
param1_SI = 2.305,
param2_SI = 5.452,

// serial interval
vector[K] gt = pweibull(param1_SI, param2_SI, K);

として使われているので、平均値などを出してみた。
乱数発生と理論値
> x=rweibull(1e5,param1_SI,param2_SI)
> mean(x) ; param2_SI*gamma(1+1/param1_SI)
[1] 4.829273
[1] 4.830129
> var(x) ; param2_SI^2*(gamma(1+2/param1_SI)-(gamma(1+1/param1_SI))^2)
[1] 4.907755
[1] 4.940682
> median(x) ; param2_SI*(log(2)^(1/param1_SI))
[1] 4.655777
[1] 4.6505
> density(x)$x[which.max(density(x)$y)] ; param2_SI*(1-1/param1_SI)^(1/param1_SI)
[1] 4.116837
[1] 4.259624
> optimise(function(x) dweibull(x,param1_SI,param2_SI),c(0,10),maximum = T)$max
[1] 4.259623
グラフにしてみた。
https://i.imgur.com/9vvCJuZ.png
正規分布で近似してもよさそうな感じだな。

533 :
>>532
ワイブル分布の平均 4.830129と標準偏差2.222765をそのまま正規分布のパラメータに使って、グラフを重ねてみる。
https://i.imgur.com/TnzGwWx.png
ワイブル分布で発生させた乱数をワイブルでフィットさせてAICを出してみた
Goodness-of-fit criteria
1-mle-weibull
Akaike's Information Criterion 438377.2
Bayesian Information Criterion 438396.2
ワイブル分布で発生させた乱数を正規分布でフィットさせてAICを出してみた。
Goodness-of-fit criteria
1-mle-norm
Akaike's Information Criterion 444280.9
Bayesian Information Criterion 444299.9
まぁ、許容範囲。
これで、
library(EpiEstim)の例にある、 mean_si std_siが求まった
## Estimate R with assumptions on serial interval
res <- estimate_R(incid, method = "parametric_si",
config = make_config(list(
mean_si = 4.83, std_si = 2.22)))
domestic , imported, unobserved の分類がよくわからんが、全部足してグラフを描いてみた。
https://i.imgur.com/rKBeWgq.png

534 :
別の論文だと対数正規分布がフィットすると西浦氏は記載している。
serila interval : infector と infecteeの発症間隔
https://www.ijidonline.com/article/S1201-9712(20)30119-3/pdf
その分布が平均4.7 標準偏差2.9の対数正規分布が最もフィットするのはいいんだが、
その分布を与えるパラメータの記述がほしい。
最小二乗法で求めてみた。 
$par
[1] 1.3862713 0.5679836
ワイブル分布にも似るとか書いてあるがパラメータ記載なし
この対数正規分布をワイブル分布で近似してみる。
Fitting of the distribution ' weibull ' by maximum likelihood
Parameters:
estimate Std. Error
shape 1.757488 0.00392072
scale 5.316986 0.01014664
https://i.imgur.com/Uzg6u84.png
点線が2項分布で実線がワイブル分布

535 :
“頭脳王”東大生・河野玄斗
基本的な数学でコロナウイルス検査を全員にしても意味がないことを証明してみた
https://www.youtube.com/watch?v=jMIScCb04qs

536 :
実効再生産数を感染者数の推移から推定する数理的原理をキチンと解説した本、または論文誰か知りませんか?
勉強してみたい。

537 :
>>536
RのEpiEstimの著書の論文なんかどうでしょう?
A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3816335/

538 :
Rで引数なしで関数を実行させようとすると、ソースが表示される。
その関数が呼び出した関数のソースを次々に辿っていけば内部計算がわかるので、そこから原理がつかめるかも(俺には無理なのでしないけど)
内部関数のときは:が3つとか、パッケージ名:::関数、パッケージ名:::関数.default(例、t検定のソース表示は stats:::t.test.default )で表示される。
EpiEstim::estimate_R
EpiEstim:::process_si_data
EpiEstim:::process_config_si_from_data
coarseDataTools::dic.fit.mcmc

539 :
>>529
感染者に0が続くと再生産数の信頼区間幅がどんどん広くなってくる。
まあ、疫病用のソフトウェアと理解しておこう。
https://i.imgur.com/QbwNydN.png
infected=c(0,1,1,1,0,0,0,2,0,3,2,3,1,1,1,1,3,0,1,0,0,0,0,0,1,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0)
## Estimate R with assumptions on serial interval
res <- estimate_R(infected, method = "parametric_si",
config = make_config(list(
mean_si = 4.83, std_si = 2.22)))

540 :
>>539
ちゃんと、記載されていた :P
the precision of these estimates
depends directly on the number of incident cases in the time
window [t ? τ + 1; t]. This allows us to control the precision
by adjusting the window size.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3816335/pdf/kwt133.pdf

541 :
基本コンセプトはこれだろうな。
Therefore, in practice, we apply our method to data consisting of daily counts of onset of symptoms where the infectivity profile ws is approximated by the distribution of the serial interval.
公表された感染者数で計算するために発症から診断/公表までの時間も考慮した点が西浦モデルの優れた点ではないかと感じている。

542 :
>>537
ありがとう。
読んでみます。
でも"a new frame work"っていうならもっと大本のこの道の研究者なら「Rtの推定はコレ」みたいな標準的なものがあるんですかね?
どなたかご存知ないですか?

543 :
>>540
おぉ、こっちがRで採用されてる推定法なんですね。
読んでみます。

544 :
と思ったら>>537と>>540は同じかorz

545 :
結局、これが核心部分
Rt =I t (number of new infections generated at time t) / Σ[s=1,t] I t-s * Ws ( = total infectiousness of infected individuals at time t)
Ws : an infectivity profile given by a probability distribution ws, dependent on time since infection of the case, s, but independent of calendar time, t.

E[I t] = Rt Σ[s=1,t] I t-s * Ws
Σ[s=1,t] I t-s * Wsの部分が畳み込み積分で
Ws ∝ serial interval  ガンマ分布で近似するのが定石らしい。

546 :
>>545
それはそのモデルでのRtの定義ですね、
ではなく例えば4/1〜4/30までのデータx1,x2,‥,x30までが与えられた時、各日付のCIをどう定義してるのかがわからないんです。
統計量Xが一つあってその観測値xが一つある時そのレベルλのレベルλのCIがIであるとは
P(X<x|θ)>(1-λ)/2 & P(X>x|θ)>(1-λ)/2 ⇔ θ∈I
(θがIに入らないときはxが小さすぎてそんな観測値が得られる確率が(1-λ)/2以下になるか、xが大きすぎてそんな事が起こる確率が(1-λ)/2以下になってほとんど起こり得ない)
となりますが、統計量が複数になるとこの大きすぎて、小さすぎてと二つのハズレ領域を考えるだけでは済まなくなります。
ハズレ領域の設定の仕方は色々考えられるけど統計の問題なので自分で俺様流の領域を設定するわけにもいかないのでpublicにはどう処理してるのだろうと。
しかし疫学の教科書わざわざ買うほどには興味もないしw
知ってる人いたら教えてもらおうと。
まだ論文読んでないので書いてあるかもですけど。

547 :
>>546
>523氏が挙げてくれた
実効再生産数とその周辺 に 記述があったが、publicと呼べるのかどうかは門外漢なので知らない。
https://github.com/contactmodel/COVID19-Japan-Reff/blob/master/nishiura_Rt%E4%BC%9A%E8%AD%B0_12May2020.pdf
こんな記述があった
>>
Several non mathematical definitions.
A:
あるカレンダー時刻 t で起こっている 2 次感染数の 1 人あたり平均値
B:
あるカレンダー時刻 t で感染した 1 人がその後の経過で生み出す 2 次感染者数の平均値
C:
罹患率 有病割合比などから推定される 1 人あたりの 2 次感染者数( actual reproduction number とか)
D:
予防接種など流行対策下での 1 人当たりが生み出す 2次感染者数
<<
と定義は一義的ではないみたいだが、
西浦モデルでのR1(t) R2(t)は >540の論文では Rt Rct (cはcohortの頭文字)として言及されているから、まあ、理論疫学者の間ではcommonな定義なんだろうと思う。

548 :
>>546
>4/1〜4/30までのデータx1,x2,‥,x30
x1,...,x30が感染者数なら非負整数で与えられるから、CIを考える必要があるかな?
集計ミスで19人が117人とかあったらしいから、信頼区間を考える必要があるのかもしれないとは思うけど。
確かに、発症日に関してはファジーな部分があるとは思う。
いつから熱がありましたか?味がわからなくなりましたか?と問われても1〜3日位の幅はでるだろう。
RのEpiEstim::estimate_Rをヘルプファイルの実例を使って走らせてみた。
serial intervalの分布をデータから推定させるのに
 infecterの発症日の下限・上限
 infecteeの発症日の下限・上限
を設定する項目が(EL,ER,SL,SR)があった。
このデータに合致する分布関数(ガンマ、ワイブル、対数正規分布が指定可能)のパラメータを算出して計算させているみたい。
西浦モデルではワイブル分布で固定。
潜伏期間にも変動があるから、誰がinfecterで誰がinfecteeかを決定するのも難しいだろうとは思う。
後から発症した人間が感染源というのもありうるし。

549 :
>>548
統計データから真の罹患日を推定する方法もあるようですが
そこではないんです。
しりたいのはCIのハズレ領域の設定です。
1変数の場合、母数θに対して分布Fθが定まっている場合、レベルλに対して[0,1]の部分集合J(λ)が決まって、観測値xに対する信頼区間I(λ,x)は
θ∈I(λ,x)⇔Fθ(x)∈J(λ)
を満たす区間として定まります。
上の方でI(λ)が上下対称に取らないのはなぜという話題がありましたが、コレがその理由です。
J(λ)の方は上下の(1-λ)/2を削って((1-λ)/2,1-(1-λ)/2)をとり、上下対称に“ハズレ領域”をとりますが、それをもとに計算されるI(λ,x)は対称とはならないからです。
問題は観測値が2変数以上ある場合“ハズレ領域”をどう設定するものかわからないのです。
私が大学で勉強した時はそこまでやらなかったので。
普通に考えればI^3の中の立方体の体積がλになるように真ん中にとるんだろうなぁと思うんですけど。

550 :
職場でも最初に発症した人が感染源のように扱われるけど
潜伏期間の分布を考えたら断定はできない。
COVID19の潜伏期間の論文
https://www.nejm.org/doi/full/10.1056/NEJMoa2001316
から、
潜伏期間は対数正規分布で近似できてそのパラメータは
#--- incubation period ---
# from Li et al NEJM 2020
# lognormal mean = 5.2
ln.par1 = 1.434065
ln.par2 = 0.6612
という。

ある人物Xが新型コロナ肺炎に罹患したとする。
行動調査によって発症前にキャバクラに行っており接客したキャバ嬢がX発症の2日後に発症していたことがわかった。
Xがキャバ嬢から移された確率を求めよ。

551 :
>>549
Highest Density Probability Intervalを求めればいいんじゃないの?

552 :
>>551
何ですかそれは?

553 :
>>550
正確にはキャバ嬢がXより先に感染していた確率だな。

554 :
>>552
確率分布が対称じゃないときの信頼区間

555 :
>>554
こんな感じ。https://i.imgur.com/C8jOPlx.jpg

556 :
>>554
ただ、それだとそもそもモードに近いとこをやってます。
信頼区間は密度関数を横に切るのではなく両裾を縦に切ってハズレ部分が1-λになるようにするので少しイメージが違うしきがします。
モードなのかメジアンなのかの違いです。
いずれにせよ、こうやればいいという拡張のための俺様ルールを設定するのはいくらでもできますが、統計の話なのでそんな俺様ルールについて語っても意味ありません。

557 :
>>556
単峰性の場合、信頼区間幅が最小になるのがHighest Density Interval
>550なら
HDI
> HDInterval::hdi(x)[1:2]
lower upper
0.5822687 12.5635525
分位数
> quantile(x,c(0.025,0.975))
2.5% 97.5%
1.148711 15.334698
HDIの方が幅が小さい。

558 :
>>557
???

559 :
ああ、わかった。HDIやCIの意味を誤解してませんか?
HDIでググって調べたらコレ↓ですよ。

https://rindalog.blogspot.com/2015/10/hdi-highest-density-interval.html?m=1

560 :
>>179
単にお勉強ができただけ。
頭が良くないのさ。
自分の頭で物事を考えるってことができない。

561 :
>>181
その通り。
具体的には理学部の数学科と物理学科。
工学部にも時々もの凄いのがいる。

562 :
>>559
いや、Rのパッケージ HDIntervalで計算しているから誤解していないと思う。
内部の処理コードをみると信頼区間幅が最小になるのを最尤法で出しているね。

563 :
>>561
ほんとうに頭のいい人は医学部でなく理学部か工学部に行く。
ほんとうに頭の悪い奴は底辺シリツ医大に行く。
シリツ医大には手先の器用な人もいるが、頭が器用な奴をみたことがない。

564 :
>>550(自答)
#
# 人物dが発症してdelay日後に濃厚接触したキャバ嬢cが発症
# cの感染がdより先行していた確率は?
rm(list=ls())
stancode=
"
data{
real onset_delay;
real ln_par1;
real ln_par2;
}
parameters{
real <lower=0> d_incubation;
real <lower=0> c_incubation;
}
transformed parameters{
real infection_delay = onset_delay + d_incubation - c_incubation;
}
model{
d_incubation ~ lognormal(ln_par1,ln_par2);
c_incubation ~ lognormal(ln_par1,ln_par2);
}
"
model=stan_model(model_code = stancode)
#--- incubation period ---
# from Li et al NEJM 2020
# lognormal mean = 5.2
ln_par1 = 1.434065
ln_par2 = 0.6612
fn.stan <- function(delay, print=FALSE, ...){
dataList=list(onset_delay=delay,ln_par1=ln_par1,ln_par2=ln_par2)
fit=sampling(model,data=dataList, ...)
ms=rstan::extract(fit)
if(print) BEST::plotPost(ms$infection_delay,compVal=0,xlab='infection delay')
mean(ms$infection_delay < 0)
}
fn.stan(2,print=T,iter=5000,warmup=1000)
onset_delays=0:20
y=sapply(onset_delays,fn.stan)
plot(onset_delays,y, ylab='Pr[ Infected Later ])')
2日後の発症だと
> fn.stan(2,print=T,iter=5000,warmup=1000)
[1] 0.2945
3割くらいはあとから発症した方が先に感染していた可能性がある。

565 :
Temporal dynamics in viral shedding and transmissibility of COVID-19
https://www.nature.com/articles/s41591-020-0869-5
のRのコード
https://github.com/ehylau/COVID-19/blob/master/Fig1c_Rscript.R

西浦モデルのコード
https://nbviewer.jupyter.org/github/contactmodel/COVID19-Japan-Reff/blob/master/scripts/C.%20Calculating%20the%20Rt%20in%20Stan.ipynb

から発症間時間(serial interval)の分布を重ねてみた。

https://i.imgur.com/vrnra5F.png

566 :
>>563
一方的で申し訳ないが私立大医学部は金持ちのバカ息子が行くイメージ。

567 :
西浦さんはさんざん適当なことを言って世論を煽ってどう責任を取るのかな?

568 :
>>567
少なくとも西浦氏は算出コードを公開しているだけでも好感が持てる。

569 :
>>566
それは正しい認識。

凄いのはド底辺シリツ医の馬鹿さ加減だよ。
裏口バカと呼ばれるのがよくわかる。

http://imagizer.imageshack.com/img923/2715/RosCsf.jpg
http://i.imgur.com/XBFnEcU.jpg

馬鹿だという自覚がないので救いようがない。

ICU Bookの最終章の冒頭で著者がこう書いている。

In clinical matters, ignorance can be dangerous,
but ignorance of ignorance can be fatal.

「叱られないと勉強しない」の対偶を「勉強すると叱られる」
と答えるのはignorance can be dangerousの範疇だが、

ドヤ顔で
>対偶をとれば意味が逆になる例文。
というのは、まさに
ignorance of ignorance can be fatal.

570 :
西浦モデルの再生算数の事前分布を変化させてグラフにしてみた。
西浦モデルでのデフォルト
https://i.imgur.com/G1wVYgI.png
事前分布を一様分布(0,10)近似の正規分布で近似させた場合
https://i.imgur.com/doS5LEu.png
再生算数の平均0、標準偏差1の場合
https://i.imgur.com/doS5LEu.png

印象としては、西浦モデルは頑強性robustnessのあるモデルとは言えない。
事前分布に大きく影響されるモデルだと思う。

571 :
(url訂正)
西浦モデルの再生算数の事前分布を変化させてグラフにしてみた。
西浦モデルでのデフォルト
https://i.imgur.com/G1wVYgI.png
事前分布を一様分布(0,10)近似の正規分布で近似させた場合
https://i.imgur.com/doS5LEu.png
再生算数の平均0、標準偏差1の場合
https://i.imgur.com/0J1RpDa.png

印象としては、西浦モデルは頑強性robustnessのあるモデルとは言えない。
事前分布に大きく影響されるモデルだと思う。

572 :
>>571
誤解されるのは不本意なの追記するけど、ソースを公開する西浦先生の姿勢は高く評価している。
隠蔽・改竄・破棄する安倍とは大違い。

573 :
だからベイズ推定が統計学の世界でメジャーにならんのだろ?
論理的根拠のない“事前分布”なるもので答えがひょいひょい変わるのでは社会的な影響が大きい防疫政策の決定には使えない。
普通の統計学の検定なら理論的に根拠のある数字、推論しか使わない。
計算は大変だけど。

574 :
>>573
成人の平均身長を1〜2mに事前分布にするのは納得できるし、
生まれる子供が男子である確率は0.4〜0.6というのも俺は納得できる。
PCRの感度が30〜70%として計算するのも納得できるからその設定で階層ベイズモデルを組むことには異論はないな。

575 :
こういう問題
あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間(信頼区間)を求めよ。
をベイズで解くときは、
60台〜100台である確率を一様分布として処理しているから
これに異論があるのは理解できるけど
日本人成人の平均身長を推定に1〜2mを事前分布に想定するのには俺は異論はないね。
一様分布ではなくてガンマ分布にすべきだというのは議論になるとは思うけど。

576 :
>>573
ベイズ信奉者から、ベイズ論者を採用したGAFA(Google等)が成長したと教わった。
迷惑メールのフィルタリングとか雑音の除去とか日常的に役立っているというぞ。

577 :
>普通の統計学の検定なら理論的に根拠のある数字、推論しか使わない。
>計算は大変だけど。
普通の統計学こそ、無理やり既知の分布に当てはめようとするんだよね。
MCMCの方の方が応用が広い。

578 :
プロ野球選手の打率は?と問われたら選手次第で異なる、と誰でもわかるのに
確定不能の平均値が存在していると妄想して計算を始めるのが古典主義統計。
つまり、値は存在するけど確定できないという信仰の世界。

昨今の新コロナでいえば、PCRの検査の感度・特異度が一定と考えるのが古典主義。
プロ野球選手の打率と同じでそんなのは場面場面で変化するよ、と考えて計算するのがベイズ。

579 :
>>576
もちろん推定の有力な方法であるにせよ、元の仮定に何の根拠もないわけだからそれから得られる結論には論理的根拠はない、ないが、数学的に伝統的な手法で与えるた結論と大差ない事がなんらかの保証があるなら、有力になる。
それが論理的に“大差ない結論が得られる”事が示されてるなら単なる計算手法に過ぎないし、示されていなくても経験的に“よい結果ぎ得られる事が多い”ならそのジャンルではそこそこ信頼するに値するんだろう。
しかしなんらかのモデルでは答えが一意に定まらず、事前分布の選び方により大きく答えが違ってしまう場合があっても不思議はないし、そのような場合ではやはり、“ではどう計算するのが正しいかのか”の論証を待たなければ信頼するのは危険になる。

580 :
古典的(頻度主義)統計信者って、この計算はどうやるんだ?
俺は乱数発生させて計算できるけど、
そればベイズなのかどうかは知らんが、条件付き確率なのでベイズなんだろうな。
(開業医スレに投稿したけど、回答できるやつは0)

COVID19の潜伏期間の論文

https://www.nejm.org/doi/full/10.1056/NEJMoa2001316

結論は
#--- incubation period ---
# from Li et al NEJM 2020
# lognormal mean = 5.2
ln.par1 = 1.434065
ln.par2 = 0.6612


ある開業医が新型コロナ肺炎に罹患したとする。
行動調査によって発症前にキャバクラに行っており接客したキャバ嬢が開業医発症の2日後に発症していたことがわかった。
キャバ嬢は開業医から移されたと主張して1億円の賠償を求めている。
潜伏期間には幅がありキャバ嬢から移された可能性もあると主張してその確率を計算して賠償金を値切りたい。
いくら値切れるか計算せよ。

581 :
>>580
潜伏期間なんて数学的に決定できるハズないやん?
数学がやるのは例えば感染日と実際発症した日が確定できるような症例がある程度以上あって、それが従うと病理学的に信頼できる分布の族があって、その中からデータに最も“沿う”分布を選び出すことしかできない。
それは何件も実際の患者のウイルス量の統計をとったり、ウイルスが体内でどのように増えていくのかの病理学的研究データがあって初めて可能になる。

582 :
>>571
よく理解できていないので質問ですけど
事前分布とは具体的に何の分布ですか?
基本再生算数の推定値の分布?
実行再生算数の推定値の分布?
実行再生算数の事前分布は基本再生算数の分布としたらいいのかなと思いますけど

583 :
まぁこのスレは用語がめちゃくちゃだからなぁ。

584 :
モデル前提での計算できないアホ発見!

585 :
潜伏期は病原体と罹患者のパワーバランスで決まるだろうから
定数でなくてばらつきはあると思うね。

586 :
>>572
>隠蔽・改竄・破棄する安倍とは大違い。
安倍ちゃんがやってるわけじゃないだろ。
指示もされてねーのに、官僚がやってんだよ。
そんなこともわからんようでは、あんたの解析もあてにならんな。

587 :
>>582
西浦のソースだと Rt ~ normal(2.4 ,2)

588 :
>>586
安倍じゃなければ官僚もまともだったんじゃねえの?
安倍らの集団に組み込まれると東大卒も馬鹿になるようだぞ。

589 :
>>581
その通り。
結局、そういう本質的なデータや理論抜きでは、ベイズ推定やったって
限界があるし、結果の説得力もない。
まあ、適用限界ってものがあるのは何やっても同じだけど。

590 :
>>588
>安倍らの集団に組み込まれると東大卒も馬鹿になるようだぞ。

統計的に確認してみれば?ベイズ推定でもっともらしい結果が出るんじゃね?w

591 :
>>590
今は2/2かなw
加藤と西村

592 :
>>590
馬鹿になる事後確率分布はこんな結果になりました。
https://i.imgur.com/ZhpWJdo.png

593 :
95% CI は 0.5005265 1

594 :
>>592
ちなみに事前分布は一様分布に設定。

595 :
結局、統計ってこういう道楽なんだよなぁ。

596 :
>>581
いやウイルスの振る舞いも素粒子の振る舞いもばらつきがあるんじゃないの?
存在も位置も確率的にしかわからない、という議論になると思う。

597 :
>>571
最初の2つでは頑強と言えそう。
平均身長のたとえだと
事前分布に1〜2mを選んでも1〜10mを選んでも同様の結果だが、0〜1mを選ぶと現実離れした結果が返ってくるという感じだな。

598 :
次のおもちゃ
しばらく、これで遊べそう。
臨床所見からロジスティック回帰でCOVID19の確率を出すペーパーがでるだろうなと思っていた。
Real-time tracking of self-reported symptoms to predict potential COVID-19
https://www.nature.com/articles/s41591-020-0916-2

599 :
>>591
馬鹿の定義は?単なるお前の主観じゃねーかw
ベイズ統計にのめり込むと馬鹿になる事後確率分布でも求めてろ。

600 :
こういうのも興味ある人多い?感染してからの日数とPCR陰性になる確率の関係。
https://twitter.com/AdamJKucharski/status/1260839061318705152
(deleted an unsolicited ad)

601 :
各国のロックダウンの度合いを数値化してるところ。色々と分析に使えるかも。
https://ourworldindata.org/grapher/covid-stringency-index?tab=chart&year=2020-05-07&country=JPN+NOR+SWE+USA

602 :
>>599
あれ3/3になったのか。
それだと、95%CrIは0.5559329 1
事前分布にはJeffereysで計算

603 :
>>600
ありがとうございます。
おねーちゃんと濃厚接触したあとは、何日目に検査したらいいかの参考になりました。

604 :
>>600
論文を検索してみた、この論文からのグラフのよう。
Variation in False-Negative Rate of Reverse Transcriptase PolymeraseChain Reaction?Based SARS-CoV-2 Tests by Time Since Exposure
https://www.acpjournals.org/doi/pdf/10.7326/M20-1495

605 :
Measurements: A Bayesian hierarchical model was fitted to estimate
the false-negative rate by day since exposure and symptom
onset.
とのことで、
こんな、ありふれたベイズ階層モデル
x[j,t] ~ Binomial(n[j,t],p[j,t])
logit(p[j,t]) = βj + β*1log(t) + β2*log(t)^2 + β3*(t)^3
βj ~ Normal(β0,σ2)

606 :
Rとstanのコードが公表されているので、遊べそう。
https://github.com/HopkinsIDD/covidRTPCR

607 :
>>602
1/1だよ。あんただけw

608 :
>>607
信頼区間出せない馬鹿発見!

609 :
このスレででてる信頼区間なんかほとんど統計の検定試験では出てこない俺様信頼区間だけどな。
信頼区間の定義ちゃんと言える奴の方が少ないだろ。

610 :
1/1でも信頼区間を出せちゃうのがベイズ

611 :
>>609
ベイズでは信用区間と呼んで信頼区間と区別する人もいるね。
CIでなくてCrIという記載も目にする。

612 :
ベイズではconfidence interval でなくてcredibility interval

613 :
>>612
あんたの独占スレになったな。1/1達成、おめでとうw

614 :
bootstrap使うと大抵の数値の信頼区間は出せるけど1/1には無理だな。

615 :
JAGSを使って1/1のときの95% Credibility Intervalを求めるスクリプト
事前分布はJeffereys
library(rjags)
data=list(x=1,n=1)
cat('
model{
x ~ dbin(p,n) # binomial distribution
p ~ dbeta(0.5,0.5) # Jeffereys prior
}',file='tmp.txt')
jagsModel=jags.model('tmp.txt',data=data,n.chains=4)
update(jagsModel)
codaSamples=coda.samples(jagsModel,n.iter=1e5,var='p')
gelman.plot(codaSamples) # 収束を確認
js=as.data.frame(as.matrix(codaSamples))
HDInterval::hdi(js$p) # 95% Highest Densty Interval
# 既存のパッケージで確認。
HDInterval::hdi(qbeta,shape1=0.5+1,shape2=0.5)
binom::binom.bayes(1,1)

616 :
エクセルのツールをCDCが公開しているね。

https://www.cdc.gov/coronavirus/2019-ncov/hcp/COVIDSurge.html
COVID-19Surge is a spreadsheet-based tool that hospital administrators
and public health officials can use to estimate the surge in demand for
hospital-based services during the COVID-19 pandemic. A user of
COVID-19Surge can produce estimates of the number of COVID-19 patients
that need to be hospitalized, the number requiring ICU care, and the number
requiring ventilator support. The user can then compare those estimates
with hospital capacity, using either existing capacity or estimates of expanded capacity.
With COVID-19Surge, users define the population in the hospital “catchment area” or local jurisdiction.
The user also enters the number of cases to date, and the available hospital resources (non-ICU beds, ICU beds, and mechanical ventilators).
Users can assess up to three community mitigation strategies simultaneously and
compare the impacts on hospital resources versus a “no intervention” scenario.

617 :
@kazu_fujisawa
西浦先生が一番の功労者だというのは僕も同意見だな。あと、細かいこと言うと、
あの限られたデータしかない中で、8割削減なら1ヶ月で収束、接触6-7割削減なら2ヶ月で収束、という予測精度もお見事としか言いようがない。

618 :
アレは単に再生産数の推定値から出しただけやろ。

619 :
わかった後からだと
「簡単じゃん!」とか言えるけど
先んじて発表した西浦先生は
すごくまともな研究者だと思います。

620 :
中国・武漢全域で行われた新型コロナウイルスのPCR検査で、189人が無症状の感染者と確認されました。
 武漢では35日ぶりに新たな感染者が確認されたため、14日から「10日間大戦争」と銘打ち、延べ900万人にPCR検査を行いました。中国メディアによりますと、そのうち657万人の結果が出て、189人が無症状の感染者でした。
10万人のうち2.87人が無症状感染者の計算になるとしています。中国のSNSには、検査人数のあまりの多さに看護師が泣き叫ぶ動画が投稿されていて、
一日の検査能力である最大10万件を大幅に超えた検査の精度を疑問視する声もあります。10日間ですべての検査が終わらなかったので、検査は26日午後も続いています。
[2020/05/26 13:22]
https://news.tv-asahi.co.jp/news_international/articles/000184795.html
https://news.tv-asahi.co.jp/articles_img/000184795_640.jpg

621 :
189/6570000は
有病率、感度、特異度の事前分布はどうするかな?

有病率:一様分布
感度:最頻値0.6標準偏差0.1のベータ分布
特異度:最頻値0.9標準偏差0.05のベータ分布
として検査陽性数は有病率*感度+(1−有病率)*(1−特異度)の確率に従う二項分布
でいいか?

622 :
>>618
再生産数から収束に至るまでの期間の計算法って公開されてたっけ?

623 :
>>622
それは簡単に計算できるだろ?逆は難しくて、それが西浦先生の功績だと思うけど。

624 :
>>622
いっぱんに再生産数Rの伝染病が収束を始める免疫の比率は1-1/R。
R=2.5なら免疫獲得者が1-1/2.5=60%になれば拡大はしない。
なので60%になれば平衡状態になり、最低でもそれ以上減らさないとダメなのは明らか。
集団免疫の話読んだ事ある人間なら常識。
オレみにわかではあるが。
感染率が70%減、80%減になったとき、どれくらいの速度で落ちていくかもsirでだいたいわかる。

625 :
え? >>617って皮肉じゃないの?w

西浦さんの8割削減って言葉がメディアに乗るころには拡大再生産数は
1を切ってたんだよね(4/1頃)。拡大再生産数が2を越えて高止まりして
たのは3/15-3/25頃で、そこから1週間ほどで急落して1を切ってんだよね。
東京、大阪で自粛が叫ばれ、危機感がつのってたころだ。

626 :
×拡大再生産数
○実効再生産数

627 :
>>625
それは今でも良くわかってないだろ。
何せ4月の初め頃って検査リソースの限界で東京とか陽性率が8割に近かった、もうほとんど陽性確定の人しか検査してなかった頃。
この“認知されたケース(confirmed case”となったケースのピークと実際の感染者数のピークは当然ずれてる。
実際の東京の罹患者は8万人を超えてるらしいので、相当数が検査されずに見過ごされてる。
おそらく見過ごされた多くのケースは陽性者数がピークを迎えた(陽性率が8割ぐらいあった)4/15前後に発症したケースだろうけど、それは明らかにconfirmed casesのピークより遅い。

628 :
>>620
5〜10人の検体を混ぜて検査して、陽性が出たロットだけ全部検査してるらしい。
https://www.sankei.com/smp/photo/daily/news/200524/dly2005240012-s.html
陽性はほとんどいないから、1日に50〜100万人分検査できる。

629 :
>>627
4月の初め頃の検査対象はその1週間前に感染してんだから、
まさに専門家委員会が示したconfirmed casesの感染者数の
ピークの頃だよ。

630 :
>>629
confermed casesのピークはもっと遅い4/15前後だよ。
その前と後に二つの最大のピークがある。
いずれにせよ、検査拒否の陽性率の最大がそのあたりにあって、どのくらいの見逃しがどのくらいあったのか科学的に推し量る方法などない。
その当時どんなコールセンターへの相談があり、どの程度怪しいケースを弾いていたのかなどコールセンターの資料をツブサに調べていくしかない。
そんなもんここで議論するような話ではない永遠の水かけ論にしかならない。

631 :
>>624
収束する時期は再生産数だけじゃでは計算できないのではという疑問。

632 :
>>628
有病率を10万分の3として、何人の検体を混ぜるのが一番効率がいいんだろ?
10万を3でわった3万3千人くらいかな?

633 :
>>632
n/k+n/k(1-(1-p)^k)kを最小にするkだから、k=2Productlog(-0.5√-log(1-p))/log(1-p)だね。
p=3/100000を代入してk=183。
ちなみにk=10となるのはp=0.0111の時。そんなに陽性率が高いと見積もったわけでは無いだろうから、10ぐらいが混ぜて検査の限界なのだろう。

もっと究極的に検査回数を少なくすると>>419 の方法に行き着くと思う。

634 :
>>633
早速のレスありがとうございました。

635 :
>>630
だ、か、ら、検査結果の判明した日付では4/15頃がピークだけど、検査の
待ち時間や発症までの潜伏期間を含めると、感染したのはその2週間以上
前になるっていうのが、専門家委員会の見積もり。
https://www.mhlw.go.jp/content/10900000/000630718.pdf

636 :
>>635
confirmed cases の罹患→発症の平均時間と
all cases の罹患→発症の平均時間にはズレが出る。
confirmed cases のそれが2週間以上でそのピークが4月より前でも
all cases のそれはもっと小さいのでそのピークはもっと後ろになる。

637 :
具体例で実験してみればいい。
山がある曲線かく。
山をy軸方向に0.7倍したもの(軽症段階で相談した人)と0.3倍したもの(重篤化して認知されたもの)を作り、後者はx軸反転する。
前者は右に1週間、後者は左手に一週間ずらす。
この二つの曲線の差がその日に検査要請がかかった件数。
しかし検査リソースには限界があるのでx軸より下の重症者は全部検査されたとして、そこから一定幅より上の部分は検査拒否されたと考える、つまりy軸より下の部分を検査リソースの限界分だけ上に平行移動したものより下が実際に検査された軽症者の人数。
もとまった検査された軽症者の曲線を改めて一週間前にずらし、重症者のカステラの曲線と足してみる、コレがconfirmed casesに限った推定発症日の曲線。
元の山とできた山のピーク比べてみる。
ズレてるから。

638 :
>>636
だ、か、ら、>>627で検査が滞って隠れ感染者が相対的に増えてたと
君がいう4月上旬の検査対象は3月下旬の感染者なんだから、全感染
者数のピーク時期はconfirmed casesの4/1頃のピークの前にこそなれ、
後ろにはならんでしょ?

639 :
>>637
なるよ。
>>635の実験やってみた?
必ずconfirmed casesのピークはall casesのピークより前にズレる。
つまりall casesのピークはconfirmed casesのピークより後ろにズレる。

640 :
>>637
前提に問題がありすぎ。検査数は逐次増えてて、感染者のピーク前後では
ほぼ検査数に比例して陽性者数も増えてる(陽性率は十数%前後で大きな
変化はない)。キャパ一定で推移してるわけではない。

641 :
>>640
前にも書いたけどその話をしだすとココでは絶対答えが出ない水掛け論にしかならない。
結局症状が出てても検査を断られる4月頭時点での検査体制では、実際どれくらいのズレが発生したのかはハッキリとは言えない。
それは後年の調査である程度はわかるかもしれないけど。
何せ1日数万件もあった相談と検査拒否の実態を掴むのは容易ではない。
いずれにせよ、実際の感染のピークが
confirmed casesのピーク日
-conformed cases内の(確定日-推定罹患日)の平均
より後ろにズレるのは確実。
何故ならどの程度の検査拒否があったにせよ、この相談日-罹患日の値が小さいグループ(症状の軽いグループ)の方が検査拒否された割合が有意に高いので。
まぁ実際confirmed casesのピーク日-(xxx)
のxxxに入れるべき数値は2週間よりはずっと小さい。

642 :
職場で最初に発症した人が感染源と決めつけてはならないことを
数学的には確認。

あるクリニックで院長が新コロナを発症。
翌日2人の看護師が発症、その次の日に3人の看護師が発症。
各人が最初に感染していた確率を計算せよ。

こういう計算ができると、誰が移したとか責めたりせずにすむ。
(春節ウェルカムした安倍が悪い、で職員の心が一つになるw

計算に必要な数値は
#--- incubation period ---
# http://www.nejm.org/doi/full/10.1056/NEJMoa2001316
# Li et al NEJM 2020
# 潜伏期間は対数正規分布でパラメータは
ln_par1 = 1.434065
ln_par2 = 0.6612

643 :
RとStanでやってみた。
> data.frame(p=round(sapply(1:n,fi),2))
p
1 0.26
2 0.18
3 0.18
4 0.13
5 0.13
6 0.13
コードはここ
https://egg.2ch.sc/test/read.cgi/hosp/1583407025/199

644 :
>>632
ウイルスを検出できる最低限度の濃度とかあるんじゃないかな
制約付きで何人分を混ぜるかを最大化する問題になると思う

645 :
>>641
しつこいな。どこからそんな式が出てくるんだよw
現状で分かってる事実から推測して全感染者数の
ピークが後ろにくる理由はないよ。むしろ前にくるほうが自然。

646 :
>>642
発症前から感染力があり、潜伏期間にも幅があるんだから、
その情報だけでだれが感染源かなんて断定できるわけない
のは当たり前だろ。それでも最初の発症者が一番怪しい
ってことに変わりはない。
常識で考えろ。

647 :
>>645
>>637の実験やってみた?

648 :
>>646
院長と3日めの発症した看護師とどれくらい確率が違うかは
常識では出せないだろ。

こういう計算には数値化が必要。

ある開業医が新型コロナ肺炎に罹患したとする。
行動調査によって発症前にキャバクラに行っており接客したキャバ嬢が開業医発症の2日後に発症していたことがわかった。
キャバ嬢は開業医から移されたと主張して1億円の賠償を求めている。
潜伏期間には幅がありキャバ嬢から移された可能性もあると主張してその確率を計算して賠償金を値切りたい。
いくら値切れるか計算せよ。

649 :
>>642
Mathematicaだと
cond = Distributed[{a, b, c, d, e, f},ProductDistribution[{LogNormalDistribution[1.434065, 0.6612], 6}]];
NProbability[a > Max[b - 1, c - 1, d - 2, e - 2, f - 2], cond]
NProbability[b - 1 > Max[a, c - 1, d - 2, e - 2, f - 2], cond]
NProbability[d - 2 > Max[a, b - 1, c - 1, e - 2, f - 2], cond]
>0.257392
>0.178947
>0.128264

650 :
>>649
レスありがとうございます。
有効数字2桁で同じ結果なので自分のコードの検証になりました。

651 :
中国湖北省武漢市(人口約1100万人)が今月中旬から全市民を対象に実施していたPCR検査(遺伝子検査)がおおむね終了した。
地元紙「湖北日報」(電子版)によると、直近に検査を済ませた人や乳児を除く900万人以上から検体を採取。
武漢では1日に100万人以上の検査が可能で、24日までに約650万人の検査が終わり、無症状感染者が218人見つかった。
事前分布に有病率は一様分布、感度は40-60%、特異度は90−100%のベータ分布を設定してStanでMCMCしてみた。
mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
spc 0.999977 0.000000 0.000008 0.999965 0.999976 0.999994 12593 1.00001
sen 0.452612 0.002116 0.220226 0.073638 0.444200 0.871391 10834 1.00000
prev 0.000041 0.000001 0.000118 0.000001 0.000023 0.000183 8206 1.00004
p 0.000034 0.000000 0.000002 0.000030 0.000034 0.000039 36412 0.99998
spc:特異度、sen:感度  prev:有病率 p:陽性率
900万人での陽性者数の予想
最頻値 306.15
95%信頼区間
lower upper
266.46 346.70
1100万人のうちの有病者数予想
> summary(ms$prev*11e6) ; MODE(ms$prev*11e6)[1] ; hdi(ms$prev*11e6)[1:2]
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 108 251 449 483 137796
x
179.24
lower upper
0.020213 1360.523395

652 :
岩田健太郎 Kentaro Iwata
@georgebest1969
日本が第一波をかなりうまく乗り切ろうとしているのだけど、最大の功労者の一人は西浦博先生だよ。それは絶対に間違いない。
午後5:44 2020年5月20日

653 :
>>652
俺は志村けんとフィリピンパブ親父だと思う。

654 :
政府:「接触8割減を目指して下さい。」
マスコミ:「今朝の○○駅の映像をご覧下さい。人出8割減にはほど遠いですね...」
政府広報:
「接触8割減には、(1-x)^2=1-0.8 → x=0.552786 だから 人出55%減でいいんだけど、
 馬○なマスコミが、勝手に目標を上げてくれてる。あえて指摘する必要ないよね...」

655 :
>>653
藤浪も仲間に入れてやって。
岡江久美子も5月10日前後の感染急減には貢献したかも。

しかし、岩田健太郎に擁護されてもむしろ逆効果でお気の毒>8割おじさん

656 :
>>648
賠償金ゼロまで値切れる。
俺じゃない可能性が十分あるのならそれでいい。
期待値で賠償金を計算されちゃかなわん。

657 :
>>656
期待値を求めよ、では食いつきが悪いと思って金の問題にアレンジして開業医スレに書いてみたんだが、
答られる開業医は0だったよ。 

658 :
>>655
石田と志村の順が逆だったら、自粛は捗らなかったのではと思うな。

659 :
潜伏期間が従うとされる対数正規分布(パラメータは、ln_par1 = 1.434065 ln_par2 = 0.6612)で乱数発生させて
その差が2以上になる割合を求めれば数値解は出せるけど、これって解析解は可能だのだろうか?
パラメータが同じ対数正規分布の差の分布は数式で表せるのだろうか?引き算したら0になってしまう気がする。

660 :
>>654
感染の起こりうる濃厚接触するときの人数って期待値はどれくらいで、どんな分布に従うんだろうね?

661 :
>>659(自己解決)


mu = 1.434065
sg = 0.6612
pdf1 <- function(x) dlnorm(x,mu,sg)
pdf2 <- function(y) dlnorm(y,mu,sg)
f <- function(x,y) pdf1(x+y)*pdf2(y)
vf=Vectorize(f,vectorize.args = 'y')
pdf <- function(x) integrate(function(y) vf(x,y),-Inf,Inf)$value
pdf=Vectorize(pdf)
curve(pdf(x),-30,30)

662 :
COVID19関連での分布とそのパラメータ

Distributional fits to key COVID-19 distributions.

https://i.imgur.com/SJ6QS3b.png

https://www.medrxiv.org/content/10.1101/2020.03.03.20028423v3.full.pdf

663 :
学校閉鎖の功罪

School closure and management practices during coronavirus outbreaks including COVID-19: a rapid systematic review

https://www.thelancet.com/pdfs/journals/lanchi/PIIS2352-4642(20)30095-X.pdf

664 :
>>654
西浦博教授が新しい試算を発表されたようです。
1影のたけし軍団 ★2020/06/03(水) 18:41:19.54ID:v4jJ+LDc9
 西浦博教授らは、海外から新型コロナウイルスの感染者が入国すると、
国内で再び大規模な流行が起きるとする試算をまとめた。
 1日当たり10人の場合、3カ月以内に再流行する確率は98.7%に達すると・・・・・・・
【コロナ】 西浦博教授、試算・・・海外から1日10人入国で再流行 [影のたけし軍団★]
https://asahi.2ch.sc/test/read.cgi/newsplus/1591177279/

665 :
>>664
この試算コードは公表されている?

666 :
m3(医療関係者のサイト?)に割と詳しく載ってるらしい

667 :
>>666
みてきた。未知のパラメータが多すぎるのではという印象。

(3)どうやって計算したか
 90日間の入国者総数をN人とし、感染率(感染している者の割合)をp、停留やPCRの効果(すり抜ける感染者の相対的減少率)をeとします。
 そのとき、侵入者は
n = (1-e)pN
と計算されます。
上述の1人の感染者が侵入したときの「絶滅確率」をqとし、n人が独立して入国してきたとすると、
分岐過程に基づく大規模流行の確率Xは以下で与えられます。
X = 1 - q^n = 1 - q^((1-e)pN)

668 :
Rt のときと違ってあまりにも簡単な式でびっくりした。

669 :
みほちゃんというアカウントの物理学者がTwitterで批判してる 正しい気がするんだが、どうなん?

670 :
>>667
グラフにしてみた。

https://i.imgur.com/0btaWhN.png

671 :
https://webcache.googleusercontent.com/search?q=cache:QYTS2fG22goJ:https://www.m3.com/open/iryoIshin/article/780507/+&cd=18&hl=ja&ct=clnk&gl=jp
m3の中味

https://togetter.com/li/1536604
ツイートまとめ

672 :
ここ数日流れている、7割の人は誰にもうつさないの元論文。
https://www.researchsquare.com/article/rs-29548/v1
figure2Bが個人の再生産数の分布で、負の二項分布で近似可

673 :
>>672
abstract読んだだけではわからんかった。
どういうことか詳しくお願い。
ってか、そういうのも考慮にいれて実効再生産数の値が決まるんでは?

674 :
>>673
これ、まさに>>667あたりの議論に関係してくるんだよ。実効再生産数が1を超えていても、スーパースプレッダーが拡散していてその値なら、運が良ければ大規模拡散は無い。逆に全員が均等に1人以上にうつしてしていたら、確実に大規模拡散につながる。
拡散能力の個人差を決めるのが、論文で言うkだと思う。

675 :
>>674
拡散能力は何で決まるかわかっている?
個人の行動で決まるなら行動変容は必要だろう
マスクや咳エチケット、消毒、物理的距離や
換気など

676 :
>>675
だから、それらがいい加減でRt>1でも拡散しない確率があるという話。帰国者のように少数が散発的に爆撃して行く場合には、Rt値だけでは判断できないわけだ。
東京も、日々の感染者数が1人とか2人になってくるとこの辺りの話が効いてくるだろうね。

677 :
そうそう。西浦先生の >>671 で面白いのは、帰国者が大規模感染を起こす云々より、むしろ再生産数が1を超えているのに感染が止まる確率があることなんだよね。

678 :
>>674
よくわかんないんだけど、感染者数が全体で数十人レベルなら隔離対策で
全部のスーパースプレッダーをたまたま捕縛できれば確かに終息できる
だろうけど、数百人レベルに拡がってそういうことができなくなれば、
一定数以上のスーパースプレッダーは常に残ることになって、結局感染
拡大は防げないのでは?(SS1人当たりの再生算数が4だと、3割がSSだと
して、実効再生産数は単純に0.3×4=1.2とかにならんの?)

679 :
>>677
実行再生算数は過去のデータを反映した値で
Rt>1でも患者を全員隔離できたら収束可能ではあるから
矛盾はしないと思う
それを実現できる可能性は低いだろうけど

680 :
>>678
そう。だから>>671の(4)の表で入国者数×感染率が数百単位の場合は大流行確率がほぼ100%になってる。あくまでも少人数しか感染していない場合の話。

>>679
隔離の話ではなく、感染力のバラツキに起因する感染消滅。サイトに載ってる考え方でシミュレーションを回して自然消滅確率q=0.9226は再現できたよ。

681 :
>>672
理論的根拠があって負の二項分布を選んだのかと思って読んでみたらRであてはまりのよい分布を探したみたい。

Calculation of serial interval and empirical offspring distribution

We calculated the median serial interval as the difference between the symptom onset dates of each infector-infectee pair, excluding asymptomatic cases, and fitted normal, lognormal, gamma and Weibull distributions using the R package “fitdistrplus" and maximum-likelihood methods, excluding eight non-positive data points for the latter three distributions.

We generated the empirical offspring distribution from the observed number of secondary cases per individual infector and similarly fit negative binomial, geometric and Poisson distributions as before.

682 :
>>681
関連論文をいくつか読んでみたのだが、個人ごとのRtに注目する研究では、その違いに負の二項分布が使われるようだ。
バラツキを表すdispersion parameter のk(西浦が0.1と置いてるのはこれ)を成功回数、1/(1+Rt/k)を成功確率とした負の二項分布をどの論文でも使っていて、これで分布の平均はRtになる。
本来整数であるべき成功回数を実数としているのだから、負の二項分布である意味はなく本当に当てはめただけなのだろう。

683 :
一人を感染させる時間=serial interval(SI)
Rt人感染させるまでに要する時間は
形状パラメータ=Rt
尺度パラメータ=SI
のガンマ分布gamma(Rt, SI)に従うはず、
λがこのガンマ分布に従う変数として平均λのポアソン分布pois(λ)を考えれば負の二項分布になるのだけど
これはRtの分布じゃなくてRt人感染させる時間の分布だよなぁ、と考えたりしたけど

理詰めじゃなくて、AICが最も小さくなる既知の分布を探したってことなのだろうな。

684 :
ソフトバンクグループは、社員や医療関係者らを対象に独自に行った新型コロナウイルスの抗体検査の結果を速報値として公表しました。4万4000人余りのうち、0.43%に当たる191人が陽性だったということです。

ソフトバンクグループは、先月中旬から今月8日までに、社員や取引先、それに医療機関の関係者ら4万4066人を対象に新型コロナウイルスに感染したことがあるかを調べる抗体検査を行い、結果を公表しました。

それによりますと、191人、0.43%が陽性だったということです。

このうち、医療機関の関係者は5850人のうち105人、1.79%が陽性、社員や取引先の関係者は3万8216人のうち86人、0.23%が陽性でした。

以下全文はソース先で

2020年6月9日 23時20分
https://www3.nhk.or.jp/news/html/20200609/k10012464781000.html


東大の7/1000の0.7%に近い感じだな。


一方、ロシアでは

ロシア・モスクワで保健当局が市民を対象に新型コロナウイルスの抗体検査を行ったところ、
およそ6人に1人にあたる17.4%が陽性だったことがわかりました。

発表によりますと、モスクワの保健当局は11日までの2週間で市民16万5千人を対象に抗体検査を実施しました。
このうち、およそ6人に1人にあたる17.4%の人に抗体があることが判明したということです。

先月4日から21日まで行われた前回の抗体検査では12.5%の人から抗体が見つかっていて、
前回から今回にかけて、陽性者がおよそ5ポイント増えた形です。

ロシアの感染者は11日、50万人を超えましたが、モスクワでは感染が抑制されてきているとして、
9日には外出制限が解除されています。
https://www.news24.jp/articles/2020/06/12/10660268.html

685 :
>>684
特異度がわかんないけど、少なくとも99.8%くらいはありそうだな。
したがって、医療関係者が2%足らず陽性ってのは本物っぽい。
だから、どうしたって感じだけどね。

686 :
>>685
まだ未感染の人の割合が多いから集団免疫ができていなくて感染爆発のリスクが比較的高い
予防対策が引き続き必要

687 :
中和抗体の存在が実証されるまでは集団免疫神話だと思っている。

688 :
>>686
感染者の多い東京に限っても抗体陽性率は0.6%以下だってことは一ヶ月前から
分かってた話なんだから、今回0.23%以下と出たからといって、本質的になんも
かわらんでしょ。しいていえば、致死率の下限が上がったってことくらいか。
感染者が0.23%以下だとすれば、現在の死者数はやく千人なので、致死率は0.4%以上
となる。

689 :
外来患者0.5%に抗体、山形大 付属病院の1009人を検査

山形大(山形市)は15日、医学部付属病院の外来患者1009人について新型コロナウイルスの抗体検査をした結果、0.5%に当たる5人が陽性だったと発表した。山形県内でPCR検査により感染確認されたのが69人なのに対し、統計学上は県民約107万人のうち、670〜1万人が感染した経験があると推計されるという。

 大学によると、1〜4日に外来で受診した人の血液を、検査キットより精度の高い機器と試薬で調べた。ただ検査数が千人余りに限られており、推計される陽性率は0.063〜0.937%にばらつくという。

690 :
>>689
この95%信頼区間は正規分布での近似で計算しているな。

> p=5/1009
> q=1-p
> n=1009
> p-qnorm(0.975)*sqrt(p*q/n)
[1] 0.0006226557
> p+qnorm(0.975)*sqrt(p*q/n)
[1] 0.009288147

691 :
各種の95%信頼区間

> binom.ci(5,1009)
method x n mean lower upper
1 agresti-coull 5 1009 0.004955401 0.0017596471 0.011906321
2 asymptotic 5 1009 0.004955401 0.0006226557 0.009288147
3 bayes 5 1009 0.005445545 0.0014689159 0.010037024
4 cloglog 5 1009 0.004955401 0.0019155107 0.011096185
5 exact 5 1009 0.004955401 0.0016109041 0.011526082
6 logit 5 1009 0.004955401 0.0020640649 0.011848825
7 probit 5 1009 0.004955401 0.0019822732 0.011396609
8 profile 5 1009 0.004955401 0.0017805162 0.010620264
9 lrt 5 1009 0.004955401 0.0017936701 0.010616984
10 prop.test 5 1009 0.004955401 0.0018257774 0.012233747
11 wilson 5 1009 0.004955401 0.0021184531 0.011547515

692 :
厚労省がやってた抗体検査も結果出た。

https://www.mhlw.go.jp/content/10906000/000640184.pdf

693 :
>>692
ロッシェとアボトットという業界では一流ブランドなのに一致率が低いのに驚き

TYO=matrix(c(2,4,2,1963),2,b=T)
> OSA=matrix(c(5,5,11,2949),2,b=T)
> MYA=matrix(c(1,6,2,3000),2,b=T)
> (dat=TYO+OSA+MYA)
[,1] [,2]
[1,] 8 15
[2,] 15 7912
> library('epiR')
> epi.kappa(dat)
$prop.agree
obs exp
1 0.9962264 0.9942306

$pindex
est se lower upper
1 -0.9942138 0.0008513625 -0.9958825 -0.9925452

$bindex
est se lower upper
1 0 0.0008518883 -0.00166967 0.00166967

$pabak
est lower upper
1 0.9924528 0.9892346 0.9949051

$kappa
est se lower upper
1 0.3459338 0.01121544 0.323952 0.3679157

$z
test.statistic p.value
1 30.84442 6.655295e-209

$mcnemar
test.statistic df p.value
1 0 1 1

694 :
ロシュとアボットのキットのカッパ値をMCMCして分布をだしてみた。

https://i.imgur.com/VosPLlv.png

695 :
>>694
これだけ一致率が低いデータで東京大阪宮城で陽性率に有意差があるを検定することに意味があるんだろうか?

696 :
>>692
多重比較になるけど、補正なしでも都市間の有意差はでないね。
むしろ、有名メーカーの検査キットの不一致の方が意外だった。

> positives=c(TYO=2,OSA=5,MYA=1)
> subjects =c(TYO=1971,OSA=2970,MYA=3009)
> pairwise.prop.test(positives,subjects,p.adjust.method = 'none')

Pairwise comparisons using Pairwise comparison of proportions

data: positives out of subjects

TYO OSA
OSA 0.82 -
MYA 0.71 0.21

P value adjustment method: none
Warning messages:
1: In prop.test(x[c(i, j)], n[c(i, j)], ...) :
Chi-squared approximation may be incorrect
2: In prop.test(x[c(i, j)], n[c(i, j)], ...) :
Chi-squared approximation may be incorrect
3: In prop.test(x[c(i, j)], n[c(i, j)], ...) :
Chi-squared approximation may be incorrect
> library(fmsb)
> pairwise.fisher.test(positives,subjects,p.adjust.method = 'none')

Pairwise comparisons using Pairwise comparison of proportions (Fisher)

data: positives out of subjects

TYO OSA
OSA 0.71 -
MYA 0.57 0.12

P value adjustment method: none

697 :
まあ、特異度99.5%でも偽陽性が15人ぐらいでるから、陽性者はほとんどそれなんだろうな。なので両方陽性の人のみを数えてるのは正しいと思う。
日本の抗体保有率が低すぎたと。

698 :
統計勉強しててこのスレ見つけたんですけどみなさんRつかってるんですね
pythonや他の言語ではないということは統計界隈はRが主流なのでしょうか?

699 :
>>697
偽陽性率 = 1 - 特異度だから全部が偽陽性の可能性もあるなぁ。
その確率は計算できるのだろうか?

700 :
>>699
https://www.magojibi.jp/928/
https://www.magojibi.jp/920/
ここを信じる限り、特異度は99.6%と99.8%。3000人の検査で6〜12人偽陽性が出る感じで、あってるように思う。
両方同時に偽陽性になる検体が1つ以上出る確率は2.3%だから、2つ調べればほぼ確実ということだろうね。まあ、互いに独立した事象ならという仮定だが。

701 :
2キットが両方陽性のときのみ検査陽性とすると
特異度は
1-((1-0.996)×(1-0.998))
=0.999992
でいいのかな?

702 :
偽陽性率は100万分の8でいいのか。
すると全部偽陽性というわけでもなさそう。

703 :
>>702
あくまで、偽陽性の発生が2つの試験で独立の場合。

実際には、判定メカニズムに共通部分があるだろうから、完全に独立ではなくある程度相関はあるかも。相関が低いほど最終的な特異度は高くなる。
そういう意味では、カッパ値が低いことはむしろ利点となる。

704 :
レスありがとうございます。

有病率prevalenceが低いとカッパ値は低めにでるらしいので
これを補正した
 PABAK = 2✕(陽性合致数+陰性合致数)/ 検査総数 − 1
は>693にある通り0.992と高いので
2キットは相関しているような気もする。

705 :
>>698
もともと統計畑ではRを使っていた人が多数派だったと思う
Pythonは統計では後発で、pandasはRのデータフレームによく似ている

706 :
>>705
統計のパッケージが一番揃っているよね。
最新理論のパッケージもまず、R版がリリースされるし。
例:Bayesian Network Meta-analysisとか。
こんなのあったらいいなぁと思って探すとみつかることが多い。

むかし、ヨンクヒール・タプストラ検定のスクリプト作ったけど、パッケージの方が高速でエラー処理も優れていたなぁ。
Rで??Jonckheereと入力するとそれらしいのがヒットする。

707 :
> (dat=TYO+OSA+MYA)
[,1] [,2]
[1,] 8 15
[2,] 15 7912
で検査総数は7950
全員が抗体不保持でキットは全部偽陽性と仮定。

2キットが陽性で検査陽性判定なら8/7950が偽陽性で
特異度 1 - 8 / 7,950 = 0.9989937
1キットでも陽性で検査陽性判定なら
特異度 7,912 / 7,950 = 0.9952201

708 :
抗体保有率=0という帰無仮説で検定するにはどうすればいいんだろう?棄却できないと気がするんだが。
どちらのキットも陽性が23人で陽性率は
23 / 7,950 = 0.0028931
公称の偽陽性率(= 1 - 特異度)程度の陽性率にとどまっている。

709 :
6月末に全国初の治験開始へ『大阪発の新型コロナワクチン』大阪府と阪大などが進める
https://www.mbs.jp/news/kansainews/20200617/GE00033506.shtml

>新型コロナウイルスのワクチンの治験は全国で初めてで、安全性が確認できれば、
>今年10月に数百人規模で治験を行った上で、年内に20万人分のワクチンを製造し、
>2021年春か秋の実用化を目指すということです。

有病率が0.5%程度だから数百人規模の治験じゃ有意差出せないだろうな。

710 :
患者数が減って標本数が足りないって問題があるみたい

711 :
公表された抗体陽性割合

8/7950 # 厚労省
7/1000 # 東大
191/44066 # ソフトバンク

一番高い0.7%を採用して
>今年10月に数百人規模で治験
を実薬500人、偽薬500人として
偽薬の500人中4人が陽性、ワクチン投与で500人中0人にできたとすると

> prop.test(c(4,0),c(500,500))

2-sample test for equality of proportions with continuity correction

data: c(4, 0) out of c(500, 500)
X-squared = 2.259, df = 1, p-value = 0.1328
alternative hypothesis: two.sided
95 percent confidence interval:
-0.001808434 0.017808434
sample estimates:
prop 1 prop 2
0.008 0.000

Warning message:
In prop.test(c(4, 0), c(500, 500)) :
Chi-squared approximation may be incorrect

> Fisher.test(c(4,0),c(500,500))

Fisher's Exact Test for Count Data

data: cbind(hit, shot - hit)
p-value = 0.1242
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.6617083 Inf
sample estimates:
odds ratio
Inf

> poisson.test(c(4,0),c(500,500))

Comparison of Poisson rates

data: c(4, 0) time base: c(500, 500)
count1 = 4, expected count1 = 2, p-value = 0.125
alternative hypothesis: true rate ratio is not equal to 1
95 percent confidence interval:
0.660124 Inf
sample estimates:
rate ratio
Inf


どれでも、有意差がでない。
どういうデザインで治験するんだろうなぁ?

712 :
ワクチンと治療薬だと治験の方法が違うかも
安全性と効果を確認するだろうけど
ワクチンの場合は
健康な人がワクチン接種で病気などにならない事と
ワクチン接種後にできた抗体でウイルスなどを中和出来ることを試験管なとで確認したら良さそう
治療薬は患者に投与して
副作用があまりない事の確認と治癒などの効果確認をするだろう

713 :
>>712
なるほど。
エンドポイントを感染予防でなくて抗体獲得という代理エンドポイントにするということね。
ありがとうございました。

714 :2020/06/21
岩手は、やはり抗体も検出されず

https://www3.nhk.or.jp/news/html/20200620/k10012477771000.html

社会人のお前らに聞きたい
Daniel Marcus Graph Theory を読む。
なんじゃこら哲也
数学の本 第88巻
世界史的数学難問を解いた佐野千遥を語るスレ
有理数であることも無理数であることも証明できない実数
関数解析(Functional Analysis)
中1の弟が数学好きなようだから先取りさせたい
モンティホールの問題で絶対選び直す奴www
【理3悲報】 高専>理3
--------------------
ドラクエ5のフローラとその信者が大嫌いな人のためのスレ14
大阪国税局スレ
【基本情報技術者】IT業界での資格価値格付けランキング
神我狩・セイクリッドドラグーン総合11リミット目
サンプル百貨店 ★18
スレを勃てるまでもないC/C++の質問はここで 25 [隔離病棟]
力士はそこそこ鍛えてる外人集団にも勝つってマジ?
【A.V.A】垢売買スレpart25【AVA】
【願わくばこの手に幸福を】ショーン田中 10周目
IDに即席麺用語が出るまで(´・ω・`)するスレ Part39
あんまん
【旭丘】札幌市立高校スレPart9【開成】
実質鰐��44
■■《スキパニパ》CMでグリコを騙した犯人は?■■
大阪の都市計画について語るスレ Part116
【猫騙】上杉昇を心から応援するスレ【ソロ】part.110
【ネトウヨ悲報】戦前の日本人、韓国が大好きだった!【衝撃】
【在日】韓国籍の韓一仁容疑者ら、室内を物色中に通報され殺害か 室内の現金手つかず 青梅市の男性殺害事件[12/29]
【リニューアル】銀座伊東屋を語る3【品数激減】
俺的ゲーム速報JIN FX投資部を語ろう★2
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼