(B) 1 若有一種新型篩檢工具可以在1 天內即測出是否有D 病,該工具敏感度(sensitivity)為85%,特異度(specificity)為95%。張先生使用此工具篩檢得知結果為陽性,則張先生實際確診為D 病的機率為何?
- 0.3%
- 1.7%
- 85%
- 99%
- 1/2
- 3/5
- 7/9
- 7/10
- 臺灣受僱勞工的平均月收入是一個左偏(left skewed)的分布,因為有一些高收入所得者
- 左偏(left skewed)的分布,中位數(median)通常會比平均數(mean)來得小
- 中位數比平均數較容易受到極端值(outlier)影響
- 莖葉圖(stem and leaf plot)可以用來描述資料的分布情況
- 變異數
- 中位數
- 自由度
- 眾數
- 標準誤為0.632
- 標準誤為量化X 分散程度的敘述性統計指標
- X 的平均值近似常態分布
- 如果只抽取20 杯,X 的平均值分布未知
- 雖然兩組體重減少的差異未達到統計顯著,但仍應拒絕虛無假設
- t 檢定的P 值大於0.05,所以不能拒絕虛無假設
- 因為是前後測量,所以應該用成對樣本的t 檢定
- 從二組體重改變平均值差異的95%信賴區間,可以拒絕虛無假設
- 統計檢定力受到型一錯誤(type-I error)和型二錯誤(type-II error)大小的影響
- 如果希望統計檢定力提高,在其他條件不變的情況下,所需樣本數就應隨著提高
- 如果樣本數太小,容易犯下型一錯誤
- 減少測量誤差,可以讓統計檢定力增加
- 會參加健身俱樂部的人可能比較健康,收縮壓平均數可以代表母群體平均數
- 由這個樣本所估計的平均數,其準確度(accuracy)會受到母群體平均數的影響
- 由這個樣本所估計的平均數,其準確度(accuracy)會受到母群體變異數的影響
- 由這個樣本所估計的平均數,其準確度(accuracy)會受到母群體總人數的影響
- 母群體的平均數會落在95%信賴區間的機率是0.95
- 95%信賴區間會比99%信賴區間來得更寬
- 從隨機樣本計算平均數的95%信賴區間,當樣本數增加,95%信賴區間也會隨著變寬
- 如果從母群體隨機抽樣相同的大小樣本100 次,從這些樣本所計算的95%信賴區間,大約會有95 個包含母群體的平均數
- 1520
- 4899
- 9604
- 32654
治療 方式 | 1090 | 2 | (丙) | (戊) |
誤差 | (甲) | (乙) | (丁) | |
總和 | 1477 | 23 |
- 5
- 15
- 25
- 30
- 變成零
- 不變
- 變大
- 變小
- 計算95%CI 會用到Z 分布的第95%百分位數(the 95th percentile)
- 同意比例的標準誤約為0.05
- 若同意比例的點估計仍為55%,但總樣本數改為80 位,95%CI 會變寬
- 同樣的樣本若估算99%CI 會比95%CI 寬
- p value > 0.5
- 0.25 < p value < 0.5
- 0.05< p value < 0.25
- p value<0.05
- 甲地區高中生嘗試吸菸率與全國高中生有差異,具統計上顯著意義
- 甲地區高中生嘗試吸菸率與全國高中生沒有差異,具統計上顯著意義
- 甲地區高中生嘗試吸菸率與全國高中生有差異,沒有統計上顯著意義
- 甲地區高中生嘗試吸菸率與全國高中生沒有差異,沒有統計上顯著意義
- Spearman correlation coefficient
- Wilcoxon rank sum test
- McNemar chi-square test
- Sign test
- Chi-square goodness-of-fit test
- Logistic regression
- McNemar test
- Linear regression
配對號 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
雙胞胎A | 20 | 23 | 30 | 22 | 19 | 28 | 29 | 30 | 25 | 33 |
雙胞胎B | 21 | 21 | 28 | 24 | 25 | 31 | 21 | 33 | 28 | 34 |
- 勝算比(Odds Ratio)
- 變異係數(Coefficient of variation)
- 斯皮爾曼(Spearman)等級相關係數
- Kappa 係數
疾病D | |||
是 | 否 | ||
A地區 | 8 | 1992 | 2000 |
B地區 | 16 | 984 | 1000 |
- Two-sample t test
- Fisher exact test
- Pearson's chi-square test
- Logistic regression
ID | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
前 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
後 | 0 | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 1 | 0 |
- Paired t test
- Two-sample t test
- Linear regression
- McNemar chi-square test
沒有戴 安全帽 | 有戴 安全帽 | 總人數 | |
沒有 頭部外傷 | 10 | 70 | 80 |
有 頭部外傷 | 20 | 40 | 60 |
總人數 | 30 | 110 | 140 |
- 如果使用卡方檢定(Chi-squared test)檢查戴安全帽和頭部外傷關係,則卡方檢定的自由度為4
- 如果戴安全帽與發生頭部外傷是兩獨立事件,沒有戴安全帽也沒有發生頭部外傷的預期人數為16.1 人
- 如果戴安全帽與發生頭部外傷是兩獨立事件,有戴安全帽仍發生頭部外傷的預期人數為47.1 人
- 卡方分布是間斷分布(discrete distribution),可以用來檢定列聯表中兩類別變數的關係
- 單因子變異數分析用來比較三組的母群體平均數μ1,μ2和μ3是否相等時,虛無假設是μ1=μ2=μ3
- 對立假設為母群體平均數不相等,亦即μ1 ≠ μ2且μ1 ≠ μ3且μ2 ≠ μ3
- 變異數分析的假設,其中之一為母群體變異數相等
- 如果用變異數分析比較兩組平均數相等時,其結果會等於兩獨立樣本t 檢定的結果
- 兩組獨立樣本的大小必須相同
- 可以用來檢定左右眼近視度數的差別
- 兩組獨立樣本的變異數大小必須接近
- 兩組樣本的平均值必須要相近
個數 | 平均數 | 標準差 | 標準誤 | |
有氧運動 | 6 | 8.00 | 1.414 | .577 |
音樂療法 | 6 | 12.00 | 3.347 | 1.366 |
認知療法 | 6 | 25.00 | 2.828 | 1.155 |
總和 | 18 | 15.00 | 7.874 | 1.856 |
- 1422
- 948
- 474
- 106
- Kruskal-Wallis test
- Mann-Whitney U test
- Paired t test
- Sign test
- 共線性是指解釋變數之間的相關係數很高
- 共線性只有當解釋變數的數目超過10 個的時候才是個問題
- 當一個解釋變數的迴歸係數方向改變,例如從正向變成負向關係,代表共線性可能是個問題
- 當模型的判定係數(coefficient of determination)很大,但是模型裡面的解釋變數都不顯著,代表共線性可能是個問題
勝算比信賴區間 | |||||
變項 | 迴歸係數 | 標準誤 | 勝算比 | 下界 | 上界 |
治療組別 (非手術=0, 手術=1) | 0.278 | 0.485 | 1.32 | 0.51 | 3.414 |
性別 (男性=0, 女性=1) | -0.697 | 0.509 | 0.498 | 0.184 | 1.352 |
截距 | -0.934 | 0.356 |
- 治療組別的迴歸係數虛無假設勝算比為1
- 不管使用那種方式治療,男性和女性治療成功機會的差異達到統計上顯著
- 治療組別之間治療成功機會的差異達到統計上顯著
- 在調整性別之後,手術治療的成功機率(probability)是非手術治療的1.32 倍,但是沒有達到統計上的顯著
- 使用逐步迴歸(stepwise regression)總是能夠得到最正確的模型
- 統計不顯著的解釋變數,必須要從模型裡移除掉,否則會影響其他變數的解釋
- 當解釋變數很多的時候,可以完全交給逐步迴歸來決定那些變數應該納入模型中
- 當解釋變數很多的時候,經由逐步迴歸所挑選出來的變數,其P 值可能比實際上小
- 身高和最大通氣量的相關係數為0.375
- 殘差圖顯示變異數同質性(homoscedasticity)的假設不成立
- 身高的迴歸係數達到統計顯著
- 殘差圖顯示身高和最大通氣量之間可能存在非線性的關係
出生體重=2240.29+6.33×母親年齡+11.77×母親懷孕前體重-591.12×高血壓下列敘述何者正確?
- 母親體重的迴歸係數比母親年齡的迴歸係數大,表示母親體重是比較重要的一個解釋變數
- 有高血壓的母親生下的嬰兒,平均而言,比沒有高血壓的母親生下的嬰兒重
- 一位30 歲沒有高血壓的母親,懷孕前體重為58 公斤,根據上述方程式,她生下來的嬰兒體重大約是2421.6 公克
- 迴歸係數的抽樣分布,服從標準t 分布
敘述統計 | ||||
最小值 | 最大值 | 平均數 | 標準差 | |
運動時間 | 10 | 84 | 42 | 23 |
閱讀能力 | 26 | 124 | 79 | 32 |
變異數分析表 | |||||
模式 | 平方和 | df | 平均平方和 | F | 顯著性 |
迴歸 | 8714 | (甲) | (丙) | (戊) | <0.001 |
殘差 | 2995 | 999 | (丁) | ||
總數 | 11710 | (乙) |
- 1.2
- 9.6
- 15.5
- 21.1
- 甲>乙>丙
- 丙>乙>甲
- 丙>甲>乙
- 乙>丙>甲
- 預測值
- 殘差值
- 殘差值之平方
- 殘差值之平方總和
- Multiple linear regression
- Multiple logistic regression
- Two-sample t test
- McNemar chi-square test
B | OR | 95%CI OR | P value | |
截距 | 1.39 | <0.001* | ||
Group | -0.73 | 0.48 | (0.26,0.89) |
- 斯皮爾曼(Spearman)相關係數
- 皮爾森(Pearson)相關係數
- 邏輯式迴歸模式(Logistic regression)
- 線性迴歸模式(Linear regression)
風險比 (Hazard Ratio) | 標準誤 | 95% 信賴區間 下界 | 95% 信賴 區間上界 | |
治療方式 (合併治療設為1, 單一治療設為0) | 0.40 | 0.16 | 0.19 | 0.87 |
性別 (男性設為1, 女性設為0) | 1.08 | 0.42 | 0.50 | 2.31 |
年齡 | 1.00 | 0.02 | 0.97 | 1.04 |
- 女性接受治療之後死亡的風險比男性小,但沒有達到統計上顯著
- 病人接受合併治療比接受單一治療的死亡風險較小,但沒有達到統計上顯著
- 病人的年齡對於治療之後死亡的風險有統計上顯著的影響
- 分析結果可顯示男性接受合併治療死亡的風險,比女性接受合併治療死亡的風險來得低
Variable | DF | Coefficients | Standard> error | t value | P value |
Intercept | 1 | 22.9 | 1.0 | 23.8 | <0.001 |
PA | 1 | -0.3 | 1.1 | -0.3 | 0.81 |
- 活動組平均BMI 為22.9
- 活動組BMI 樣本平均值比少動組BMI 樣本平均值略低
- 根據統計檢定,活動組與少動組BMI 的平均值有統計上顯著差異
- BMI 有81%的變異可被PA 所解釋
- 接受標靶治療的病人,Kaplan-Meier 存活分析所估計的中位數存活時間比實際觀察的中位數存活時間來得長
- 接受標靶治療的病人,所有病人在研究結束前都死亡
- 接受化學治療的病人,第一例死亡發生在6 個月的時候
- 接受化學治療的病人,最長活了30 個月
- 若病人在2000 天時設限,表示此病人在第2000 天時死亡
- 女性存活時間的中位數約落在1000 天到1700 天之間
- 女性存活時間的中位數比男性長
- 男性組無法估算存活時間的中位數
- 至少有一個病人失去追蹤
- 至少有一個病人主動退出試驗
- 至少有一個病人失去追蹤或死亡
- 至少有一個病人死亡