第五堂課:研究樣本之選擇與排除以及樣本數估計
研究樣本之選擇 (inclusion criteria)
研究樣本之排除 (exclusion criteria)
樣本數估計
如何使用 ChatGPT協助
一、導論:瞭解樣本選擇的重要性
- 樣本選擇與研究結果的關係:
- 樣本選擇是研究的關鍵程序之一。
- 樣本之概念:執行實證研究時,我們難以調查所有的目標研究群體,因此需要選取一個代表性的子集,即「樣本」,以作為我們研究的對象。
- 選擇合適的樣本攸關研究結果的可靠性和有效性【或概化程度】。
- 如果樣本選擇不當,可能造成選擇偏誤(selection bias),即所選取的樣本無法準確地代表研究群體,導致研究結果偏差或欠缺概化能力。
- 樣本大小不足,可能導致 檢力 (power) 不足,從而影響研究結果的穩定性與可信度。
- 什麼是適當的樣本?
所謂「適當的樣本」,指的是能夠有效代表研究群體的樣本。確定適當樣本的因素可能會依據研究目的和設計而變化,但主要包括以下3點:
- 代表性:能夠代表整個研究群體的特性。換句話說,它需要包含所有研究群體之特質/變異。
- 大小:樣本須夠大,以提供足夠的檢力,確保研究結果的穩定性和可信度。
- 可行性:在實際操作中,選擇適當的樣本還需要可行。如果目標樣本難以獲取,研究者可能需要採取其他策略,如選擇其他相似的可獲取群體作為樣本。
- 隨機抽樣/分層抽樣/群集抽樣/系統抽樣--難做到--不考慮
- 非隨機抽樣:參與者並非由機率原則選擇。這方式可能導致樣本與母體間存在偏差,但由於實用性或資源限制,研究者最常使用非隨機選擇。這也導致一般臨床研究結果難以概化(難應用於臨床/與臨床應用得結果不一致)。
- 方便取樣(Convenience Sampling):
- 根據可獲得性或便利性以選擇樣本。例如,一位研究者可能會調查他/她能夠方便接觸到的個案,或者選擇在一個特定地點較易找到的參與者。儘管這種方法可以使資料收集更快、更簡單,但是,因為樣本的選擇並未基於隨機的原則,所以可能導致選擇偏誤,影響研究結果的概化(推論)能力。
- 立意取樣(Purposive Sampling):
- 根據研究者的主觀判斷以選擇樣本。研究者根據研究目的,選擇特定的個體或群體作為研究樣本。例如,在一項探索性的研究中,研究者可能選擇具有特定特徵或經驗的參與者。然而,這種方法的一個主要限制是可能存在研究者偏見,並導致樣本難以代表整體母體。
- 連續取樣(Consecutive Sampling)
- 研究者選取特定期間內的所有符合特定條件的個體作為樣本。例如,在醫學研究中,選擇在一定時期內所有入院且符合收案標準的病患作為樣本。
- 連續抽樣可以確保在特定時間範圍內所有符合資格的個體都被包含在內,且能提供豐富且完整的數據,尤其是在數量有限或集中在特定時間或地點的情況下。然而,這種方法的一個主要限制是它可能受到時間效應的影響,例如季節性變化或其他時間相關的變數可能會影響研究結果。
三、選擇合適的樣本大小
- 研究設計與樣本大小的關係:
- 不同的研究設計對樣本大小的需求不同。例如,在實驗性的研究設計中,如果要檢驗二治療方法的差異,則可能需要足夠的樣本數量以確保有足夠的檢力以驗證有無統計顯著差異。另一方面,對於質性研究或探索性研究,研究者可選擇較小的樣本,著重於深入理解參與者的經驗。
- 常見的樣本大小決定方法:
- 確定樣本大小的方法依賴於研究的目的和設計。對於量化研究,常見的方法包括檢力分析(Power Analysis)與信賴區間 (confidence interval) 的設定。檢力分析是一種根據預期的效應值 (effect size) 大小、預期的變異數(variance)、顯著性水平 (significance level, 通常是0.05) 與希望獲得的統計檢力 (statistical power,通常是80%) 以確定樣本大小的方法。信賴區間的設定則是根據研究者對誤差的容忍度來確定樣本大小。
- 太多或太少的樣本可能產生的問題:
- 樣本過小,可能會導致檢力不足,無法準確地檢出真實存在的效應,且研究結果的可信度也會受到影響。此外,也可能導致研究結果的偏誤,因為極端值或異常值的影響會放大。
- 過大的樣本可能導致「易呈現統計顯著」,即使效應非常小或無實質意義,也可能會被檢測出顯著的統計顯著差異。進而誤導研究者或讀者,使他們誤以為這些微小的差異具有實質意義。此外,過大的樣本會消耗更多的資源,包括時間、金錢和人力,這可能導致效益不符合成本。
因此,選擇適當的樣本大小是一種需要平衡的藝術,既要保證統計力,又要考慮資源的有效利用。研究者在決定樣本大小時,必須考慮到他們研究的特定目標和實際限制,並可能需要尋求專業的統計諮詢。
四、實務操作:如何選擇樣本
- 確定研究群體:研究群體,又稱為母體(population),是你的研究欲進行推論的對象。這通常被定義為具有一個或多個共同特徵的所有個體的集合。例如,如果你想研究慢性思覺失調個案IADL功能之影響因素,你的研究群體就是所有的慢性思覺失調個案。
- 了解研究群體的特性:以確定最合適的抽樣方法與樣本大小。你需要考慮的特性可能包括群體的大小、多樣性、與地理分布等。然而研究人員難以掌臨床個案之母體大小與地理分布。
- 選擇抽樣方法:根據研究目標與研究群體的特性,再選擇最適合的抽樣方法。臨床研究通常以方便取樣或連續取樣為主。
- 決定樣本大小:決定樣本大小需考慮到你的研究目的、研究設計、預期的效應大小、研究的可靠性和有效性,以及你有的資源等因素。
- GPower 可用來計算各種統計檢定的樣本大小。 G*Power 是一個需要下載的桌面軟體,但免費,並且提供詳細的說明文件。網址如下:http://www.gpower.hhu.de/
進行樣本選擇時,必須注意樣本的多樣性和代表性,以確保研究結果之適用範圍/對象(概化, generalization 或 external validity)。然而,絕大多數的臨床研究難以做到良好的抽樣/取樣,造成研究樣本甚少有代表性,亦即研究結果之概化能力相當有限。這也是評論之前研究不足常見的議題或是作者提出的研究限制。
五、樣本選擇的常見問題與解答
樣本偏誤與如何避免
選擇不適當樣本的後果
有關樣本選擇的常見疑問
六、實例分析:優秀研究的樣本選擇分析
分析並討論一些實際研究案例中的樣本選擇方法
學習如何在自己的研究中選擇合適的樣本
七、實戰演練:撰寫樣本選擇的方法章節
如何清晰、精確地描述樣本選擇的過程:
- 在撰寫方法章節中的樣本選擇部分時,你需要清晰、精確地說明你的樣本是如何選擇。包括以下5點:
- 研究群體為何
- 使用哪種抽樣方法
- 個案選擇與排除標準
- 樣本大小是多少/如何決定
- IRB審查
- 連續取樣是一種非隨機的抽樣方式。研究人員會連續地選擇每一個符合研究條件的個體,直到達到需要的樣本大小。
以下我們以"慢性思覺失調個案IADL功能之變化與影響因素"之研究主題且以【連續取樣】為例進行說明:
- 如何解釋樣本/樣本數選擇的合適性:
"本研究的目標群體是所有在台灣診斷為慢性思覺失調的病患。由於病患的具體數量與分布情況不易掌握,我們決定使用連續取樣 (consecutive sampling) 進行樣本選擇。在選定的研究期間(例如一年)內,我們將連續收集每一位符合我們研究條件(例如年齡、病程等)的慢性思覺失調病患,作為我們的研究樣本。
我們預計將收集到約xxx名病患的數據,這個數量是根據我們的預期效應值大小與統計檢力分析的結果決定。"
- 個案選擇標準:
- 被診斷為慢性思覺失調的個案,診斷依據為DSM-5或ICD-10的診斷標準。
- 年齡在18到65歲之間。
- 能理解並同意參與研究,並簽署知情同意書。
- 個案排除標準:
- 有重大身體疾病或其他精神障礙,可能影響IADL功能的評估。
- 有明顯的認知功能障礙,無法理解研究內容或完成問卷。
- 正在參與其他可能影響IADL功能的干預研究。
這些選擇和排除標準的設定需要考慮到研究目的、實際操作的可行性,以及對結果的影響等因素。記得清楚地定義所有的條件,並解釋為什麼這些標準對你的研究是重要的。
- 以 G*Power為例說明如何決定上述研究之樣本數
首先,我們需要確定研究的主要目的。上述例子中,我們的主要目的是:探究慢性思覺失調個案IADL功能的變化與哪些因素有關。如果我們的資料分析方法是「多元迴歸分析」,則我們需要考慮到預期的效應值 (effect size) 大小、α錯誤機率(顯著性水平)、統計檢力,以及我們擬在迴歸模型中納入的預測變項 (variables) 數量。
假設我們預期的效應值為中等(例如,f-squared = 0.15),α錯誤機率為0.05,統計檢力希望達到0.8(即β錯誤機率為0.2),並且我們打算在模型中納入5個預測變數。我們可以將這些參數輸入G*Power軟體以計算所需的樣本數。
具體操作如下:
- 打開G*Power軟體,選擇"獨立性測試",然後選擇"線性多元回歸:固定模型,R-squared增益"。
- 在"輸入參數"區域,將"效應值 f-squared"設為0.15,"α誤差機率"設為0.05,"檢力"設為0.8,"預測變項數量"設為5。
- 點擊"計算所需樣本數",G*Power將會給出所需的樣本數。
請注意,G*Power給出的是一個參考值,具體的樣本數還需要考慮到實際的研究情況,例如可獲得的個案數量、預期的樣本損失等因素。並且,大樣本也可能會帶來更多的時間和金錢成本,因此在確定樣本數時需要進行權衡。
ChatGPT對我備課的協助:
你是一位資深研究人員,擬教授研究計畫撰寫之方法章節之樣本選擇,請提供教學大綱。
留言
張貼留言