1)單純隨機(jī)抽樣(simple random sampling):這種方法的基本原則是每個抽樣單元被抽中選入樣本的機(jī)會是相等的。簡便、易行的科學(xué)分組方法是利用隨機(jī)數(shù)字表。抽簽、抓鬮的方法嚴(yán)格地說不能達(dá)到完全隨機(jī)化,但因其簡單、實用,小范圍的抽樣仍可使用。簡單隨機(jī)抽樣首先要有一份所有研究對象排列成序的編號名單,再用隨機(jī)的方法選出進(jìn)入樣本的號碼,已經(jīng)入選的號碼一般不能再次列入,直至達(dá)到預(yù)定的樣本含量為止。
5)兩級或多級抽樣(two-stage or multi-stage sampling):這是大型調(diào)查時常用的一種抽樣方法。從總體中先抽取范圍較大的單元,稱為一級抽樣單元(例如縣、市),再從抽中的一級單元中抽取范圍較小的二級單元(如區(qū)、街),這就是兩級抽樣。還可依次再抽取范圍更小的單元,即為多級抽樣。
現(xiàn)況調(diào)查(prevalencesurvey)又稱現(xiàn)患調(diào)查或橫斷面調(diào)查(cross-sectional survey),是在一個確定的人群中,在某一時點或短時期內(nèi),同時評價暴露與疾病的狀況,或在某特定時點(如參加工作前,入學(xué)或退休時)所做的體檢等調(diào)查。現(xiàn)況調(diào)查是通過完成某特定時間該人群健康經(jīng)歷的一個“快照”,提供某病頻率和特征的信息。
(一)目的和用途
1.查明當(dāng)前某地區(qū)某種疾病的流行強(qiáng)度和該病在該地區(qū)的分布特點 以便分析患病頻率與哪些環(huán)境因素、人群特征以及防病措施的質(zhì)量等因素有關(guān),有何關(guān)系。這些資料對公共衛(wèi)生管理人員估價某人群健康狀況和衛(wèi)生保健的需求有很大價值。
2.現(xiàn)況調(diào)查的結(jié)果 可以提供某病的病因線索,供分析流行病學(xué)研究;還可用于提供某些職業(yè)中疾病的患病或其他健康結(jié)局的信息?,F(xiàn)況調(diào)查適宜于對不會發(fā)生改變的暴露因素如血型、膚色、種族、性別等的研究;也適宜于對能發(fā)揮長期、慢性累積影響的暴露因素的研究,如高血壓與冠心病的關(guān)系,糖尿病與動脈粥樣硬化的關(guān)系等。對于這樣一些因素,現(xiàn)況調(diào)查可以提供真實的暴露與疾病聯(lián)系的證據(jù)。
3.早期發(fā)現(xiàn)病人 利用普查、篩檢等手段,可以早期發(fā)現(xiàn)病人,利于早期治療。例如高血壓普查。
4.評價疾病的防治效果 如果定期地在某一人群中進(jìn)行橫斷面研究,收集有關(guān)暴露與疾病的資料,該研究結(jié)果類似于前瞻性研究結(jié)果。將現(xiàn)況研究的結(jié)果與同一地區(qū)幾年以前或幾年以后的同類調(diào)查結(jié)果進(jìn)行比較,則可評價某些疾病的防治效果。
(二)局限性
1.由于是在同一時點估價暴露和疾病狀況,很多情況下難以判斷孰前孰后、孰因孰果這是橫斷面研究作為病因研究的一個主要弱點。例如人們多次發(fā)現(xiàn)低社會階層的人比高社會階層的人精神紊亂患病率高。然而,到底是低社會階層的人易發(fā)生精神疾患,還是患精神疾患的人易于落入低社會階層呢,還值得研究。
同時,橫斷面研究的病人是“現(xiàn)存”病人,而不是新發(fā)病例,因此獲得的資料不僅反映了病因?qū)W的因素,同時還有決定存活的因素。很快痊愈或死亡的病例包括在病例組的機(jī)會較少。如果病程短或很快致死的病例與病程長的病例的特征有所不同,則現(xiàn)況調(diào)查中觀察到的聯(lián)系不能代表實際的聯(lián)系。例如,美國Evans縣研究資料表明,黑人比白人冠心?。–HD)患病率低。由于這只反映了調(diào)查時人群的現(xiàn)況,它不意味著黑人中發(fā)生CHD低。因為如果黑人CHD的發(fā)生和死亡均高于白人,與某一時點上黑人患病率低并不矛盾,而橫斷面調(diào)查不能區(qū)分這種現(xiàn)象。
2.許多慢性病都有相對惡化和緩解期,現(xiàn)況研究可能把緩解期的病例錯劃為無病。此外,必須注意經(jīng)過治療或正在治療的病例。這些病例在調(diào)查時可能沒有疾病的表現(xiàn),但是如果不治療,則大部分可能歸為病人。應(yīng)當(dāng)根據(jù)研究的目的對這部分人進(jìn)行分類。一般在研究過程中,對這部分人應(yīng)有所標(biāo)明,以便分析中能適當(dāng)?shù)貙Υ麄儭?/p>
總之,現(xiàn)況調(diào)查對于病程短的病不能充分發(fā)現(xiàn),對于急性非致死性或迅速致死的疾病都難以提供正確的分布情況。所以現(xiàn)況調(diào)查主要用于慢性病的研究。評價那些不會發(fā)生改變的暴露因素與疾病的聯(lián)系,橫斷面研究并不亞于分析性研究。有時也可利用血清學(xué)檢驗、生化實驗等進(jìn)行感染率、帶菌狀況或免疫水平等的調(diào)查,以及生理、解剖、生化等指標(biāo)的調(diào)查。
(三)研究設(shè)計要點
1.明確調(diào)查目的 是考核預(yù)防、治療措施的效果,還是探索病因或危險因素;描述疾病的分布為社區(qū)診斷提供基線資料,為衛(wèi)生保健工作決策提供參考,還是確定高危人群,等等。
2.掌握有關(guān)的背景資料 只有充分地掌握背景資料,了解該問題現(xiàn)有的知識水平,國內(nèi)、外進(jìn)展情況,才能闡明該研究的科學(xué)性、創(chuàng)新性和可行性,才能估價其社會效益和經(jīng)濟(jì)效益。掌握背景資料有三種途徑:①自己經(jīng)驗的總結(jié);②向有關(guān)專家請教;③查閱文獻(xiàn)資料。這項工作不僅是制訂計劃時的工作,而且應(yīng)當(dāng)貫穿于研究的全過程,是一個十分重要的環(huán)節(jié)。
3.確定研究人群 調(diào)查者往往是在抽樣后才測量暴露。這時可在一個確定的地理區(qū)域內(nèi)的人口、家庭或其他單位抽取樣本。有時根據(jù)暴露狀態(tài)選擇人群,特別是暴露容易識別時。例如,想比較天津市不同區(qū)的精神紊亂患病率,則可從不同區(qū)抽樣。如果對某職業(yè)暴露有興趣,可選擇有暴露的工廠的工人與無暴露的工廠的工人,比較其患病率;或選擇工廠中有暴露的部分工人與另一部分無暴露的工人比較。如果是相對小的人群,則可包括全部人群;如果不實際或花費太大,則可選擇暴露組與非暴露組。
在橫斷面研究中,抽樣過程使調(diào)查者有可能得到最有效的研究設(shè)計,以能代表將結(jié)果推及的目標(biāo)人群為原則。
4.暴露的測量 暴露即我們所研究的因素,研究對象所具有的特征,所發(fā)生的事件。暴露并不僅限于與研究對象有關(guān)的外界因素,同時也包括機(jī)體內(nèi)部的因素如遺傳因素、內(nèi)分泌因素和精神因素等。暴露又稱變量。暴露必須有明確的定義和測量尺度。應(yīng)盡量采用定量或半定量尺度和客觀的指標(biāo)。用調(diào)查表、記錄、實驗室檢查、體檢和其他手段來測量暴露。知道暴露于這些因素多長時間,什么時候暴露很重要。例如調(diào)查者常想知道是否吸煙時間越長,疾病患病率越高。
5.疾病發(fā)生的測量 在人群中進(jìn)行現(xiàn)況調(diào)查時,應(yīng)盡量采用簡單、易行的技術(shù)和靈敏度高的方法。同時需注意檢驗結(jié)果中的假陽性,特別在患病率較低的疾病的現(xiàn)況研究中尤為重要。例如,某項方法檢出肺癌,其假陽性率為1%。假定調(diào)查人群肺癌患病率為5/10萬,也即調(diào)查10萬人有5名病人,而同時在其余99995名中檢出假陽性病人999.95人,即1000人。這時,如不能鑒別5例病人和1000名假陽性病人,就會誤認(rèn)為患病率為1000/10萬或1%。由此可見,在人群中通過現(xiàn)況調(diào)查研究發(fā)現(xiàn)病人與在醫(yī)院中診斷一例病人是性質(zhì)不同的兩件事。
對疾病必須提前建立嚴(yán)格的診斷標(biāo)準(zhǔn),標(biāo)準(zhǔn)要利于不同地區(qū)的比較。調(diào)查表、體檢或一些特殊檢查常聯(lián)合應(yīng)用。如果可能,應(yīng)測定疾病首次癥狀發(fā)作的時間。有時由于疾病系逐漸發(fā)生難于確定發(fā)作時點,或直到現(xiàn)況調(diào)查時才知道疾病存在。
對有惡化期或緩解期的疾病,重要的是詢問沒有癥狀或體征的人過去是否曾有過癥狀。雖然調(diào)查者或許不能據(jù)此肯定他們是否有病,但可以考慮他們可能有病或分析時將他們分開分析。
6.擬定調(diào)查表 調(diào)查表又稱問卷(questionnaise),是流行病學(xué)調(diào)查的主要工具。調(diào)查表設(shè)計的好壞,對調(diào)查結(jié)果有著舉足輕重的影響。調(diào)查表沒有固定的格式,內(nèi)容的繁簡、提問和回答的方式應(yīng)服從于調(diào)查的目的,并適應(yīng)于整理和分析資料的要求?,F(xiàn)在普遍采用的格式是把擬收集的數(shù)據(jù)項目用恰當(dāng)?shù)拇朐~構(gòu)成一系列的問題。
調(diào)查表的主要內(nèi)容分為兩類。一是一般性項目或叫識別項目,包括姓名、性別、年齡、出生年月、出生地、文化程度、民族、職業(yè)、工作單位、現(xiàn)住址等。另一部分即調(diào)查研究項目或叫研究變量。這是調(diào)查研究的實質(zhì)部分。編寫這部分內(nèi)容時應(yīng)注意以下幾項原則:
(1)措詞要準(zhǔn)確、簡練、通俗易懂、易于回答,盡可能不用專業(yè)術(shù)語,避免引起被調(diào)查者的誤解或不同理解。
(2)與本次調(diào)查有關(guān)的項目一項也不能缺,而與本次調(diào)查無關(guān)的項目一項也不應(yīng)有。
(3)問題按邏輯順序和心理反應(yīng)排列,先易后難,先一般后隱私。不能遺漏可能的答案。例如詢問“你愛吃酸還是愛吃辣”,如果供選擇的答案只有“愛吃酸”和“愛吃辣”兩項,則漏了“酸辣都愛吃”“和酸辣都不愛吃”兩種答案。正確的設(shè)計應(yīng)列出全部四種答案。
(4)盡量獲取客觀和定量的指標(biāo)。例如詢問“你吃水果是經(jīng)常吃、不常吃還是偶爾吃”,不如問“你每月吃多少水果?21斤以上,11~20斤,10斤及以下”更好些。
調(diào)查表中提問的方式主要分“封閉式”和“開放式”兩種?!胺忾]式”即在問題后列出若干互斥的備選答案,供被調(diào)查者選定其中的一個。答案的范圍相當(dāng)于測量的尺度?!伴_放式”指年齡、出生日期、吸煙支數(shù)等一些不能明確限定答案尺度的問題。有時也可將兩種方式結(jié)合起來提問。
準(zhǔn)備用計算機(jī)處理的調(diào)查表,常在每項數(shù)據(jù)后留出編碼用方框以便于編碼輸機(jī)。
一般說,一個完善的調(diào)查表并不是一次就可以擬就的。如有可能,最好做幾次包括設(shè)計人員參加的預(yù)調(diào)查,須幾經(jīng)試用和修改方可臻完善。
7.對調(diào)查員的要求 對調(diào)查員的最基本要求是實事求是的科學(xué)工作態(tài)度和高度的責(zé)任心。調(diào)查員要有一定的文化水平,但是并非醫(yī)學(xué)水平越高的人越適于做調(diào)查工作。相反,有醫(yī)學(xué)知識的人易于摻入自己的假設(shè)和看法,調(diào)查時易于誘導(dǎo)性地提問題而產(chǎn)生信息上的偏倚。從這個意義上講,倒不如非醫(yī)務(wù)人員調(diào)查更客觀。對調(diào)查員應(yīng)經(jīng)過嚴(yán)格的培訓(xùn)和考核再決定取舍。
(四)普查、篩檢及抽樣調(diào)查
1.普查和篩檢 現(xiàn)況調(diào)查若是為了早期診斷、治療病人,在特定時間、特定范圍內(nèi)進(jìn)行全面調(diào)查稱為普查(censns)。特定時間應(yīng)當(dāng)較短,甚至指某時點。特定范圍指某個地區(qū)或具有某種特征的人群。
普查的目的除了早期發(fā)現(xiàn)和治療病人之外(如各地開展宮頸癌的普查),有時還是為了了解疾病和健康狀況的分布而進(jìn)行的。前者如了解血吸蟲病、高血壓病、冠心病等的分布;后者如對兒童發(fā)育、營養(yǎng)的調(diào)查等。
普查不適用于發(fā)病率很低或無簡易診斷手段的疾病。因是橫斷面調(diào)查,故一般只能獲得陽性率或現(xiàn)患率而得不到發(fā)病率資料。同時,還應(yīng)注意普查的成本和收益問題。如過去用拍胸部小于X線片來普查肺結(jié)核,成本高、收益少,現(xiàn)已不再使用。
篩檢(screening)的目的主要是為了早期發(fā)現(xiàn)可疑患者,以便能進(jìn)一步確診,達(dá)到早期治療的目的。篩檢實際可看做普查過程中一個較早的組成部分。其方法及評價見第五章。
2.抽樣調(diào)查 如果現(xiàn)況調(diào)查的目的是為了查明現(xiàn)患情況或當(dāng)前某病的流行強(qiáng)度,則可用抽樣辦法進(jìn)行調(diào)查,即抽樣調(diào)查。例如我們要研究某個地區(qū)某病現(xiàn)患率,該目標(biāo)地區(qū)的總體人群即目標(biāo)人群(target population)或叫抽樣框架(sampling frame),按統(tǒng)計學(xué)原則從其中抽取部分人作為調(diào)查對象,即樣本人群或研究人群(study population)。然后,可根據(jù)樣本人群的結(jié)果推斷目標(biāo)人群的現(xiàn)患率。
抽樣調(diào)查比普查費用少、速度快、覆蓋面大、正確性高。
抽樣調(diào)查的缺點是不適用于患病率低的疾病,不適用于個體間變異過大的資料,并且設(shè)計、實施和資料的分析均較復(fù)雜。
抽樣必須隨機(jī)化,樣本必須足夠大,這兩點是抽樣調(diào)查的基本原則。
(1)抽樣方法:目前在流行病學(xué)調(diào)查中使用的抽樣方法有單純隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣和多級抽樣。在現(xiàn)況調(diào)查中,后三種方法較常用。
1)單純隨機(jī)抽樣(simple random sampling):這種方法的基本原則是每個抽樣單元被抽中選入樣本的機(jī)會是相等的。簡便、易行的科學(xué)分組方法是利用隨機(jī)數(shù)字表。抽簽、抓鬮的方法嚴(yán)格地說不能達(dá)到完全隨機(jī)化,但因其簡單、實用,小范圍的抽樣仍可使用。簡單隨機(jī)抽樣首先要有一份所有研究對象排列成序的編號名單,再用隨機(jī)的方法選出進(jìn)入樣本的號碼,已經(jīng)入選的號碼一般不能再次列入,直至達(dá)到預(yù)定的樣本含量為止。
單純隨機(jī)抽樣的優(yōu)點是簡便易行。其缺點是在抽樣范圍較大時,工作量太大難以采用;以及抽樣比例較小而樣本含量較小時,所得樣本代表性差。
2)系統(tǒng)抽樣(systematic sampling):此法是按照一定順序,機(jī)械地每隔一定數(shù)量的單位抽取一個單位進(jìn)入樣本。每次抽樣的起點必須是隨機(jī)的,這樣系統(tǒng)抽樣才是一種隨機(jī)抽樣的方法。例如,擬選一個5%的樣本(即抽樣比為1/20),可先從1~20間隨機(jī)選一個數(shù),設(shè)為14,這就是選出的起點,再加上20,得34,34加20得54,……。這樣,14,34,54,74,94就是第一個100號中入選的數(shù)字,以后依次類推。
系統(tǒng)抽樣代表性較好,但必須事先對總體的結(jié)構(gòu)有所了解才能恰當(dāng)?shù)貞?yīng)用。
3)分層抽樣(stratified sampling):這是從分布不均勻的研究人群中抽取有代表性樣本的方法。先按照某些人口學(xué)特征或某些標(biāo)志(如年齡、性別、住址、職業(yè)、教育程度、民族等)將研究人群分為若干組(統(tǒng)計學(xué)上稱為層),然后從每層抽取一個隨機(jī)樣本。分層抽樣又分為兩類:一類叫按比例分配分層隨機(jī)抽樣,即各層內(nèi)抽樣比例相同;另一類叫最優(yōu)分配分層隨機(jī)抽樣,即各層抽樣比例不同,內(nèi)部變異小的層抽樣比例小,內(nèi)部變異大的層抽樣比例大,此時獲得的樣本均數(shù)或樣本率的方差最小。
分層抽樣要求層內(nèi)變異越小越好,層間變異越大越好,因而可以提高每層的精確度,而且便于層間進(jìn)行比較。
4)整群抽樣(cluster sampling):抽樣單位不是個體而是群體,如居民區(qū)、班級、連隊、鄉(xiāng)、村、縣、工廠、學(xué)校等。然后用以上幾種方法從相同類型的群體中隨機(jī)抽樣。抽到的樣本包括若干個群體,對群體內(nèi)所有個體均給以調(diào)查。群內(nèi)個體數(shù)可以相等,也可以不等。
這種方法的優(yōu)點是,在實際工作中易為群眾所接受,抽樣和調(diào)查均比較方便,還可節(jié)約人力、物力和時間,因而適于大規(guī)模調(diào)查。但整群抽樣要求群間的變異越小越好,否則抽樣誤差較大,不能提供總體的可靠信息。
5)兩級或多級抽樣(two-stage or multi-stage sampling):這是大型調(diào)查時常用的一種抽樣方法。從總體中先抽取范圍較大的單元,稱為一級抽樣單元(例如縣、市),再從抽中的一級單元中抽取范圍較小的二級單元(如區(qū)、街),這就是兩級抽樣。還可依次再抽取范圍更小的單元,即為多級抽樣。
多級抽樣常與上述各種基本抽樣方法結(jié)合使用。
(2)樣本含量
1)對均數(shù)做抽樣調(diào)查時的樣本含量公式:
n=(uaσ/δ)2(式3-1)
式中n為樣本含量,uα為正態(tài)分布中自左至右的累積概率為σ/2時的u值(如u0.05=1.960,u0.01=2.576),σ是標(biāo)準(zhǔn)差,δ是允許誤差。也可用如下公式:
n= (tas/δ)2(式3-2)
式中s為樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差σ,以t分布中的tα代替正態(tài)分布中的uα。當(dāng)樣本含量n