蘭德趨勢根據多年市場研究經驗的積累,總是能夠為客戶選擇出最有效和最經濟的抽樣方法,并保證抽樣的科學性與操作可行性最大限度的結合。
蘭德趨勢采用嚴格的抽樣程序,在充分研究客戶調研需求、確定訪問技術個圈定調查對象的基礎上,制定科學的抽樣方法。根據抽樣理論,蘭德趨勢通常采用的抽樣方法包括概率抽樣方法和非概率抽樣方法。
蘭德趨勢公司經過十余年的積累,已經擁有了不同領域、不同專業、不同級別的抽樣樣本框,這些樣本框為提高抽樣準確性和有效性奠定了基礎。
抽樣是市場調查執行中重要的環節,抽樣方法選擇的正確與否直接決定著調查數據的可靠程度,同時也就決定了調查的成敗。因此,蘭德趨勢總是把抽樣作為調查中十分重要的環節對待,力爭最大限度保證抽樣的合理性和科學性。
正確的抽樣必須來自對抽樣概念的正確理解,下面簡單介紹與抽樣相關的基本術語,同時也便于我們尊敬客戶的理解。
總體或全域,是指在市場調查中能提供所需信息的個人或者群體的全體。通常,在調查之前分析人員的首要任務是定義同質總體,并常常涉及到與之密切相關的產品和服務目標市場的界定。
為總體下定義是抽樣調查中關鍵的一步,為達到市場研究目的,我們在定義調查"總體"時常常基于已有的和潛在的顧客特征。
普查這一概念用于描述獲取總體中每個成員的信息。市場調研中并不經常用到普查,因為其同質總體一般情況下包括成千上萬的個體,這樣大規模地進行普查在成本和時間上的耗費都是巨大的,以致于在通常情況下是不可行的。
統計學理論證明:一個相對較小、但精心選擇的樣本群能準確地反映出被抽查總體的特征,一個樣本是總體所有成員的一個子集,從子集獲得的有關信息,可以用來估測總體特征,這種方法就是抽樣調查。
蘭德趨勢如果需要完成一個具有可操作性的抽樣計劃大致需要下列步驟,如下所示。
為了滿足市場研究目標,確定可提供信息或與所需信息有關的個體或實體(所具有的特性是十分重要的。抽樣總體可以從以下幾方面特征進行描述:地域特征、人口統計學的特征、產品或服務使用情況、認知程度等。在調查中,從調查問卷開始部分的過濾性問題,可以看出某個體是否屬于總體。在實際應用中,即使有總體和樣本清單,但仍有必要使用過濾性問題識別合格的被訪問者。
另外,為了確定總體,通常情況下,還需要確定那些應排除在外的被訪問者的特征。例如,大部分商業市場調查就因為一些所謂的安全性問題而排除某些個體。通常,調查問卷上的第一個問題就是詢問采訪對象或其家庭成員是否從事市場調查、廣告或生產與調查內容有關產品的工作,如果采訪對象指出他們從事其中某項工作,那么就不必要去采訪他了,這就是所說的安全性問題,因為這樣的采訪對象不保險。他們也許是競爭對手或為競爭對手服務的。
正如調查方法部分所描述的那樣,資料收集方式對抽樣過程有重要影響。例如,電話采訪有一種內在優勢,購物中心攔截顧客有著自身的劣勢。
蘭德趨勢把抽樣框定義為被調查總體的數據清單(數據庫或者數據倉),從抽樣框中可以抽出適合訪問的樣本單位。蘭德趨勢經過多年的積累,已經擁有了適合不同調查領域的抽樣框,這些抽樣框,可以部分地滿足一些常規性調查的需要。眾所周知,一些抽樣框原來根本是不存在的,因此,在調查的初期還要建立符合需要的抽樣框。
制定抽樣計劃的第四步是選擇抽樣方法。選擇哪種抽樣方法取決于研究目的、研究經費、時間限制、需調查問題的性質等。可供選擇的重要抽樣方法可以分為兩大類:概率抽樣與非概率抽樣,每大類中又有許多可供選擇的具體方法。
一旦選定抽樣方法,下一步就要確定合適的樣本量。樣本量的確定方法將在樣本量確定單元中給出。
無論使用概率或非概率抽樣,在一個研究項目的資料收集階段必須指定和明確選擇樣本單位的操作程序。對于成功的概率抽樣的來說,這個程序更為重要,必須詳細、清晰。若不能知道合適的選擇樣本單位的操作程序,則整個抽樣程序會陷入困境。
在實施適于操作的抽樣計劃前,應先對其進行討論研究。這一步很重要,它包括檢查、確定是否要根據擬好的詳細程序來實施計劃。
確定樣本的數量是抽樣調查中的重要環節,在充分滿足調查內容要求情況下合理的確定樣本量不能不說是擺在每個調查公司面前的重要課題,過多的樣本量設計只會給客戶增加經濟負擔,對蘭德趨勢來講,我們確定樣本量的原則是:一是達到調查目的,二是為客戶節省經費。
概率抽樣的基本原則是:樣本量越大,抽樣誤差就越小,而樣本量越大,成本就越高。根據數理統計規律,樣本量增加呈直線遞增的情況下(樣本量增加一倍,成本也增加一倍),而抽樣誤差只是樣本量相對增長速度的平方根遞減。因此,樣本量的設計并不是越大越好,通常會受到經濟條件的制約。
通常,在概率抽樣的情況下,蘭德趨勢在確定樣本量時會遇到如下情況:
預算:預算的多少直接影響著調查樣本量的設計,通常某一項調查為滿足調查要求必須有一個最低的預算指標。如果低于這個指標的預算,不能滿足調查最低精度的話,蘭德趨勢建議要放棄這項調查任務。
經驗:一些客戶會經常要求調查公司完成200、300、400等特定的樣本量。這種樣本量確定的方法一方面可能考慮了調查誤差,另一方面也可能是憑著以前的調查經驗。在這種情況下,如果蘭德趨勢認為樣本量的設計不能滿足精度要求的時候,我們的項目經理會建議所需要增加的樣本量,否則調查的結果會出現偏差。
子群分析:在任何樣本量確定的過程中,都必須考慮被調查樣本的子群數。也就是說,當被調查樣本群子群數比較多的時候,樣本量就必須相應擴大。如:某一項調查400個樣本量是基本滿足要求的,但如果將這些樣本量劃分為男和女各占50%的話,那么,每個子群只有200個樣本。如果進一步按年齡組細分的話,假設是兩個年齡組,那每一個子群只有100個樣本,這樣的樣本量就不能滿足最初設計的要求了,因此必須按照子群要求設計樣本量則是最合理的。
統計分析:蘭德趨勢在確定樣本量時通常在考慮上述具體情況下,會考慮如下統計方面的因素,即:總體調查標準差;抽樣允許的誤差和預期置信度。
樣本量確定公式:在充分考慮所有統計因素基礎上,蘭德趨勢通常采用的簡單隨機抽樣(特別是估計平均值時)的公式為:
在解決"比例"方面的調查問題時,蘭德趨勢所采用的抽樣公式為:
定量市場調查中的概率抽樣是指在調查總體樣本中的每個單位都具有同等可能性被抽中的機會。在實際應用中,概率抽樣方法是蘭德趨勢最常用的方法之一。
簡單隨機抽樣是一種廣為使用的概率抽樣方法。是最完全的概率抽樣。如前面提到的,隨機抽樣就是總體中每個單位在抽選時有相等的被抽中的機會。
在簡單隨機抽樣條件下,抽樣概率公式為:
抽樣概率=樣本單位數ㄍ總體單位數
例如,如果總體單位數為10000,樣本單位數為400,那么抽樣概率為4%。
在定量抽樣調查中,等距抽樣常常代替簡單隨機抽樣。由于該抽樣方法簡單實用,所以應用普遍。等距抽樣得到的樣本幾乎與簡單隨機抽樣得到的樣本是相同的。
等距抽樣的基本做法是,將總體中的各單元先按一定的順序排列、編號,然后決定一個間隔,并在此間隔基礎上選擇被調查的單位個體。
樣本距離可通過下面公式確定:
樣本距離=總體單位數ㄍ樣本單位數
例如,假設你使用本地電話本并確定樣本距離為100,那么100個中取1個組成樣本。這個公式保證了整個列表的完整性。
等距抽樣方式隨意用一個起點,例如,如果你把一本電話本作為抽樣框,必須隨意取出一個號碼決定從該頁開始翻閱。假設從第5頁開始,在該頁上再另選一個數決定從該行開始。假定選擇從第3行開始,這就決定了實際開始的位置。
定量調查中的分層抽樣是一種卓越的概率抽樣方式,在蘭德趨勢以往的調查中經常被使用。
分層抽樣的具體程序是:把總體各單位分成兩個或兩個以上的相互獨立的完全的組(如男性和女性),從兩個或兩個以上的組中進行簡單隨機抽樣,樣本相互獨立。
分層抽樣與簡單隨機抽樣相比,我們往往選擇分層抽樣,因為它有顯著的潛在統計效果。也就是說,如果我們從相同的總體中抽取兩個樣本,一個是分層樣本,另一個是簡單隨機抽樣樣本,那么相對來說,分層樣本的誤差更小些。另一方面,如果目標是獲得一個確定的抽樣誤差水平,那么更小的分層樣本將達到這一目標。
以上各種抽樣類型全部是按單位抽取的,即按樣本單位數,分別一個單位一個單位地抽取。在整群抽樣中,樣本是一組單位一組單位地抽取。
整群抽樣有兩個關鍵步驟:
» 同質總體被分為相互獨立的完全的較小子集。
» 隨機抽選子集構成樣本。
如果調查者在抽中的子集中觀察全部單位,我們就有了一級整群樣本。如果在抽中的子集中再以概率方式抽取部分單位觀察,我們就有了二級整群樣本。分層和整群抽樣都要將總體分為相互獨立的完全子集。它們的區別是,分層抽樣的樣本是從每個子集中抽取,而整群抽樣則是抽取部分子集。
地理區域抽樣是整群抽樣的典型方式。挨門挨戶去調查一個特定城市的調查者也許會隨機抽選一些區域,較集中地訪查一些群體,大量減少訪問時間和經費。整群抽樣被認為是概率抽樣技術,因為它隨機抽出群和隨機抽出單位。值得注意的是,在整群抽樣下,我們假定群中單位與總體一樣存在異質性。如果一群中單位的特征非常相似,如果由于共同環境使群內差異小而群與群之間差異大。一般來說,要解決這個問題可以擴大群數,然后從各群中抽取少量單位數,以保證樣本的代表性。
非概率抽樣也是市場調查中比較常采用的手段之一,如配額抽樣等。非概率抽樣是指從總體中非隨機地選擇特定地要素(單位)。有目的的非隨機抽樣可能會系統地排除或過分強調總體的某些部分特征。
在實際工作中,我們經常使用的非概率抽樣方法包括四類:方便抽樣、判斷抽樣、配額抽樣和滾雪球抽樣。
方便抽樣是根據調查者的方便性,以無目標、隨意的方式進行的抽樣調查活動。例如,常見的無限制的街頭攔訪和隨意的入戶訪問就是方便抽樣的常見形式。在某些調查測試中,方便抽樣會取得快速有效的結果。在進行探索性調研時,即缺乏經驗而又急需真實數據的近似值時,這種方法也很實用。
判斷抽樣適用于調查員或者調查專家基于選擇標準或者條件抽取典型樣本的情況。一般商業機構進行的市場或產品測試調查基本上都屬于判斷抽樣的范圍。在進行探索性調研時,如抽取深度訪談樣本的情況下,就可以采用這種方法。
配額抽樣是根據一定標志對總體分層或分類后,從各層或各類中主觀地選取一定比例的調查單位的方法。所謂"配額"是指對劃分出的總體各類型都分配給一定的數量而組成調查樣本。因而,配額抽樣較之判斷抽樣加強了對樣本結構與總體結構在"量"的方面的質量控制,能夠保證樣本有較高的代表性。配額抽樣類似于隨機抽樣中的分層抽樣。不過,有兩點重要的區別:首先,配額抽樣的被調查者不是按隨機原則抽出來的,而分層抽樣必須遵守隨機原則。其次,在分層抽樣中,用于分類的標志,應聯系研究目標來選擇,而配額抽樣無此要求。
滾雪球抽樣是指先對隨機選擇的一些被調查者實施訪問,然后再請他們推薦屬于研究目標總體特征的調查對象。這種方法用于低發生率或少見的總體中進行抽樣,因為要找到這些少見的個體,代價是很大的,使得調查人員因為費用的原因不得不使用類似滾雪球這樣的抽樣技巧。
首先,任何調查所獲信息(調查數據)質量都存在誤差,而這種誤差在評估調查質量時都是必須的,作為調查管理者必須判斷這些結果的精度范圍。因此,這就需要仔細研究所使用的調研方法可能導致的誤差類型。
綜合市場調查理論和實踐經驗,蘭德趨勢對調查中出現的誤差做如下的概況。
抽樣過程中主要存在著以下兩類誤差:隨機誤差和系統誤差。有時也稱為偏差。調查中通常試圖對目標總體中具有代表性的一個側面進行調查而獲得信息。它旨在根據抽取樣本的調查結果而推測總體的情況。因此,即使樣本選擇過程是適當的,調查結果仍不免因偶然性而產生一定的誤差(隨機誤差或隨機抽樣誤差),這種誤差是不可避免的,它只能隨著抽樣規模的增加而減小。通常在樣本量設計時,我們可以以一定的置信水平來估計隨機抽樣的誤差。
2、系統誤差
系統誤差或偏差是指因調研設計或實施抽樣設計中的錯誤或問題而產生的誤差。如果抽樣的結果與我們根據被調查對象的真實值所做的估計值總是有一定的偏差(固定的偏高或偏低),則抽樣結果便很有可能存在系統誤差。系統誤差包括除隨機抽樣之外所有可能產生的誤差。因此,有時系統誤差又被稱為非抽樣誤差,從系統上影響抽樣調研的結果。非抽樣誤差分為樣本設計誤差和測量誤差。樣本設計誤差是因樣本設計或樣本抽選過程而產生的誤差。
樣本設計誤差的產生有多種原因:
抽樣框誤差——抽樣框是指對于某一類人口類型和成員的一個總體清單。樣本將從這個總體清單中加以選取。抽樣框誤差便是因不準確或不完整的抽樣框而引起的誤差。問題是,從包含抽樣誤差的抽樣框中抽取的樣本有時無法正確地代表調研目標的實際情況,這就存在抽樣框誤差。舉個例子,以電話號碼薄作為抽樣框,在對某地區所有住戶進行的某種意向調查時,就存在著抽樣框誤差。
調研對象范圍誤差——調研對象范圍誤差是因為對調研對象范圍限定的不準確而引起的誤差。例如將某項研究對象限定在35歲以上,后來發現不少35歲以下的年輕人也應該包含在這個研究之中,即當初的限定范圍是不正確的,這樣的抽樣便產生了誤差。
選樣誤差——即使抽樣框的組建與調研對象范圍的確定都沒有什么問題,抽樣誤差也有可能發生。抽選誤差是因為不完整或不恰當的抽選過程,或者正確的抽選過程未得以恰當的執行而產生的誤差。例如在入戶調查時,訪問員會因為不同的原因繞開被認為是"不友好的"住戶,這樣的話便會產生選樣誤差。特別是在非隨機抽樣中,選樣誤差是一個更為嚴重的問題。
測量誤差對于抽樣調查的準確性來說,比隨機誤差更具危害性。在許多調查報告中,包括媒介上發布公眾意向調查,都會給出一個誤差指數。對很多調研報告使用者來說,一般認為這個指數是針對總體誤差而言,其實并非如此。這個數字僅代表隨機抽樣誤差,它并不包括樣本設計誤差,也沒有涉及調研結果中的測量誤差。
測量誤差是指所獲得的原始信息(實際價值)與經測量處理的信息之間的差異。在信息處理過程中會因多種因素而產生測量誤差。
替代信息誤差——是指實際所需的信息與調研者所收集信息之間的差距而產生的誤差。這種誤差與調研設計的主要問題有關,特別是對一些問題不恰當定義而產生的。
調研員誤差——是指因調研員與被調研者之間的相互作用而引起的誤差。調研員有時會自覺或不自覺地影響被調研者,使之給出不真實或不準確的回答。
測量工具誤差——測量工具誤差是指因測量工具或問卷而產生的誤差。這種誤差是由于所提出的問題或問卷設計中的某些因素而導致回答的偏差或者使回答時容易產生錯誤。這種類型的錯誤能夠通過細致的問卷修改和在實地調研前進行充分的試調查而加以避免。
數據處理誤差——主要是指調研資料或調研數據在向計算機輸入過程中所產生的誤差。例如,在計算機輔助電話訪談中,訪問員可能錯誤地輸入某個問題的答案。這類錯誤可以通過在數據錄入以及調研結果處理過程中嚴格的質量控制加以避免。
拒訪誤差——如果從某個特定群體中抽選400個樣本,理想的情況是對這400個樣本都進行調查。而在實際中,這是很難實現的。比如在郵寄調研中,回答率一般在5%左右,甚至更低。因這種差異而引起的誤差被稱為"拒訪誤差"。很明顯,回答率越高,拒訪誤差的影響便越小,因為拒訪者在總體中占的比例減小了。
拒訪誤差在以下三種情況下發生:①在特定時間無法聯系到被訪者;②雖然得到了默許,但在當時的環境下不能或不愿意接受訪談;③雖然能夠聯系到被訪者,但被訪者拒絕接受訪問。其中,最后一種情況最為嚴重。因為,前兩種情況都有重新進行調研的可能。現在,拒訪率已經達到了前所未有的水平,大約近40%。好在大部分人并非在所有情況下都拒絕訪問。
回答誤差——如果被訪問者在某一特定問題的回答中有特定的偏向,則產生回答誤差。回答誤差的產生有兩種基本的形式:有意錯誤與無意錯誤。有意錯誤的產生是因為被調查者故意對所提問題做出不真實回答;無意錯誤是指回答者希望能夠做出真實、準確的回答,但卻給出了不正確的答案。這種類型的誤差可能是由于問題的格式、內容或其他原因造成的。