民調

將四千個紅球、六千個白球倒入桶子,徹底攪拌均勻,再隨機取出一百個球,請問紅、白球比例應為多少?
由於球已被攪拌均勻,比例應趨近46
如果隨機取出一千個球呢?
比例更趨近46,誤差大概只有千分之幾。

如果換個前提:四千個紅球與六千個白球,同時由桶子的左邊與右邊倒入,之後沒有攪拌,然後第一次就取出一千個球,請問紅、白球比例各為多少?
猜得到答案嗎?
有點頭腦的人都會反問:取球的地點在哪裡?
如果固定從桶子的左邊取球,紅球的比例必定遠遠高於白球;反之,如果固定從桶子的右邊取球,白球的比例則會遠遠高於紅球。
這時「樣本」的紅、白球比例——46完全失去了意義。

從以上兩個例子可知,民調準或不準,「樣本的數目」是次要的,真正的關鍵在「取樣是否均勻」!
同意上述觀點嗎?
如果不同意,後述文章就不必看了,因為看了也是白看。
如果同意,請接著思考:如何取樣均勻?

現今民調機構大多透過電話,無論是手機或座機,打久了、問多了,稍微有點悟性的民調員必能體會:什麼時間、打什麼電話、打哪一區電話、使用什麼語言、問什麼問題……,對哪一組候選人有利。
這還是民調機構誠實記錄訪談結果的狀況。
如果不誠實,把民調當成文宣處理呢?
例如去年九合一選舉,三立的封關民調顯示民進黨參選人在新北、台中、高雄領先1%11%,以及3%。投票結果呢?侯友宜、盧秀燕、韓國瑜,分別以15%14%,以及9%的差距擊敗綠營對手。
台灣民調,到底還有多少代表性?

或許你想反問:若不採用電話民調,如何取樣才會均勻?
我概略想了想,例如民調員在不同地區(台北、新竹、台南、高雄……),不同時段(上班、下班),不同場合(車站、傳統市場、辦公區、鬧區、住宅區),隨機碰上路人便問:如果此刻就是選舉,你支持誰?
問題不要太多,問多了除了浪費時間,也容易引人反感。
果真有這種民調,每個民調員只要訪問三、五十位隨機碰上的路人,全省加起來七、八百位,應該就有它的代表性。

最後想奉勸各民調機構,公布民調結果之前,請先告訴民眾一個「取樣均勻」的方法。
未必是本文所說的方法,總之是一個讓人信服的方法。
取樣如果均勻,兩、三百人也有一定的代表性。
取樣如果不均勻,兩、三萬人也無法證明什麼。