跳到主要內容區塊

ntuccepaper2019

技術論壇

大數據收集與分析:臺大動態民意研究計畫
  • 卷期:v0058
  • 出版日期:2021-09-20

作者:許可欣/ 臺灣大學計算機及資訊網路中心程式設計組幹事


 

臺灣是一年到頭都有選舉的國家,民眾對於「民調」肯定不陌生。常見民調方式不外乎面訪或電話訪談,然而上述民調方法已面臨瓶頸,無法掌握如流水般隨時變化的民意;尤其新興的社群媒體越來越主導民意走向,如何自網路,特別是社群媒體中甄補具有一定代表性的樣本,如何解決網路樣本常為人詬病的「代表性」問題,皆將藉此研究探討。

 

眾測平台建構目的及重要性

現今歐美許多研究大量仰賴所謂的群眾外包(crowdsourcing,或所謂的「眾測」模式),針對入口網站或電商平台大量且特質各異的用戶,透過平臺發送研究問卷或施測項目,參與用戶花費少許時間完成此類小型的簡易人類智能工作(human intelligence tasks)以換取薄酬。其中最著名、使用最廣泛者莫過於美國最大電商亞馬遜(Amazon)旗下的Mechanical Turk (MTurk,「土耳其機器人」)。「土耳其機械人」的典故源於十八世紀流行於西歐地區,穿著土耳其服飾,會與人下棋的機器人。它們雖然號稱機器人,實際上卻是由真人在背後操縱。據估計,全球Amazon Mturk上活躍的MTurkers超過兩萬人次/每月,工作時間則由每日數分鐘至24小時不等。 其他大型資訊公司及電商,例如微軟、百度、樂天等,亦提供類似平台,供第三方委託者投放小型人類智能工作,並根據用戶在後台的註冊資料,協助招攬具特定代表性的樣本完成此類工作。此類平台的優點在於用戶廣泛,只要工作委託者給定抽樣條件,便能得到足夠數量的對應樣本進行施測,且委託者全程不需與受測者直接接觸,免除傳統面訪的諸許多不便與人身安全問題;其次,電商平台通常鼓勵委託者採購電商發行的商品抵用券作為受測者獎勵,除避免過程中委託者直接給付受測者現金帶來的研究倫理顧慮,更可與電商互蒙其利。這些皆是此類眾測平台受到當今研究者歡迎之處。
 

眾測平台架構及操作流程

然而,網購及入口網站均高度發達的臺灣尚無前述此類眾測平臺。研究者若欲透過網路尋找符合條件的樣本,就一些具國內特定性的議題(例如政黨傾向、防疫作為等)進行研究便十分受限。有鑒於此,社科院政治學系張佑宗教授主持之「臺大動態民意研究計畫」應運而生。 此計畫結合第三方問卷開發軟體(由臺大創創中心育成之Surveycake問卷軟體)、即時註冊/驗證之簡訊系統、Google Analytics分析工具、及計中網域資源,搭配隨機撥號(random digit dialing)電話、定點投放簡訊、網路廣告等多種招募方式,開發出屬於臺灣的第一個眾測問卷平台,並於今年7月正式上線。
平臺網頁:https://websurvey.coss.ntu.edu.tw/
臉書專頁:https://www.facebook.com/ntuwebsurvey


圖1. 平臺工作流程圖

 

潛在受測者在收到電話、簡訊邀約或點擊網路廣告後,經由置入連結被引導至問卷平台閱覽研究目的、個資保障政策等頁面。受測者若同意協助填答問卷,則再導至註冊頁輸入個資,亦可透過臉書帳號直接登入。上述資訊將被回傳至後台建檔,同時發送簡訊至受測者手機供驗證輸入。經驗證後,受測者正式登入問卷頁面填寫問卷,在完成並送出後,會再次告知受測者相關個資保障權益,並透過簡訊自動發送國內大型連鎖超商電子消費點數(統一集團的ibon或全家便利商店的famipoint)序號酬謝。過程中,研究人員不直接與受測者接觸,亦不涉及直接金錢給付。同時平台提供抽獎機制,透過加權抽樣程式確保問卷完成度高、未出現大幅前後答案不一的受測者有較高機率獲得額外高額獎品;透過定額獎勵及抽獎機制鼓勵受測者完整填答,並提高填答興趣。

圖2. 簡訊及網路廣告招攬方式

圖3. 註冊頁

圖4. 不同的註冊方式


圖5. 簡訊認證
 

平台上線狀況及遭遇問題

研究團隊成員表示,平台7月初正式上線時,經網路招攬的受測者瞬間大量湧至,迅速將初期測試的250份問卷及超商點數一掃而空。即使在公告測試活動「圓滿落幕」,已無點數可領取的情況下,兩天內的註冊人數仍超過2500人,也瞬間使平台登上臺灣區Google網頁高流量熱搜;但相關問題亦伴隨而來:在使用者方面,除因平台使用不順暢或質疑個資可能遭濫用的民眾來電來信關切外,亦有使用者不斷表達希望填寫額外問卷以換取多份超商點數;在平台建構方面,後台曾遭遇疑似SQL隱碼攻擊(SQL insertion attack),同時亦發現有同一人以多支手機重複註冊等情況。有待研究團隊逐步克服。
 

結語

平台自109年7月上線以來,透過多種招募管道募得之5000餘樣本已約略呈現年齡、性別、教育程度、職業別、黨派、及地域分布代表性等雛形,並已協助校內其他研究團隊測試過多份問卷,並送出超過3500超商點數作為填答報酬。在未來這一學期,研究團隊將爭取透過計中的email群發功能對校內師生教職員廣發邀請,徵集各方使用經驗,逐步完善平台功能。
計畫主持人張佑宗教授表示,此計畫長期目標是建立一個數量達3000人以上,對平台上問卷有高度填答興趣並具有各方面代表性的穩定樣本群。最終期望能藉由此平台克服當前執行民調所受限制,提供校內、乃至國內外學術社群一個具樣本代表性,可施測各類型研究問題的問卷研究工具,為跨領域研究貢獻一份心力。


圖6. 平台後端的GA顯示


圖7. 問卷完成度統計


圖8. 平台後端問卷計畫管理介面