91网国产尤物在线观看,免费爱爱视频

文章分類選擇

電腦辦公平面設(shè)計室內(nèi)設(shè)計室外設(shè)計機械設(shè)計工業(yè)自動化影視動畫程序開發(fā) 網(wǎng)頁設(shè)計會計課程興趣成長 AIGC

相關(guān)推薦

您可能對下面課程感興趣

如何處理和分析問卷數(shù)據(jù)？

發(fā)布時間:2022-01-14 09:59 [ 我要自學(xué)網(wǎng)原創(chuàng) ] 發(fā)布人: 小劉2175 閱讀: 20172

問卷調(diào)查作為最常用的社會研究方法之一，廣泛的應(yīng)用到各個類型的用戶調(diào)研項目中。經(jīng)歷了問卷設(shè)計這第一道關(guān)卡后，面對回收后的大量數(shù)據(jù)，你是否也有以下的困惑

回收后的數(shù)據(jù)是真實的嗎？
用什么工具處理問卷數(shù)據(jù)最高效？
如何分析和解讀問卷數(shù)據(jù)？

你將從本文有如下收獲

問卷數(shù)據(jù)處理需要的工具
問卷數(shù)據(jù)清洗常用思路
問卷數(shù)據(jù)分析常用維度
問卷數(shù)據(jù)解讀常用維度

本文整體結(jié)構(gòu)

如何處理和分析問卷數(shù)據(jù)？來看京東設(shè)計師的實戰(zhàn)經(jīng)驗！

工具：該用什么來處理數(shù)據(jù)？

其實進行基礎(chǔ)的描述性統(tǒng)計與交叉分析時，Excel 和 Spss 這兩款工具都有相對應(yīng)的功能可以實現(xiàn)，大家可以根據(jù)平時的使用習(xí)慣自行選擇。

在實際工作中，這兩個工具常結(jié)合起來使用。Spss 的優(yōu)勢在于，兩個視圖查看數(shù)據(jù)比較方便、可以撰寫語法來實現(xiàn)數(shù)據(jù)批量處理；Excel 的優(yōu)勢在于，圖表的可視化更豐富、更改圖表外觀非常便捷。因此，通常先使用 Spss 來進行數(shù)據(jù)清洗和分析，再導(dǎo)出到 Excel 中對圖表的格式進行編輯。

清洗：如何對數(shù)據(jù)進行清洗？

線上問卷投放成本低、回收時效高，但由于難以監(jiān)控用戶填答的過程，致使問卷中常隱藏著一些不真實的數(shù)據(jù)，因此，回收問卷后的第一步，就是給數(shù)據(jù)做清洗以保證數(shù)據(jù)盡可能的真實有效。數(shù)據(jù)清洗包含三個方面，其一，規(guī)范數(shù)據(jù)視圖（主要針對 Spss）；其二，清理無效樣本。其三，對特殊題型進行處理。

1. 數(shù)據(jù)視圖規(guī)范化

數(shù)據(jù)視圖規(guī)范化是一個經(jīng)常被忽視的環(huán)節(jié)，雖然它不對數(shù)據(jù)結(jié)果產(chǎn)生直接的影響，但是前期對數(shù)據(jù)視圖做好規(guī)范化處理有利于減少后續(xù)數(shù)據(jù)分析、語法撰寫出現(xiàn)失誤的概率，也就是說，它是一個微小、但卻可以提升工作效率的步驟。那么，如何對 Spss 的數(shù)據(jù)視圖進行規(guī)范化呢？

由于 Spss 中的變量視圖與數(shù)據(jù)視圖相關(guān)聯(lián)，因此只需對變量視圖的 11 列逐一進行調(diào)整、規(guī)范化即可。具體參考步驟如下

名稱：將名稱列與原始問卷中的編碼進行一一對照，檢查是否有誤
類型：將類型列與原始問卷中的題型進行一一對照，選擇題需為數(shù)字、填空題需為字符串
寬度：將同類題型變量取值所占有的寬度調(diào)成一致以方便后續(xù)查看
小數(shù)：根據(jù)題型進行調(diào)整，選擇題的小數(shù)需為零，填空題的小數(shù)依據(jù)題目具體分析
標(biāo)簽：將標(biāo)簽調(diào)整成直觀易懂的描述；將名稱列合并到標(biāo)簽列中以便后續(xù)查看
值：將值列與原始問卷中的選項進行比較，檢查是否有誤
缺失：邏輯跳轉(zhuǎn)題的“未選擇”會被計為零值，不利于后續(xù)的交叉分析；可對照原始問卷中的邏輯跳轉(zhuǎn)設(shè)置，將該跳轉(zhuǎn)題零值剔除（對于缺失值的處理，因問卷系統(tǒng)不同而有差異，此處以京東 limesurvey 為例）
列：將同類題型的數(shù)據(jù)視圖中的列寬調(diào)成一致以方便后續(xù)查看
對齊：將數(shù)字類型右對齊、字符串類型左對齊
測量：將定類變量設(shè)置成名義；將定序變量設(shè)置成有序；將定距定比變量設(shè)置成標(biāo)度
角色：一般系統(tǒng)默認(rèn)為為輸入，代表自變量

如何處理和分析問卷數(shù)據(jù)？來看京東設(shè)計師的實戰(zhàn)經(jīng)驗！

△ 變量視圖規(guī)范化可參考此示意圖

2. 清理無效樣本

清理無效樣本遵循兩個原則，從整體到部分、從一維到二維。

首先，對問卷樣本整體進行處理。

根據(jù)填答完整性處理

首先需要剔除未完整填答必答題的樣本，即未完整填答問卷的樣本。其次，為尊重用戶隱私，我們會將一些敏感問題設(shè)置為非必答題，這時可以根據(jù)項目需求來決定是否需要剔除非必答題未完整填答的樣本

根據(jù)提交時間處理

提交問卷的時間同樣重要，有時正式投放問卷前，調(diào)研員會對問卷進行測試填答，有時樣本填答問卷的日期超出了計劃日期，因此需要剔除問卷提交時間早于和晚于問卷投放時間的樣本

根據(jù)填答時間處理

填答問卷時長過短或過多的樣本均被視為無效樣本，因此我們需要剔除少于最低填答時間（一般情況下，填答每道問題需要 5 秒，因此最低填答時間即為 5 秒*題目數(shù)量）和填答時間過長（一般情況下，問卷填答時間不超過 30 分鐘）的樣本

其次，對問卷各部分進行處理。

通常情況下，問卷設(shè)計會分為三部分。

甄別部分：此部分會設(shè)置一些題目來甄別參與問卷調(diào)查的用戶是否為我們的目標(biāo)樣本

主體部分：此部分會根據(jù)項目的研究內(nèi)容測量用戶行為、用戶態(tài)度

屬性部分：此部分會獲取用戶的人口屬性（人口屬性（性別、年齡、婚姻、城市）、社會屬性（學(xué)歷、職位、個人月收入、家庭月收入）以便做用戶畫像

甄別部分處理

剔除不符合甄別條件的樣本。根據(jù)項目需求，問卷中可能會設(shè)置一些甄別調(diào)研目標(biāo)用戶的題目，如擬對使用過某產(chǎn)品的用戶進行問卷調(diào)查，那么在問卷設(shè)計時則會用一道甄別題來詢問“您是否使用過該產(chǎn)品”，若該用戶選擇“否”，則需要剔除這類不符合甄別條件的樣本

主體部分處理

剔除連續(xù)性回答樣本。連續(xù)性回答有兩種情況，其一，選擇同一選項過多：如該問卷有 30 道題，但某樣本選擇 A 選項有 25 道題，則將該樣本視為連續(xù)性回答樣本，需剔除；其二，填答呈現(xiàn)某種規(guī)律性：如某樣本在填答中呈現(xiàn)“A-B-A-B”或”A-B-C-D”等某種規(guī)律，則被視為規(guī)律性填答的樣本，需剔除

剔除不符合固定填答邏輯的樣本。在問卷設(shè)計中，有一類題組前后兩道題（幾道題）有關(guān)聯(lián)的邏輯，如選擇前一道題 A 的人不能選擇后一道題的 B，此時則需要剔除互斥題矛盾的樣本

剔除未通過陷阱題的樣本。為了確認(rèn)用戶是有在認(rèn)真填答問卷，有時會在問卷主體部分穿插一道“常識題“，如”中國的首都是哪里“，若用戶選擇非北京的城市，則會把該樣本剔除

屬性部分處理

各個屬性題組的內(nèi)部數(shù)據(jù)清理，剔除人口屬性、社會屬性、站內(nèi)屬性三個屬性題組內(nèi)部數(shù)據(jù)存在矛盾的樣本。如人口屬性內(nèi)部（性別、年齡、婚姻、城市），年齡與婚姻可能存在矛盾，20 歲以下的女子、22 歲以下的男子婚姻狀態(tài)不能為已婚；社會屬性內(nèi)部（學(xué)歷、職業(yè)、個人月收入、家庭月收入），個人月收入不能大于家庭月收入

各個屬性題組間的數(shù)據(jù)清理，將人口屬性、社會屬性、站內(nèi)屬性進行兩兩比較，剔除題組間數(shù)據(jù)存在矛盾的樣本。如人口屬性的年齡與學(xué)歷之間可能存在矛盾，小于 18 歲的群體一般情況下不會擁有本碩博學(xué)歷

各個部分間處理

將問卷甄別部分、主體部分、屬性部分進行逐一比較，剔除各部分間數(shù)據(jù)存在矛盾的樣本。比較原則，將題目數(shù)量較少的部分與題目數(shù)量較多的部分進行比較。每一部分逐一比較雖然需要花費一定的時間，但為了確保樣本是真實有效的，這個步驟是必不可少的

3. 對特殊題型進行處理

問卷中時有一些文本題，如選擇題中的“其他，請注明”選項或填空題。

在處理文本題時，有兩種情況，其一，回碼，即當(dāng)文本題的填答內(nèi)容可量化或與原始選項可合并時，需將文本題的填答內(nèi)容轉(zhuǎn)置成可計算的數(shù)值，并刪除文本題的填答內(nèi)容。如某選擇題為“請問您使用過下列哪些網(wǎng)購平臺”，即便選項中有“京東”，但用戶沒有注意到該選項，而是在“其他，請注明”選項中填寫了“京東”，此時就需要對該樣本的填答情況進行回碼，將之納入到京東選項下，并刪除文本填答內(nèi)容。

其二，重新編碼，若文本題的填答內(nèi)容不可回碼，需要進行重新編碼，并記錄到編碼簿中。仍然以“請問您使用過下列哪些網(wǎng)購平臺”這道題為例，若用戶在“其他，請注明”中填寫了未在既有選項中出現(xiàn)的答案，則需要對該答案進行重新編碼，并做記錄。

分析：如何對問卷數(shù)據(jù)進行基礎(chǔ)分析？

1. 常用問卷數(shù)據(jù)分析與解讀維度

問卷數(shù)據(jù)分析時，最常使用的分析方法為頻數(shù)分析、描述分析、交叉分析。

頻數(shù)分析

總體頻數(shù)

拿到問卷數(shù)據(jù)后，首先可以將每道題各選項的頻數(shù)按降序排列，從而對數(shù)據(jù)分布趨勢有一個整體了解

數(shù)據(jù)解讀：了解用戶總體的行為、態(tài)度偏好

分組頻數(shù)

除觀察各選項的總體分布趨勢外，也可將具有相似特征的選項進行合并分組分析，從而獲得更宏觀維度上的數(shù)據(jù)解讀。以商品關(guān)注要素題目為例，瀏覽商品時關(guān)注的這 11 個要素可按降序排列，我們可以發(fā)現(xiàn)，用戶最關(guān)注品牌，其次為參數(shù)信息，對店鋪的關(guān)注最弱。但有時，我們不需要這么細(xì)致的分析維度，此時可以把這 11 個要素分組為商品層面和平臺層面，來觀察用戶更關(guān)注哪個層面，將各選項百分比加總后可以得出結(jié)論，瀏覽商品時，較平臺層面，用戶對商品層面更為關(guān)注。同時，還可以對每個維度內(nèi)的選項進行降序排列，從中可以得知，商品層面中，用戶對品牌的關(guān)注最強，對新品的關(guān)注最弱。

數(shù)據(jù)解讀：了解不同維度上的用戶行為、態(tài)度偏好

如何處理和分析問卷數(shù)據(jù)？來看京東設(shè)計師的實戰(zhàn)經(jīng)驗！

△ 頻數(shù)分析可參考此示意圖

描述性分析

常用于計算數(shù)值型的單變量統(tǒng)計量，主要包括以下三種類型的統(tǒng)計量。

描述集中趨勢的統(tǒng)計量

常用的統(tǒng)計量有均值、中位數(shù)、眾數(shù)、百分位數(shù)

描述離散程度的統(tǒng)計量

常用的統(tǒng)計量有樣本方差、樣本標(biāo)準(zhǔn)差、均值標(biāo)準(zhǔn)差、極差、離散系數(shù)

描述分布形態(tài)的統(tǒng)計量

常用的統(tǒng)計量有偏度和峰度

數(shù)據(jù)解讀：了解用戶行為、態(tài)度（數(shù)值型變量）的基本特征和整體分布形態(tài)，同時可為后續(xù)做更復(fù)雜的分析與建模做鋪墊

交叉分析

適用于對兩個及兩個以上變量之間的關(guān)系進行分析，從而得出更為立體的調(diào)研結(jié)論。

用戶屬性、用戶行為、用戶態(tài)度做交叉

如可以將用戶屬性進行拆分來觀測不同用戶屬性的數(shù)據(jù)分布與總體的差異，關(guān)注顯著高于和低于總體的數(shù)據(jù)。以商品關(guān)注要素題目為例，總體樣本中 71.6%的用戶在瀏覽商品時關(guān)注品牌，其中 81.4%男性關(guān)注品牌、61.8%的女性關(guān)注品牌，數(shù)據(jù)間有顯著差異，則需要關(guān)注品牌在用戶性別上的差異，并做出標(biāo)記。當(dāng)用戶屬性為定序變量時，可看行變量是否隨著用戶屬性的升序或降序呈現(xiàn)出某種趨勢，如隨著年齡的遞增，用戶越關(guān)注商品品牌。需要注意的是，當(dāng)行變量在用戶屬性上的數(shù)據(jù)差異較大時，應(yīng)對照用戶屬性的樣本量進行檢驗，若樣本量少于 30，數(shù)據(jù)差異的誤差可能較大

數(shù)據(jù)解讀：了解用戶屬性、行為、態(tài)度間的關(guān)系

如何處理和分析問卷數(shù)據(jù)？來看京東設(shè)計師的實戰(zhàn)經(jīng)驗！