數(shù)據(jù)可視化技術實例報告
一 問題描述:
目前數(shù)據(jù)可視化在為商務應用比較火,其實教育行業(yè)也有很多有價值的應用。 “未來的在數(shù)據(jù)可視化會更加強大,在于其能收集、分析、使用大量的數(shù)據(jù)。數(shù)據(jù)是對信息的記錄,數(shù)據(jù)的激增意味著人類的記錄范圍、測量范圍和分析范圍在不斷擴大,也意味著知識的邊界在不斷延伸。教育領域正在發(fā)生的這場革命,其深厚的技術背景就是由于信息技術的進步,人類收集、存貯、分析、使用數(shù)據(jù)的能力實現(xiàn)了巨大跨越”。
在教育行業(yè)中,通常要對某個學校或者對一個城市的教育水平進行評估,也可能對多個學校多個城市的教育水平進行比較。我們將要通過不同城市的不同學院,學生考試分數(shù)及學生餐飲情況等多個維度來制作儀表盤,通過分析,我們可以知道各城市在不同時期的教育水平狀況。
二 數(shù)據(jù)
網(wǎng)絡調(diào)查問卷呢(下載),此次調(diào)查問卷共有全國10000份的10級大學生的數(shù)據(jù),覆蓋從哈爾濱理工大學到吉林大學近1000所大學,數(shù)據(jù)信息包括學校名稱,學生的餐飲計劃,學生編號,學生類型,教師編號,考試分數(shù)以及科目,學生所在的經(jīng)度及緯度。將利用收集到的數(shù)據(jù)來進行分析。
學生所在城市包括北京、哈爾濱、長春、太原在內(nèi)的數(shù)十個省會城市。調(diào)研時間橫跨近半年,從2011年11月1日至2012年5月20日。餐飲計劃設計早午餐。學生類型包括本科生與旁聽生。主要調(diào)研科目是數(shù)學與閱讀,學生分數(shù)波動較大。
三 視化技術
由于Tableau這款軟件操作簡單易學,而且功能強大,計算迅速,而且還兼具文字云,回歸分析,時間序列等功能,而且有免費版本,我們小組決定使用Tableau來完成我們的設計。作為一款幫助使用者提升業(yè)務分析能力和業(yè)務洞察力的工具,能夠根據(jù)不同的業(yè)務需求,選用不同的視圖來更好的展現(xiàn)并分析數(shù)據(jù),因此在制作每一份分析報表時,布局的設計,視覺編碼,都顯得極為重要。
1.制作“均分”列表視圖
將我們的數(shù)據(jù)源導入到Tableau中,可以在Tableau的左側維度看到相應指標。將“日期”,“分數(shù)”分別拖到Tableau中對應的行與列中,將日期格式設置為年/月,以觀察各年各月的數(shù)據(jù),“分數(shù)”方式改為計算平均值。顏色編碼:將考試科目拖到菜單欄下的顏色中,用不同的顏色來區(qū)分不同的科目。布局:在智能顯示中選擇”線圖“連續(xù)。為了讓數(shù)據(jù)分布在圖形的中間區(qū)域,在圖中的y軸區(qū)域,編輯軸,設置y軸起點與終點。
隱藏:如果視圖中出現(xiàn)1個null值,想去掉這個顯示,右鍵點擊,使用隱藏指示器,這樣隱藏就掉了。如圖1-1所示
圖1-1 線圖展示
分析:我們可以從圖中看到三個科目的均分都在0.8附近浮動,數(shù)學從2011年11月份到哦2012年五月份都很均勻,根本不沒有浮動,科學這個科目在2011年12月份有較大的浮動,而閱讀分數(shù)普遍高于數(shù)學與科學,通過這個圖,發(fā)現(xiàn)學生普遍喜歡閱讀多與科學與數(shù)學。
2.考試成績視圖
設計這個視圖主要目的時幫助查看不同老師教的學生各科成績?nèi)绾危⑶矣妙伾右悦黠@區(qū)分。
(a) 新建一個新的工作表
(b) 將“教師編號“,”學生編號“拖至行,這種排列方式讓我們看到不同編號老師所帶學生的成績。
(c) 將分數(shù)拖至標記菜單欄中的文本中,計算平均值。選擇突顯表
(d) 考試科目拖至列
(e) 顏色編碼:點擊編輯顏色按鈕后,單擊色版,于下拉菜單中選擇要用的顏色,并且設置顏色的區(qū)分間隔,我們選擇六個顏色區(qū)分度,從左往右,不同顏色代表分值越大。如圖1-2所示
圖1-2 “考試分數(shù)”的編輯顏色
(f) 使用“篩選器”:我們選擇城市作為篩選的維度,來看不同城市的細節(jié)數(shù)據(jù)展現(xiàn),將“城市”拖到篩選器欄中,也將“學校名稱”,“教師編號”作為過濾器來使用。
(g) 在“篩選器”中選擇不同的城市,則將會在凸顯表中,出現(xiàn)不同城市的數(shù)據(jù)。
3.制作“各維度比較”視圖
使用“學校教育水平評估”的數(shù)據(jù),通過制作“各緯度比較”視圖來查看不同年級,參加不同學校餐飲計劃的學生,在不同時期的課程分數(shù)。
(a) 將日期及分數(shù)分別拖到對應的行與列中,將列中日期格式設置為年/月,以觀察各年各月的數(shù)據(jù),分數(shù)方式改為平均值。如圖1-4所示:
圖1-3 初圖
(b) 多層篩選的實現(xiàn):
在維度或度量的空白處,點擊右鍵,在彈出的選項中選擇創(chuàng)建參數(shù),將參數(shù)命名為“比較選擇”,將“年級”賦值為1,“考試狀態(tài)”賦值為2,考試科目賦值為3.然后在維度和度量下面會新增名為參數(shù)的選項集。
(c) 新建一個字段,
在維度的空白處,右鍵點擊在彈出的選項中選擇“創(chuàng)建計算字段“,并命名為比較,在公式中輸入如下代碼:
if[比較選擇]=1THEN STR([年級])
elseif[比較選擇]=2THEN [餐飲狀態(tài)]
else [考試科目] end
目的時,當參數(shù)“比較選擇“的值為1時,“比較”這個字段顯示的是“年級”;當參數(shù)“參數(shù)比較”的值為2時,“比較”這個字段顯示的時餐飲狀態(tài);否則顯示的時考試科目。
(d) 視覺編碼:
將新建的“比較”拖至標記菜單欄中的顏色,用顏色區(qū)分不同的維度。同時把比較作為篩選器來使用,并且顯示出來。那么,在參數(shù)“比較選擇”當中,任選擇一個難度,會顯示相應維度的選項。例如選擇“考試科目”,那么篩選器顯示的時數(shù)字,科學及閱讀。有選擇的時年級的,顯示的時10,11,12.
(e) 各維度比較視圖如圖1-4所示:
圖1-4 “維度比較”視圖
如圖中所示,我們通過多層篩選,能夠更加快捷,更加方便地查看在時間維度上不同年級,不同餐飲狀態(tài)以及選擇不同科目的學生的考試分數(shù),進而來分析影響教育水平的因素哪些影響程度大,哪些影響程度小。
(1) 制作“城市地圖”視圖
a) 新建一個工作表名為“城市地圖”的工作表。
b) 布局:
將latitude和Longitude分別放到對應的行與列上,工作區(qū)會自動生成一張這些經(jīng)緯度所在位置的地圖,這里地圖初始情況只顯示一個點,因為默認顯示的時所有精度的平均值和緯度的平均值。將分數(shù)拖到標記欄下的“大小”中,以平均值展現(xiàn),設置顏色以有更好的區(qū)分度;將學生拖到標記欄下的“大小”中,目的時通過學生個數(shù)多少,來衡量地圖上圖標大小。
c) 創(chuàng)建層級:
在維度當中連續(xù)選擇“城市”,“學院名稱”,“教師編號”,“學生編號”,創(chuàng)建分層結構如圖1-5所示
圖1-5經(jīng)緯度拖到列和行的提示
發(fā)布評論請先 登錄
相關推薦
評論