數據可視化6步法

時(shí)間:2022-07-12 08:09:11 其他 我要投稿
  • 相關(guān)推薦

數據可視化6步法

在當前互聯(lián)網(wǎng),各種數據可視化圖表層出不窮,本文嘗試對數據可視化的方法進(jìn)行歸納,整理成6步法。一般的數據圖表都可以拆分成最基本的兩類(lèi)元素: 所描述的事物及這個(gè)事物的數值,我們暫且將其分別定義為指標和指標值。比如一個(gè)性別分布中,男性占比30%,女性占比70%,那么指標就是男性、女性,指標值對應為30%、70%。

1. 將指標值圖形化

一個(gè)指標值就是一個(gè)數據,將數據的大小以圖形的方式表現。比如用柱形圖的長(cháng)度或高度表現數據大小,這也是最常用的可視化形式。傳統的柱形圖、餅圖有可能會(huì )帶來(lái)審美疲勞,可嘗試從圖形的視覺(jué)樣式上進(jìn)行一些創(chuàng )新,常用的方法就是將圖形與指標的含義關(guān)聯(lián)起來(lái)。比如Google Zeitgeist在展現top10的搜索詞時(shí),展示的就是“搜索”形狀的柱形,圖形與指標的含義相吻合,同時(shí)也做了立體的視覺(jué)變化:

2. 將指標圖形化

一般用與指標含義相近的icon來(lái)表現,使用場(chǎng)景也比較多,如下:

3.將指標關(guān)系圖形化

當存在多個(gè)指標時(shí),挖掘指標之間的關(guān)系,并將其圖形化表達,可提升圖表的可視化深度。常見(jiàn)有以下兩種方式:

借助已有的場(chǎng)景來(lái)表現

聯(lián)想自然或社會(huì )中有無(wú)場(chǎng)景與指標關(guān)系類(lèi)似,然后借助此場(chǎng)景來(lái)表現。比如百度統計流量研究院操作系統的分布,首先分為windows、mac還有其他操作系統,windows又包含xp、2003等多種子系統。根據這種關(guān)系聯(lián)想,發(fā)現宇宙星系中也有類(lèi)似的關(guān)系: 宇宙中有很多星系,我們最為熟悉的是太陽(yáng)系,太陽(yáng)系中又包括各個(gè)行星, 因此整體借用宇宙星系的場(chǎng)景,將熟知的windows比喻成太陽(yáng)系,將xp、window7等比喻成太陽(yáng)系中的行星,將mac和其他系統比喻成其他星系,表現如下:

構建場(chǎng)景來(lái)表現

指標之間往往具有一些關(guān)聯(lián)特征,如從簡(jiǎn)單到復雜、從低級到高級、從前到后等等。如無(wú)法找到已存在的對應場(chǎng)景,也可構建場(chǎng)景。比如百度統計流量研究院中的學(xué)歷分布,指標分別是小學(xué)、初中、高中、本科等等,它們之間是一種越爬越高,從低等級到高等級的關(guān)系,那么,這種關(guān)系可以通過(guò)構建一個(gè)臺階去表現,如下:

支付寶新出的個(gè)人年度賬單中,在描述付款最多的三項時(shí),構建了一個(gè)領(lǐng)獎臺的形式:

小結:

根據之前3步,可將指標、指標值和指標關(guān)系分別進(jìn)行圖形化處理。以最簡(jiǎn)單的性別分布為例,可以得到一個(gè)線(xiàn)性的可視化過(guò)程,如下:

以上圖示為供參考的線(xiàn)性化過(guò)程,實(shí)際可視化思考中,將哪類(lèi)元素進(jìn)行圖形化或者圖形化前后的順序可能均有不同,需根據具體情況處理。

4. 將時(shí)間和空間可視化

時(shí)間

通過(guò)時(shí)間的維度來(lái)查看指標值的變化情況,一般通過(guò)增加時(shí)間軸的形式,也就是常見(jiàn)的趨勢圖。

空間

當圖表存在地域信息并且需要突出表現的時(shí)候,可用地圖將空間可視化,地圖作為主背景呈現所有信息點(diǎn)。Google Zeitgeist在2010和2012年的年度熱門(mén)回顧中,都是以地圖為主要載體(同時(shí)也結合了時(shí)間),來(lái)呈現熱門(mén)事件:

5. 將數據進(jìn)行概念轉換

先看下生活中的概念轉換,當我們需要喝水時(shí),通常會(huì )說(shuō):給我來(lái)一杯水;而不會(huì )說(shuō):給我來(lái)30ml的水。在這里,30ml是一個(gè)實(shí)際數據,但是難以感知,所以用一杯的概念來(lái)轉換。同樣在數據可視化,有時(shí)需要對數據進(jìn)行概念轉換,可加深用戶(hù)對數據的感知。常用方法有對比和比喻:

對比:

下圖是一個(gè)介紹中國煙民數量的圖表:如果只看左半部分中國煙民的數量:32000000,知道數據量級很大,但具體有多大卻很難感知;直到看到右半部分:中國煙民數量超過(guò)了美國人口總和,這樣一對比,對數據的感知就加深了。

比喻

下圖是一個(gè)介紹雅虎郵箱處理數據量的圖表,大意是每小時(shí)處理的電子郵件大小有1.2TB,相當于644245094張打印的紙。這又是一個(gè)很大的數據,但到底有多大? 在這里用了一個(gè)比喻的手法:644245094張紙,如果把每一張紙首尾對接,可以繞地球4圈多。到這里,能較深刻感受到雅虎郵箱處理的數據量之大,為地球節省了很多紙張。更進(jìn)一步地,還將這個(gè)比喻進(jìn)行了圖形化表現。

6.讓圖表“動(dòng)”起來(lái)

數據圖形化完成后,可結合實(shí)際情況,將其變?yōu)閯?dòng)態(tài)化和可操控性的圖表,用戶(hù)在操控過(guò)程中能更好地感知數據的變化過(guò)程,提升體驗。

實(shí)現動(dòng)態(tài)化通常以下兩種方式: 交互和動(dòng)畫(huà)。

交互

交互包括鼠標浮動(dòng)、點(diǎn)擊、多圖表時(shí)的聯(lián)動(dòng)響應等等,如下是百度統計流量研究院的時(shí)間分布圖,采用左圖右表的聯(lián)動(dòng)形式,左圖中,鼠標浮動(dòng)則顯示對應數據,點(diǎn)擊則切換選擇:

動(dòng)畫(huà)

包括增加入場(chǎng)動(dòng)畫(huà)、交互過(guò)程的動(dòng)畫(huà)、播放動(dòng)畫(huà)等等。入場(chǎng)動(dòng)畫(huà):即在頁(yè)面載入后,給圖表一個(gè)“生長(cháng)”的過(guò)程,取代“數據載入中”這樣的提示文字。

交互動(dòng)畫(huà):用戶(hù)發(fā)生交互行為后,通過(guò)動(dòng)畫(huà)形式給以及時(shí)反饋。播放動(dòng)畫(huà):一般來(lái)是提供播放功能,像看視頻一樣,讓用戶(hù)能夠完整看到數據隨時(shí)間變化的過(guò)程。下圖是Gapminder在描述多維數據時(shí),提供隨時(shí)間播放的功能,可以直觀(guān)感受到所有數據的變化。

總結

數據可視化形式多樣,思考過(guò)程也不盡相同。以上6步法,是基于“數據”層面(區別于信息可視化),梳理思考過(guò)程,總結設計方法,為后續可視化提供可借鑒的思路。

[數據可視化6步法]相關(guān)文章:

1.數據可視化6步法

【數據可視化6步法】相關(guān)文章:

關(guān)于數據分析與數據挖掘的數據10個(gè)問(wèn)題07-10

聘:數據分析 數據挖掘07-10

大數據分析合集(6篇)07-25

數據分析之如何用數據?07-10

數據分析工作總結6篇02-01

數據分析工作總結(6篇)02-01

健身運動(dòng)擊劍的防守還擊及步法技巧05-16

產(chǎn)品數據庫:如何分析數據07-10

網(wǎng)絡(luò )游戲的數據挖掘與數據分析07-10

關(guān)于數據庫與銷(xiāo)售數據分析?07-10

99久久精品免费看国产一区二区三区|baoyu135国产精品t|40分钟97精品国产最大网站|久久综合丝袜日本网|欧美videosdesexo肥婆