無論是身處什么行業(yè)什么領域,數(shù)據(jù)分析越來越成為一向必不可少的技能,而運用數(shù)據(jù)思維進行決策更能產(chǎn)生形成高質量的決策結果。
來源:24直播網(wǎng)
無論是身處什么行業(yè)什么領域,數(shù)據(jù)分析越來越成為一向必不可少的技能,而運用數(shù)據(jù)思維進行決策更能產(chǎn)生形成高質量的決策結果。
數(shù)據(jù)分析正在滲入到各行各業(yè)的商業(yè)活動中以及各種細小決策中,判斷一個人了是否有數(shù)據(jù)思維,最核心的因素是看他有沒有通過數(shù)據(jù)分析做決策的習慣。
一個合格的數(shù)據(jù)分析師要掌握各種數(shù)據(jù)分析模型和算法以及熟悉SAS、R、Python等統(tǒng)計工具。有些人可能會說,數(shù)據(jù)分析的門檻太高了,其實除了數(shù)據(jù)工作相關產(chǎn)品經(jīng)理和分析師,并非所有產(chǎn)品經(jīng)理都需要熟悉數(shù)據(jù)分析模型和工具,日常大部分數(shù)據(jù)分析都能夠通過Excel分析出來,如果是比較復雜的數(shù)據(jù),產(chǎn)品經(jīng)理可以通過自己了解業(yè)務知識與數(shù)據(jù)分析師有效的協(xié)作,做出有數(shù)據(jù)依據(jù)的決策。
但是每個產(chǎn)品經(jīng)理都需要了解數(shù)據(jù)分析思維的重要性,以及熟悉數(shù)據(jù)分析思維工作流程。
數(shù)據(jù)分析思維的由來
過去人們做決策主要靠定量分析,定量分析的決策依據(jù)來自于決策者的經(jīng)驗和直覺,這種決策的缺點主要在于決策結果的不可確定性,決策失誤的概率很大。
隨著互聯(lián)網(wǎng)的不斷發(fā)展和物聯(lián)網(wǎng)設備的不斷普及,人們活動的各種數(shù)據(jù)被有意識的存儲下來了,數(shù)據(jù)的收集,讓我們可以通過定量分析數(shù)據(jù),利用數(shù)據(jù)實現(xiàn)更好的決策制定。
比如像很多互聯(lián)網(wǎng)公司都成立了大數(shù)據(jù)團隊,收集用戶的社交、電商、搜索行為等數(shù)據(jù),通過所搜集的大數(shù)據(jù)來制定商業(yè)決策依據(jù),以及通過數(shù)據(jù)挖掘形式,找到創(chuàng)新產(chǎn)品的機會。
大的互聯(lián)網(wǎng)公司在滿足自己內部決策需求的同時,也成了了大數(shù)據(jù)部門給其它公司進行賦能,比如螞蟻金服的數(shù)據(jù)產(chǎn)品芝麻信用,不僅能夠成為螞蟻內部各種金融產(chǎn)品的信用審核依據(jù),也開放給了很多行業(yè)如出行、金融、共享服務公司等,極大提高了基于信用服務的門檻和便捷性。
熟悉NBA的球迷都知道,勇士隊曾長期以來一直是聯(lián)盟里的魚腩球隊。但是自從來自硅谷風險投資者拉科布收購勇士之后,把數(shù)據(jù)分析的思想充分融入到了球隊的訓練之中,他們雇傭了許多數(shù)據(jù)分析師,為球隊提供咨詢幫助,并最先在球館中引入球館錄像和分析系統(tǒng),為了更好地監(jiān)測球員的健康狀況。
同時他們根據(jù)團隊對歷年來NBA比賽的統(tǒng)計,發(fā)現(xiàn)NBA最有效的進攻是眼花繚亂的傳球和準確的投籃,而不是看似觀賞性很強的突破和扣籃。在這個思想的指導下,勇士隊開創(chuàng)性的發(fā)明了小球戰(zhàn)術,以三分作為主要進攻手段,開創(chuàng)了四年奪三冠的王朝偉績。
數(shù)據(jù)分析流程分為發(fā)現(xiàn)問題、數(shù)據(jù)的收集和加工、數(shù)據(jù)分析、解決對策四個步驟。
發(fā)現(xiàn)問題
在工作中并不是所有的事物都需要用到數(shù)據(jù)分析,只有出現(xiàn)了問題才需要用到數(shù)據(jù)分析。一類問題是對現(xiàn)狀的不滿意,另一類問題是對未來的預測。
在數(shù)據(jù)分析中,發(fā)現(xiàn)現(xiàn)狀問題有一個萬能的公式,即問題=預期和現(xiàn)狀之間的差距,比如當商品廣告投入和產(chǎn)品質量沒有變化的情況下,本月用戶的平均消費金額下降了。如果廣告和產(chǎn)品質量沒有變化,正常的情況是本月用戶的平均消費金額不變才對,現(xiàn)狀卻是本月用戶的平均消費金額減少,那么我們就認為這里有問題需要被挖掘,利用數(shù)據(jù)分析的方法,去發(fā)掘問題背后的原因。
那么如何找到預期和現(xiàn)狀之間的差距呢?
有兩個辦法找到預期和現(xiàn)狀之間不符的情況下背后的原因。分別是:將數(shù)據(jù)分解后觀察和將數(shù)據(jù)比較后觀察
1. 將數(shù)據(jù)分解后觀察
一般一個預期結果由多因素決定,可以將現(xiàn)狀的數(shù)據(jù)分解后進行觀察什么因素對結果的影響。對數(shù)據(jù)分析來講,比較有效的數(shù)據(jù)分解方式是因素分解方式,即對數(shù)據(jù)結果進行四則運算分解。
比如:本月平均消費金額=本月消費總額/本月消費人數(shù)。
所以本月平均消費金額減少,要么是本月消費總額減少,要么是本月消費人數(shù)增加了。接著我們可以去深挖為什么本月平均消費金額減少或者本月消費人數(shù)增加,直到找到最根本的原因。
如果數(shù)據(jù)不能由公式進行分解,那么需要討論數(shù)據(jù)結果的所有決定因素,以及每種決定因素影響的大小,然后分析有變化的決定因素。比如產(chǎn)品本月用戶滿意度降低了,滿意度并不能通過因素分解,那么可以分析滿意度所有的決定因素,比如涉及滿意度的因素可能有售前和售后服務效率、產(chǎn)品質量、品牌影響力等因素,看看是否有因素發(fā)生了變化,如果有因素發(fā)送了變化,那極有可能是影響滿意度的決定因素。
2. 將數(shù)據(jù)比較后觀察
將數(shù)據(jù)比較后觀察指的是發(fā)生問題的數(shù)據(jù)和未發(fā)生問題的數(shù)據(jù)進行比較,從而找到問題的原因。數(shù)據(jù)比較的方式比較多,比如按時間序列進行比較,比如昨天和今天的比較、上月和本月的比較、上周和本周的比較、去年和今年的比較,以及同一個活動上次和本次的比較等。
也可以空間進行橫向比較,比如和競爭對手的數(shù)據(jù)進行比較,公司內部不同部門之間的數(shù)據(jù)比較等。
還有一種重要的方式是按照用戶的屬性數(shù)據(jù)進行比較,常用的用戶屬性有用戶性別、用戶來源、用戶操作系統(tǒng)類型、用戶手機類型、用戶年齡、用戶地域、用戶偏好等。
數(shù)據(jù)比較看似原理比較簡單,但是解釋了為什么我們做的報表和數(shù)據(jù)分析經(jīng)常要做比較,因為只有比較才能發(fā)現(xiàn)問題。
數(shù)據(jù)的收集和加工
不管是現(xiàn)狀問題還是對未來的預測,數(shù)據(jù)收集和加工的過程是非常重要的,數(shù)據(jù)的收集和加工是整個數(shù)據(jù)分析過程的“原材料”。如果沒有豐富的“原材料”,那么“巧婦也難為五米之炊”。
1. 數(shù)據(jù)收集
一個有數(shù)據(jù)思維的產(chǎn)品經(jīng)理,在產(chǎn)品設計階段就會盡量把數(shù)據(jù)提前收集,做數(shù)據(jù)埋點和數(shù)據(jù)校驗,保證數(shù)據(jù)的精準性和完整性。比如設計一個APP的埋點包括啟動次數(shù)、頁面訪問時間、功能點擊次數(shù)等。
數(shù)據(jù)校驗也很重要,千萬不要想著功能先做上去就好了,數(shù)據(jù)校驗可以慢慢做,這樣造成的影響就是在數(shù)據(jù)統(tǒng)計的沒有校驗的數(shù)據(jù)統(tǒng)計價值不高。比如下圖中的
系統(tǒng)中,在錄入車輛品牌的時候,直接是錄入操作,而不是品牌選擇,這意味著沒有做數(shù)據(jù)校驗。
沒有做數(shù)據(jù)校驗的字段意味著用戶可以隨意填寫該字段,如下圖:
在做數(shù)據(jù)收集的時候,同樣一個車輛型號,有多行記錄,在數(shù)據(jù)收集和分析的時候,就需要去額外的投入去判斷哪些數(shù)據(jù)其實是一個數(shù)據(jù)。
今日頭條作為一款成功的新聞推薦產(chǎn)品,能做到信息推薦的千人千面,這得益于他們數(shù)據(jù)收集的完整性,完整性體現(xiàn)在頭條把用戶數(shù)據(jù)分為人的特征、環(huán)境特征、文章特征等。每個特征又分為很多更細化的特征,如文章特征又分為文章時效性、文章熱度、相似文章、停留時間、閱讀的細節(jié)行為等。
頭條甚至能通過數(shù)據(jù)了解用戶什么地方快速劃過、什么地方仔細閱讀過等數(shù)據(jù),完整的數(shù)據(jù)收集為頭條眾多的算法策略提供了數(shù)據(jù)原料。
在數(shù)據(jù)收集時,從數(shù)據(jù)的獲得成本來講,代價最低的是收集已經(jīng)保存的數(shù)據(jù),所以產(chǎn)品經(jīng)理在設計產(chǎn)品的時候,就需要考慮數(shù)據(jù)保存。
代價最高的是從外部去購買數(shù)據(jù),比如在互聯(lián)網(wǎng)金融中,很多平臺會從第三方大數(shù)據(jù)機構中購買反欺詐名單、黑名單、多頭借貸等數(shù)據(jù),外部購買的數(shù)據(jù)一般是按每筆收費。
2. 數(shù)據(jù)加工
數(shù)據(jù)收集完成之后就是數(shù)據(jù)加工,大部分數(shù)據(jù)都零散的存放在數(shù)據(jù)庫中或者文件里面,所以數(shù)據(jù)加工首先需要將數(shù)據(jù)整合在一塊,如果數(shù)據(jù)保存在數(shù)據(jù)庫中那么需要用SQL整理,如果數(shù)據(jù)保存在文件中那么就用Excel或者R語言整理。
數(shù)據(jù)加工的目標是為了得到數(shù)據(jù)指標的結果,數(shù)據(jù)指標是我們日常工作的數(shù)據(jù)化表現(xiàn),比如我們上面講到本月消費總額和本月消費人數(shù)。越是數(shù)據(jù)驅動的產(chǎn)品,數(shù)據(jù)指標越多,指標越精細,比如上面今日頭條的基于人、環(huán)境、文章等非常精細的數(shù)據(jù)指標。
除了常規(guī)的數(shù)據(jù)指標,在數(shù)據(jù)加工的時候還需要對一些連續(xù)數(shù)據(jù)進行指標離散化,在數(shù)據(jù)加工階段,為了在數(shù)據(jù)分析的時候,方便采取更準確的決策,我們可以把一些連續(xù)數(shù)值的數(shù)據(jù)離散化。
阿里巴巴有了用戶的歷史消費行為、消費能力、支付數(shù)據(jù)等數(shù)據(jù)之后,在數(shù)據(jù)加工階段,可以把按風險把用戶分為不同的層級。如下是網(wǎng)商銀行對外輸出的客戶風險評級:
A為1-3層用戶,屬于最優(yōu)質人群;
B為4-6層用,屬于良好用戶;
C為7-8層,屬于風險較高用戶,C1為第七層,C2為第八層;
Other,為拒絕用戶。
定義好離散化的數(shù)據(jù)指標之后,那具體哪些用戶屬于什么評級呢,這就是數(shù)據(jù)分析階段需要做的事情了。
數(shù)據(jù)分析
在數(shù)據(jù)分析中,根據(jù)問題的難易程度可以用到“決策支持”和“系統(tǒng)優(yōu)化”的分析方法。
1. 決策支持
決策支持是通過簡單的求和以及易于理解的分析模型,幫助用戶做出決策,比如對比本月同比和環(huán)比用戶平均消費金額,從而決定通過什么決策活動來提高本月的用戶平均消費金額。比如建立一個廣告投入因素和新增用戶的關系模型,就能夠預測投入多少廣告額,能帶來多少新增用戶。
簡單的關系模型產(chǎn)品經(jīng)理是能通過Excel表格分析出來的,如柱狀圖、折線圖等。
如果一項因素引發(fā)問題的因素很復雜,則需要建立一個由多個因素組成的預測模型。通過這個模型,我們可以觀察模型中某個因素對整體結果造成的影響。預測模型需要用到的統(tǒng)計方法有交叉列表統(tǒng)計、統(tǒng)計學假設檢驗 、多元回歸分析等,這個階段大部分產(chǎn)品經(jīng)理都需要求助數(shù)據(jù)分析師的幫助了。
2. 系統(tǒng)優(yōu)化
系統(tǒng)優(yōu)化指的是幫助用戶構建讓計算機執(zhí)行的方案算法,常用的系統(tǒng)優(yōu)化方法有機器學習。
相比簡單模型的決策模型,系統(tǒng)通過機器學習方法分析出系統(tǒng)中更詳細的因素,比如系統(tǒng)優(yōu)化能分析出廣告投入多少金額,能帶來新用戶的快速增長,以及廣告投放中具體什么投放渠道,效果最好。
機器學習的優(yōu)勢在于能從數(shù)據(jù)中學習出其本身包含的模式和規(guī)律,并以此來建立模型。比今日頭條,就是通過分析我們過去瀏覽的記錄,利用機器學習建立模型,從而給我們推薦類似的內容。系統(tǒng)優(yōu)化用到的統(tǒng)計方法有邏輯回歸分析、聚類、主成分分析、決策樹分析等。
解決對策
對于數(shù)據(jù)分析中決策支持的得出的結果,我們可以通過決策結果直接決定做或者不做某事,對于數(shù)據(jù)分析中系統(tǒng)優(yōu)化得出的結果,我們可以在計算機上執(zhí)行解決問題的決策算法。
無論什么決策結果,都需要評估執(zhí)行決策結果的成本以及決策風險。
為了評估成本和風險,在做決策的時候,我們可以通過把預估的數(shù)據(jù)代入到?jīng)Q策模型中,進行模擬仿真,從而得出可能出現(xiàn)的結果。
與此同時,我們還需要不斷的和周圍的人傳達我們整個數(shù)據(jù)分析的流程,告訴他們我們的決策是有數(shù)據(jù)依據(jù)的,這樣有助于推進決策結果的推進。
#專欄作家#
青蛙王子,微信公眾號:guatalk,qq:1418191947,人人都是產(chǎn)品經(jīng)理專欄作家。
題圖來自 Unsplash,基于CC0協(xié)議。
責任編輯: