數據揭秘美國金融業「差評」地圖

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

數據揭秘美國金融業“差評”地圖

作者 | Eric Moore

題圖 | 站酷海洛

「差評」是全世界互聯網的”通用語言”及重要惡性交互方式之一。在金融大國美利堅的金融產品及服務市場上,差評已經不只是華爾街上流人士「社交吐槽」的風尚,更是民間百姓在後金融危機時代,與美國金融服務機構「良好」互動的通用手段。

本期數據俠與紐約數據科學院合作專欄中,數據俠Eric就希望通過在Shiny應用建立的美國金服差評可視化項目,幫助到美國的金融機構,發現問題解決問題,成為服務好人民的好機構。

▍項目總覽

品質管理是每個公司都要面對的難題。隨著消費者數據的種類以及可獲取性的提升,各家公司都需要面對一個新的課題:如何從數據中發掘出產品和服務中正在發生的問題。

在這個項目里,我會分析美國用戶對他們使用的金融服務作出的「差評」數據。當一個用戶對某個銀行機構不滿時,他可以向消費者金融保護局(CFPB, consumer financial protection bureau)在線提交投訴,除了會調查相關投訴外,CFPB還會公開這些投訴信息。

這個公開的數據庫十分詳細,提供了關於產品類型、具體投訴的問題(而且經常會保留投訴的內容)、金融機構的名稱、投訴者郵編、投訴的解決結果(如果解決了)以及其他信息。簡單說,它給我們提供了一個機會,來嘗試如何將如此量級的消費體驗數據進行可視化。有效的可視化也能幫助這些公司發現存在的問題。

▍數據可視化

我的可視化項目仍在進行中,微信後台回復「差評」,獲取Shiny應用可視化鏈接,這里我會先展示一些初步的可視化和發現。

一開始,我把這些「差評」加在一起進行分析。

從2012到2017年,每年提交的投訴從70290增長到了233099。第一張圖顯示,投訴內容的種類也變得越來越多:抵押貸款相關的投訴大大減少,而討債和徵信相關的抱怨成為最主流的。比如在2017年,徵信相關的從2012年的2.33%漲至38.81%,與此同時,抵押貸款相關的則從2012年的53.07%降落至只有12.56%。

數據揭秘美國金融業“差評”地圖

(圖片說明:2012-2017年不同金融服務的產品比率)

接下來,我對美國各個州的情況進行了研究,以及分析了針對每種產品的投訴的嚴重性(也就是這些投訴得到及時處理的比例)。下面的矩形樹圖(Tree Map)中,上面展示的是總體的情況,下面的圖是馬塞諸塞州與全美2015年的情況。在我的Shiny應用里有更多州的比較。

數據揭秘美國金融業“差評”地圖

(圖片說明:2015年馬塞諸塞州差評金融服務或產品的矩形樹圖)

數據揭秘美國金融業“差評”地圖

(圖片說明:2015年全美國差評金融服務或產品的矩形樹圖)

這些數據可以讓我們更容易的比較不同州與整個國家的平均水平的不同。可以看出,盡管在全國,討債的投訴很多無法及時解決(比例達到8.4%),但在2015年的馬塞諸塞州,並沒有這個問題(比例僅為4.9%)。

Shiny應用上有很好的交互功能。如果我們看2016年的情況,我們可以看到馬塞諸塞州的問題。下圖直觀地顯示了討債問題如何變得更加嚴重。在所有得到及時解決的投訴中,2015年討債類問題只占了4.9%,而2016年已經達到9.7%。

數據揭秘美國金融業“差評”地圖

(圖片說明:2016年馬塞諸塞州差評金融服務或產品的矩形樹圖)

數據揭秘美國金融業“差評”地圖

(圖片說明:2016年全美國差評金融服務或產品的矩形樹圖)

上文的數據(進入Shiny應用查看)能夠很好地展示了不同州和不同時間,「差評」情況的明顯不同。除此之外,它也展示了在規模和嚴重程度上的區別。因為有些人會認為規模和嚴重度更加重要,所以對這些區別進行可視化展示很有幫助。

對於解決問題來說,可能規模更加值得研究,因為在嚴重程度方面,大多數問題得到了及時的解決。所以可能有些人會更傾向於研究那些並不常見的領域,但這些領域的問題可能會更嚴重。這些可視化的圖就展示了這些不同。

當我們選擇了具體要研究的領域,比如某個特定的產品種類,我們就可以分析出這些問題究竟集中在哪些機構或地點。下面的熱點圖展示了不同機構和地理位置的「差評」的增長規律。橫軸表示不同的州,縱軸是在所有州都有投訴記錄的最大的19個機構。

數據揭秘美國金融業“差評”地圖

可以看到金融機構Navient Solutions的投訴在多數的州都面臨著投訴增長的問題。同時也展示了一些特定領域的增長:美國運通在緬因州,巴克萊在新罕布什爾州。在shiny應用里可以看到更多的州的信息。

更重要的是,你可以快速查看某一個機構在哪個地區出現最明顯的投訴的增長,與其他機構相比,自己的哪類投訴最明顯,並且可以查看地區性的問題。

▍總結

這組可視化展示了CFPB的數據中所顯示的在機構、遇到的投訴種類等方面的不同。不過這組可視化最棒的地方還是體現在shiny應用上的交互功能,以及快速查詢能力。

註:本文編譯自紐約數據科學院博客《 Exploring Data on Consumer Complaints》,點擊「閱讀原文」查看。內容僅為作者觀點,不代表DT數據俠立場。文中圖片部分來自作者。

期待更多數據俠乾貨分享、話題討論、福利發放?在公眾號DT數據俠(ID:DTdatahero)後台回復「數據社群」,可申請加入DT數據社群。

▍關於DT×NYCDSA

DT×NYCDSA是DT財經與紐約數據科學學院合作專欄。紐約數據科學學院(NYC Data Science Academy)是由一批活躍在全球的數據科學、大數據專家和SupStat Inc. 的成員共同組建的教育集團。

▍數據俠門派

本文數據俠Eric Moore是一位數據科學家和創造力思想者,Eric的綜合技能涵蓋使用因果推論統計模型的預測與計量經濟學所需的機器學習技能。Eric畢業於沃頓商學院,獲得應用經濟學博士學位,並且是紐約數據科學院(New York City Data Science Academy)的研究員。

▍加入數據俠

數據俠計劃是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。申請入群請添加DT君微信(dtcaijing003)並備註「數據社群」,合作請聯繫[email protected]。

數據揭秘美國金融業“差評”地圖