最近有不少朋友留言,讓對會員畫像做個全面的點的講解下。就此,我對《三生三世話CRM》系列課程的第四課“會員分析”中的會員畫像內(nèi)容進行個展開講解。

首先,基于我自己對會員畫像的認知對其做個定義。會員畫像可以認為是基于會員分析的聚類分組后的定性描述的標簽化呈現(xiàn),是對會員多維度屬性展開的更加立體全面的描述歸納。

會員畫像本質(zhì)也是會員分析的一種分析呈現(xiàn)方法。會員分析的目的就是為了清楚的描述展現(xiàn)會員的特征屬性,更好地理解把握會員是我們做分析的終極目標。“標簽”可以認為是自然語言的一部分,是一個簡單精煉的歸納表現(xiàn)形式。在實際業(yè)務中,大家都在廣泛的應用這一類基于標簽的畫像方法,即會員畫像?;跁T畫像的標簽方法歸納起來,就是給用戶貼一系列的標簽,而“標簽”是能表示用戶某一特征屬性的標識。

會員畫像是建立在一系列屬性數(shù)據(jù)之上的目標用戶模型。會員畫像的基礎信息應該是對會員描述的全量信息,通??梢苑譃闄C器很容易解析的結(jié)構化信息和機器很難理解需要結(jié)合知識庫才能夠理解的非結(jié)構化信息,這些信息最后以飽含深意的標簽的形式表現(xiàn)出來。

會員畫像邏輯

先來說說結(jié)構化信息,可以理解成在數(shù)據(jù)庫中結(jié)構化存放的信息,歸結(jié)起來包括會員的基礎信息,行為信息,已經(jīng)分析總結(jié)后的特征信息。會員的這些信息要基于時間和空間維度來談才有意義,脫離了時間,空間的數(shù)據(jù)是無意義的。

比如“有錢人”這個標簽,100年前的有錢人和現(xiàn)在的有錢人絕不是一個概念,至少有錢程度差異很大了;即使同一時間的當下的1萬/月的高薪,在一線城市和三四線城市,在不同的國家,肯定都意味不同的。因此用戶畫像應該是多維度的立體的描述體系。

非結(jié)構化信息,就是一些零碎的,人類自然語言描述等,目前機器還不能有效的準確的理解人類的自然語言,因為我們的自然語言很多時候是有歧義的,需要通過上下文才能理解的,而機器需要結(jié)合龐大知識庫的轉(zhuǎn)譯才能夠理解的非結(jié)化信息。

比如一些人類生活總結(jié)出來的概念、行為、習慣等知識的結(jié)合就能解讀出額外的信息。比會員信息中缺失的性別,會員信息中沒有性別,但我們可以結(jié)合一些業(yè)務描述語境來判斷,通常姓名中帶有女字旁,與花名相關的會員,我們可以認為其為女性。又比如用戶訪問過的網(wǎng)站,經(jīng)常訪問一些美妝或女性服飾類網(wǎng)站,是女性的可能性就高;訪問體育軍事類網(wǎng)站,是男性的可能性就高。還有用戶上網(wǎng)的時間段,經(jīng)常深夜上網(wǎng)的用戶男性的可能性就高。把這些特征加入到知識分類器進行訓練,也能提高一定的數(shù)據(jù)覆蓋率。當然這些知識也要限定在一定的時間空間下,不同的時間空間的知識解讀出來的信息完全是不一樣的。

要想讓機器能夠理解這些知識:

  • 先進個是要有足夠大的規(guī)模,必須覆蓋足夠多的樣本,足夠多的概念;
  • 第二個是語義要足夠豐富,當說到各種各樣的關系的時候,機器必須都能夠理解;
  • 第三個就是數(shù)據(jù)質(zhì)量要足夠精良,能夠按照一定的規(guī)則被聚類被歸納;
  • 第四個就是結(jié)構必須足夠友好需要借鑒語義和背景知識來給我們力量。

會員畫像歸根結(jié)底就是對會員屬性分析結(jié)果的描述呈現(xiàn),終究只是概括性的歸納描述。因此,我們不可能通過會員畫像對會員做到全方位全面的描述,這里的全面只能是相對的。細細糾結(jié)下,會員畫像本身也是有其自身缺陷的。

首先,會員畫像從某種程度講上還是不完整的。

導致這個問題可能有兩個原因,先進個原因就是任何畫像的來源數(shù)據(jù)都是有一定偏差的,一般描述的都是用戶畫像的某一方面,很難有一個非常完整的畫像。還有一個非常重要的原因就是隱私,大家都是有選擇性的提供個人信息,會回避不愿談及自己的,但是很多時候可能了解用戶不愿談及的這個方面的內(nèi)容對于我們做產(chǎn)品,做服務又是非常重要的?;谶@兩個原因,我們對用戶的理解就是一個碎片式的,很難召回完整的目標客戶。

其次,會員畫像還有一個問題就是不正確性。

也就是說,我們對用戶畫像的理解很多時候是錯誤的,這導致會出現(xiàn)錯誤的服務應用。導致不正確性的原因有很多,人類社會是在向前發(fā)展,知識也在不斷的演變。因此,供機器學習的知識庫永遠也不會有完整全面的時候,總有機器還無法理解知識,就會做出不夠精準正確的描述。

綜上, 我們理解的會員畫像,通常只是基于存量的歷史數(shù)據(jù),通過數(shù)據(jù)分析模型,對會員數(shù)據(jù)從屬性特征在時間、空間內(nèi)盡可能地描述歸納。因數(shù)據(jù)分析統(tǒng)計分析有其局限性,基于此的會員畫像也不可能做到真正意義上的全面完整。因此,我們只能做到盡可能的全面無死角的會員畫像。

 

•END•