當前位置:首頁 > 網站建設

手把手教你用EXCEL分析流量波動原因(實例講解)

時間:2018-03-13 22:00:00來源:網站建設作者:seo實驗室小編閱讀:83次「手機版」
 

手把手excel實例教程

前言

隨著運營精細化發展,如何通過品牌沉淀的數據挖掘出更多優化可能,是每個運營、產品甚至技術的必修課。這篇文章將主要闡述我是如何通過發現問題、提出猜測、驗證猜想和事件歸類這四個方面,分析官網流量數據并找出問題的。

(文中出現的工具有CNZZ后臺和excel2013)

這次以某個朋友的網站作為演示數據,選取了2016年7月25日到2016年8月7日,分別是2016年第31周和32周兩周的數據,選擇這兩周數據是因為第32周該網站剛剛關閉了付費廣告的投放,所以網站流量出現了巨大差異,比較典型,CNZZ后臺流量如圖示:

在圖右下選擇“更多指標”,選取當前核心指標,舉例取PV、UV、平均訪問時長、跳出率;圖中部“時”改為“天”。

然后我們通過觀察圖上部分的對比數據,提出疑問:

1、為什么兩周流量數據大面積變差?怎么找出是哪一天或者哪個欄目哪個小時的原因?

2、為什么獨立訪客(UV)和新獨立訪客(NUV)差值都是4.5倍左右,而瀏覽次數(PV)差值卻只有1.5倍?

3、為什么兩周的UV走勢(橙線)類似,但PV走勢(藍線)卻在7-26和7-29兩天出現谷值和峰值?

目前我們已知最大的變化就是第31周開了付費廣告,第32周關閉,關閉時間是8-1號當天幾點呢?一到凌晨就關了還是下班才關?網站負責人說“好像是8-1號早上”,分析師不相信“好像”,只能通過數據去驗證。

這時候我們能提出的合理猜測是(猜測問題1=d1,下同):

d1:兩周流量數據大面積變差,是因為關閉了廣告投放,但具體是哪個小時和欄目通過CNZZ展示出的數據無法直觀得出結論,需要分析具體數據。

d2:UV和NUV差值相近,可能這周的數據增長多數來自新獨立訪客,而著陸頁對新訪客的吸引力不強,所以大多新訪客沒有產生更多點擊行為,這也說明,為什么第32周的跳出率升高。

d3:7-26對應8-2,7-29對應8-5,分別出現的谷值峰值原因在SEO日記錄表中無記錄,暫時無法給出猜測,只能查看具體數據。

網站日志中只記錄了8-1關閉付費推廣

提出猜測之前先問問網站負責人,網站近期有沒有改版或變動,有沒有忘記記錄的事項,其他部門有沒有做過什么線下活動推廣等等,合理的猜測來自于網站日志記錄的已知條件和分析師的經驗。

在excel中打開CNZZ記錄的兩周訪問明細(因私密原因將主域名修改為我的微信ffeels),按如下猜測具體分析:

1、具體什么時候停的付費廣告?

在日期中篩選第32周數據(8-1~8-7),在“頁面來源”中篩選被標記的付費來源鏈接(該站標記的是“ipinyou”),確定,結果如圖。

最后一條帶有付費標記來源時間是2016-8-1 9:56:43,得出負責人是在周一上午上班后10點左右關閉的付費廣告投放。

2、在這次流量變動中,關閉付費廣告帶來了多大的影響?

全選7-25~8-7訪問明細數據,新建透視表

行放“頁面來源”和“受訪頁面”,列放“周數”,值計數放“IP”,觀察兩周整體數據對比,發現自然流量+付費流量差值為7141-2745=4396,再篩選付費鏈接流量差值,即可得付費廣告影響。

分別在“頁面來源”和“受訪頁面”兩個字段處使用標簽“不包含”篩選掉付費標記“ipinyou”,如圖:

現在我們得出結果第31周和第32周的付費流量差值分別為7141-3834=3307,2745-2593=152,這就是開關付費廣告為網站流量帶來的具體影響數。那么網站流量變化全因是付費流量開關引起的嗎?通過上圖的計算結果,我們知道并不是,排除掉付費流量,我們仍然存在3834-2593=1241的自然流量差值,是什么原因引起的呢?

3、自然流量中有多少是自己公司的用戶

詢問網管了解公司的網線有沒有被分成多條,公司所有主機目前對應的IP地址或IP段是多少。因為選擇的時間久遠,已經無法得知當時該公司的內部IP段是多少,故忽略該步驟。

4、自然流量的差值是由哪些頁面在哪幾個時段引起的?

添加字段“日期”和“小時”到行中,選擇降序排列,值顯示方式調整為對比32周的差異,選中值選在區域,更改條件格式項目選區規則→前10項,填充粉色,重復該步驟選擇最后10項,填充黃色,最后效果如圖。

(其中粉色代表該頁面31周比32周多出來的數據,如“直接訪問書簽”31周來源流量比32周多127;黃色代表該頁面32周比31周增加的數據,如“http://study.ffeels.com/dujia/gushisudi”32周來源流量比31周多321)

得出正值相差超過200的頁面有“http://fof.ffeels.com/”、“http://fof.ffeels.com/help”、“http://fof.ffeels.com/capacitymis”,負值超過200的頁面有“http://study.ffeels.com/dujia/gushisudi”。

分析的步驟相同,我們以“http://fof.ffeels.com/help”頁面為例,為什么這個頁面31周比32周多267次?一次將“IP”、“訪客新老屬性”、“受訪頁面”、“地區”等字段放進行中,日期處降序排列如圖:

從“http://fof.ffeels.com/”、“http://fof.ffeels.com/help”、“http://fof.ffeels.com/capacitymis”三個頁面可以發現,三個頁面的流量都來自7-29號早上6點。

同時,我們發現了一個可疑的IP字段,兩天都有“222.16.42.***”,看看這個IP段是什么鬼,于是在“IP”字段篩選出“222.16.42.***”

有意思的是,這個IP段僅在第31周的每天的早晨6,7點間活躍,如圖:

因此得出結論,31周比32周多出來的自然流量差是由“http://fof.ffeels.com/”、“http://fof.ffeels.com/help”、“http://fof.ffeels.com/capacitymis”三個頁面在2016年7月29日早晨6-7點間引起,來訪用戶均為新訪客,且這些頁面均不為內容頁,訪問時間也不規律,目前條件缺失,只能推斷出人為>機器,放入事件庫,再觀察。

5、獨立訪客(UV)和新獨立訪客(NUV)差值都是4.5倍左右,而瀏覽次數(PV)差值卻只有1.5倍,是否因為付費廣告著陸頁不符合用戶體驗,如果是,那么新老訪客分別輸出了多少PV?

按“新老訪客屬性”字段統計得出,31周和32周新老用戶分別貢獻流量7141和2745,約等于瀏覽次數(PV)值。

點擊可查看大圖

然后我們分別篩選新老用戶的流量值,老用戶流量值2915和1895,如圖:

新用戶流量值4226和850,如圖:

最終我們發現,整站流量周變化7146/2745=2.60;老用戶流量周變化2915/1895=1.54;新用戶流量周變化4226/850=5.00。

新用戶PV數變化≈兩周新獨立訪客變化數,所以我們可以得出結論,第31周數據增長多數來自新獨立訪客,推測是著陸頁對新訪客的吸引力不強,或是投放目標人群不精準。(還可以通過受訪頁面數據的付費鏈接跳出率分析得出是哪個頁面最差,對應改進,不細講,留給讀者思考)

6、流量趨勢中7-26對應8-2出現了流量谷值,是否是單一頁面引起的?

對比7-26和8-2的流量,我們發現,是因為8-2當天整站的流量全部降低,并非單一頁面引起。

那為什么8-2當天會出現整張流量下降的情況呢?當我帶著這個詭異的現象再次詢問網站負責人時,他想了一會兒說:“哎呀,不好意思,我忘記告訴你了,8-2號臺風“妮妲”來了,公司放假一天。”哈哈,抓到一個忘記記網站日志的。我們來通過新老用戶流量變化核實一下。

新用戶流量變化如圖,平滑過渡:

老用戶流量變化如圖:8-2號當天流量斷崖下跌,確實是老用戶引起的整站流量降低。企業員工的訪問量占了自然流量的一大部分啊。

綜上所述,提出的猜測我們都已經驗證。

在整個過程中,大家應該發現了,所有的分析邏輯都是從大到小,從最開始的整體流量趨勢,找到對應是哪個周,哪一天,哪個小時,哪個欄目,哪個頁面出了問題。通過已知的記錄提出合理的猜測,然后通過數據驗證猜測。過程中并沒有高深的技巧,只要有一顆問到底的心。

在示例中,很多人想當然的認為32周相比31周流量大幅度降低是因為關閉了付費廣告,不再繼續分析,那就會疏忽一個很大的問題——整體流量下降,不代表所有欄目的流量都下降,比如圖示:

為什么32周這個“http://study.ffeels.com/dujia/gushisudi”頁面反而在整體流量下降的情況下大幅度增長?不寫過程了,直接給結論,是因為8-4號當天9:28開始,技術對這個頁面設置了內容采集,自動從其他站抓取內容,每隔一分鐘發布一次,證據如圖:

通過Excel進行數據分析,我們可以發現很多問題,甚至是有一次同事使用流量寶刷流量,被我戳穿了……這次的分享只列出了一些常見的分析方法和邏輯,旨在讓大家感受一下Excel在數據分析中起到的作用。

對于分析師來說,什么叫“事件歸類”?說得通俗些就是積攢的“經驗”。比如每到節假日,網站流量會怎樣變化,公司什么宣傳對流量提升影響最大,一旦停止廣告投放網站的真實流量來自哪里等等,把這些經驗歸類記錄在筆記中,久而久之就從初學者成長為高級分析師。但是話說回來,總會有你通過Excel猜不到,分析不出的問題,比如模擬人行為的爬蟲,設置不同UA,不定時抓取等等。遇到暫時不能解決的問題,存在“難題庫”,總有個契機會讓你靈光乍現,解決它們的。

最后要說的就是,Excel作為最大眾的數據分析工具,門檻低、功能強,性價比超高。只要你保持旺盛的求知欲,再加上一點點軟件操作技巧,人人都能是數據分析師。

艾奇菌曰

這篇文章是一個案例,更是一種方法,幾乎是手把手地告訴大家,如何通過數據定位出問題。

艾奇菌在后臺經常收到小伙伴們的問題:

最近點擊突然變多了,但是轉化沒有提升,是不是有惡意點擊

最近網站流量突然降低了,但我什么操作都沒做,為什么會這樣?……諸如此類。

然后得出結論大致是:“一定是惡意點擊!”或者“淡季來了”或者“X度系統又抽風了……”

得出這些結論之前,大家有沒有抽絲剝繭地,從客觀數據里推敲出你們想要的答案呢?

艾奇菌建議大家按照作者的思路,拿自己賬戶的數據,進行一番分析與推敲,相信會有很大的收獲。

作者:涂俊杰(微信:ffeels)

來源:投稿

相關閱讀

【DFS】深度優先搜索遞歸方式講解

前言 記得第一次接觸到DFS還是在去年大概三四月份,當時也是在準備比賽的時候聽說DFS很重要(原諒我是個小白),然后就去Google了一波什

雙線性插值代碼講解(bilinear_interpolation)

這幾天再看STN網絡,即空間變換網絡,里面設計到雙線性插值。算法雖老,但是并沒有去看過,只是簡單使用opencv調用過。閑來無事,就使用num

網絡麻豆,手把手教你找模特~

近期最勁爆的淘女郎消息是什么 ? 無疑是“找麻豆”平臺的上線,但關于這項功能如何使用, 以及其中的一些關鍵點, 賣家們了解過了嗎

rsync詳細部署過程及講解

備份服務器講解------rsync備份服務器(適用于unix linux windows) ##什么是rsync軟件 是一款開源的,快速的,多功能,可實現全量及增量

脈脈Profile怎么玩?手把手教程在這里!

一年用脈脈100個小時,定期更新Profile,你的職業夢就能一步一步實現!10萬BAT員工們的脈脈經驗你值得擁有!好啦,Profile是脈脈用來搭建

分享到:

欄目導航

推薦閱讀

熱門閱讀

17321期胆码王孑计划