76
文 / 杜易寰 資料收集 / 林辰駿 繪圖 / Re-Lab
從 12 月開始,QSearch 在撈資料時使用了新的方法。
過去的媒體洞察報告,QSearch 團隊會特別將當時能夠抓取到的所有媒體文章在全部爬過一遍,所以得到的資料都是「抓取資料當時所能看到的數據」,例如我在 3/28 日抓取二月資料的話,那呈現出來的就會是 3/28 當天所能看到的二月份文章,若在此前已將文章刪除,就會撈取不到。
而新的做法,則是不再重新抓取資料,而直接取用我們資料庫中原先存下來的資料,以節省時間。資料庫中的 資料是「文章發出後48小時內的所有互動資料」。這個方法的缺點則是若在 48 小時候才新增的互動就會計算不到,但只要文章發出過,就會有紀錄,即使後來刪除,資料也仍然保留在我們的資料庫。
「資料撈取範圍的改變」是其後媒體洞察報告與此前報告的最主要差別,接下來就交給大家自行閱讀了。