由于這些數(shù)據(jù)存于數(shù)據(jù)庫中,而且日期是恒定的,所以對這些數(shù)據(jù)進(jìn)行跨地域處理或相關(guān)性分析就很直接了。
例如,由于節(jié)假日期間,新的數(shù)碼相機(jī)經(jīng)常被作為禮物贈送,所以,與平時比起來,節(jié)假日期間的平均照片上載量有很大增長,就不奇怪了。有了這些數(shù)據(jù),我們可以針對相同日期計算出其他值來,所以,我們能夠毫無困難地觀察平均上載大小是如何增加磁盤空間消耗的(因為照片的原始尺寸變大了),從而相應(yīng)地增加Flickr Pro賬號的訂購量(與免費賬號相比,Pro賬號沒有容量限制)。
有了這些高層數(shù)據(jù)之后,你的機(jī)構(gòu)中面向產(chǎn)品的那些人對這些數(shù)據(jù)也抱有極大的興趣,你一點都不用感到驚訝。雖然你可能是用磁盤空間消耗數(shù)據(jù)為存儲需求做容量規(guī)劃,但他們卻另有看法,比如,這些使用情況的數(shù)據(jù)可以幫助他們做功能發(fā)布的時間表。網(wǎng)站使用情況有助于制定產(chǎn)品路線圖,產(chǎn)品路線圖有助于容量規(guī)劃,容量規(guī)劃有助于預(yù)算以及基礎(chǔ)架構(gòu)的前途,等等。你很慶幸是以一種簡單且可移植的格式存儲這些數(shù)據(jù)的,因為機(jī)構(gòu)中的任何人都可能用到這些數(shù)據(jù)。
對于應(yīng)用層面的數(shù)據(jù),最有用的是能夠跟蹤用戶的交互情況。比如一個社會網(wǎng)絡(luò)站點,用戶可以與其他用戶成為為“好友”、上載照片,或在其他用戶頁面上發(fā)表評論。記錄這些事件是不能用正規(guī)的時間間隔的方法的,這與采集CPU測量數(shù)據(jù)不同,采集CPU數(shù)據(jù)用的是正規(guī)的時間間隔方法一比如說,每隔15秒進(jìn)行采樣。這種方法與前述將每天發(fā)生的事件進(jìn)行累加的方式也不同。將這些非周期性事件與周期性事件進(jìn)行相關(guān)性分析時,要確保時間尺度是固定的。
Flickr的這種非正規(guī)類型的一個例子如下:我們發(fā)布了一個功能,讓你導(dǎo)入各種郵件地址簿,并將這些地址簿中的名字及郵箱與你還不是聯(lián)系人的網(wǎng)站成員進(jìn)行關(guān)聯(lián),然后批量添加聯(lián)系人。如果我們只是將每天產(chǎn)生了多少聯(lián)系人進(jìn)行累加的話,我們在圖上就會看到那個數(shù)據(jù)點上有個跳變,但這個功能發(fā)布后,并沒有看到跳變,在隨后的數(shù)小時一直到下周,也都沒有看到。同樣的情況還有用戶對照片進(jìn)行標(biāo)注(tagging)的功能。了解這些信息有助于我們將來如何發(fā)布網(wǎng)站建設(shè)新功能,那就是一在發(fā)布功能之前,我們應(yīng)該準(zhǔn)備數(shù)據(jù)采集(對這些情況而言,就是一張MYSQL的匯總表)。
本文地址:http://m.cdrpkj.cn//article/3310.html