數據可從網上搜索,統計年鑒及各大數據庫都有,再通過統計軟件作分析,例如相關分析和回歸分析,這種論文偏理論型。
推論統計學被用來將資料中的數據模型化,計算它的機率並且做出對於母體的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定)。
對於數字特征量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關系模型化(回歸)。其他的模型化技術包括變異數分析(ANOVA),時間序列,以及數據挖掘。
為了實際的理由,我們選擇研究母體的子集代替研究母體的每壹筆資料,這個子集稱做樣本。以某種經驗設計實驗所搜集的樣本叫做資料。
資料是統計分析的對象,並且被用做兩種相關的用途:描述和推論。描述統計學處理有關敘述的問題:資料是否可以被有效的摘要,不論是以數學或是圖片表現,以用來代表母體的性質?基礎的數學描述包括了平均數和標準差。圖像的摘要則包含了許多種的表和圖。