在假設檢驗中,我們會使用樣本中的數據來描繪有關總體的結論。首先,我們會進行假設,這被稱為原假設(以 H0 表示)。當您進行原假設時,您也需要定義備擇假設 (Ha),其與原假設正相反。樣本數據將用于判斷 H0 是否可以被否定。如果其被否定,則統計結論將認為備擇假設 Ha 正確。
請記住這一檢驗的功效,或是在原假設不正確時,原假設被否定的可能性。
它可以解釋為“檢驗在應該拒絕原假設時拒絕原假設的能力”。如果原假設不正確,則有很高概率拒絕原假設是很有意義的。功效與類型 2 的錯誤相關(功效 = 1 - 類型 2 錯誤),請見下表。類型 2 錯誤是當備選假設正確時不拒絕原假設的概率。因此,確保有足夠高的功效,才能保證類型 2 錯誤較低或“可以接受”。確保檢驗有足夠功效的一種常用方法是收集足夠的數據,因為功效的計算取決于樣本數量等因子。樣本數量越大,功效越高。換言之,未能收集足夠的數據將導致低功效和大量類型 2 錯誤。
最重要的是要找到合適的樣本數量。顯而易見,未能收集足夠的數據會導致更多的類型 2 錯誤。但是,收集“過多”的數據也會增加類型 1 錯誤,因為檢驗的功效會更高。因此,該檢驗可能會檢測到與假設值的微小差異,即使該差異可能沒有任何實際意義,尤其是與抽樣成本有關時。檢驗功效的計算應當基于實際意義。
Minitab 具有通過多種不同統計檢驗計算功效的功能,在下列示例中,分析人員在 Minitab 中通過單比率檢驗和單樣本 t 檢驗,進行了功效和樣本數量分析。
單比率檢驗樣本數量
考慮將產品分類為好或差的制造過程,其中有 1% 的不良品率。如果不良品率上升至 3%,則會對整個組織造成嚴重的成本問題。他們需要確定合適的樣本數量,以滿足:類型 I 錯誤率為 0.05,檢驗功效為 0.80,以檢測出不良品率從 1% 上升至 3% 或更高。
因為分析人員對不良品率研究感興趣,他們使用了單比率檢驗。原假設和備選假設是:
Ho: P = 0.01
Ha: P > 0.01
其中 P 為實際缺陷比率。
為了找出需要多少數據點才能達到至少0.8的功效,分析人員在 Minitab 中進行了單比率檢驗的功效和樣本數量分析。
單樣本 t 檢驗的樣本數量
將產品分類為好或差很簡單,但會損失很多信息。將好產品視為在 5 到 10 之間。假如有 2 個單元測得的數值為 4.9 和 10.01,并因而歸入差的分類。假如有另外 2 個單元測得的數值為 2.3 和 14.1,并因而歸入差的分類。請注意,如果只是簡單的區分好和差,這兩種情況是相同的。因此,如果測量產品質量特征是可行的,那么分析人員應該記錄質量特征的實際值,并使用記錄的數據 – 無需轉換為好和差。單樣本 t 檢驗可以用于檢驗總體的均值是否與目標一致。如果樣本數據的均值接近“目標”,則該過程可能運行良好。如果均值不接近目標,則可能生產出缺陷產品。
例如,假設該產品特征為特定目標的孔直徑。分析人員可以測量每個產品上的孔直徑,并使用單樣本 t 檢驗將均值與目標值進行比較,而不是檢查 236 個產品以確定孔是否符合規格。
為了找出需要多少數據點來檢測至少 80% 功效的過程均值中的 1 西格瑪偏移,分析人員在 Minitab 中對一個單樣本 t 檢驗進行功效和樣本數量分析。
計算的樣本數量僅為 10。這意味著如果分析人員希望確定目標的偏離均值是否超過了 1 西格瑪,則他們需要進行 10 個單位的單樣本 t 檢驗,以獲得至少 80% 的功效。
為什么會有這么大的區別?
屬性數據的假設檢驗需要大量樣本,因為在收集數據時沒有獲取詳細信息。另一方面,連續數據的假設檢驗只需較少的樣本數量,因為其獲取并使用了產品的詳細信息。該理論不僅適用于功效。屬性數據需要大量樣本以用于置信區間、屬性一致性分析、控制圖和能力分析。
總之,重要的是進行具有足夠功效的假設檢驗,以提供合理的機會來檢測差異。功效與樣本數量直接相關。Minitab 具有計算多種不同假設檢驗(包括試驗設計)的功效的功能。
審核編輯 黃宇
-
Minitab
+關注
關注
0文章
179瀏覽量
11736 -
假設檢驗
+關注
關注
0文章
4瀏覽量
4869
發布評論請先 登錄
相關推薦
評論