在数据分析和科学接头中,假定闇练是一个至极迫切的统计器具。本文将详备先容两种常用的非参数闇练轨范:Mann-Whitney U闇练(也称为Wilcoxon秩和闇练)和卡方闇练(Chi-square test),并使用Python来已矣这些闇练轨范。
目次
基础见地
Mann-Whitney U闇练
卡方闇练
现实讹诈案例
基础见地
什么是假定闇练?
假定闇练是一种统计筹谋轨范,用于判断样本数据是否支撑某个统计假定。在进行假定闇练时,咱们凡俗会修复:
原假定(H0):咱们思要闇练的默许假定
备择假定(H1):与原假定相对的另一种可能性
权贵性水平(α):凡俗设为0.05,示意咱们容忍的犯第一类乌有的概率
为什么需要非参数闇练?
当数据不温柔正态散布或样本量较小时,传统的参数闇练(如t闇练)可能不适用。这时,咱们需要使用非参数闇练轨范,如U闇练和卡方闇练。
闇练轨范的选定
在选定适应的闇练轨范时,需要筹议以下成分:
数据类型
定量数据(联贯型)
定性数据(分类型)
等第数据(规矩型)
样本特征
样本量大小
是否寂然
是否配对
组别数目
数据散布
是否温柔正态散布
方差是否王人道
是否存在颠倒值
闇练野心
均值比拟
比例比拟
干系性分析
拟合优度闇练
底下是一个浅近的闇练轨范选定决议树:
数据类型是什么?├── 定量数据│ ├── 正态散布│ │ ├── 两组:t闇练│ │ └── 多组:方差分析│ └── 非正态散布│ ├── 两组:Mann-Whitney U闇练│ └── 多组:Kruskal-Wallis闇练└── 定性数据 ├── 生机频数≥5:卡方闇练 └── 生机频数
Mann-Whitney U闇练
表面基础
Mann-Whitney U闇练是一种非参数闇练轨范,用于比拟两个寂然样本的散布是否有权贵相反。它不要求数据呈正态散布,适用于序数数据。
Python已矣
import numpy as npfrom scipy import statsimport matplotlib.pyplot as plt# 生成示例数据np.random.seed(42)group1 = np.random.normal(loc=5, scale=2, size=30)group2 = np.random.normal(loc=6, scale=2, size=30)# 实践U闇练statistic, pvalue = stats.mannwhitneyu(group1, group2, alternative='two-sided')# 可视化plt.figure(figsize=(10, 6))plt.boxplot([group1, group2], labels=['组1', '组2'])plt.title('两组数据的箱线图比拟')plt.ylabel('值')plt.showprint(f'U统计量:{statistic}')print(f'p值:{pvalue}')
U统计量:293.0 p值:0.020680749139978086
终端阐述
淌若p值
淌若p值 ≥ α,则弗成闭幕原假定,以为莫得鼓胀凭据标明两组数据有权贵相反
卡方闇练
表面基础
卡方闇练用于分析分类变量之间是否存在权贵关联。它通过比拟不雅察频数与生机频数的相反来判断变量间的寂然性。
Python已矣
import numpy as npfrom scipy.stats import chi2_contingencyimport pandas as pdimport seaborn as sns# 创建示例数据:拜谒不同庚岁段东说念主群的通顺风俗data = np.array([ [30, 20, 10], # 年青东说念主(常常通顺,偶尔通顺,迪士尼彩乐园加盟很少通顺) [15, 25, 20], # 中年东说念主 [10, 15, 25] # 老年东说念主])# 进行卡方闇练chi2, p_value, dof, expected = chi2_contingency(data)# 创建热力争可视化plt.figure(figsize=(10, 8))sns.heatmap(data, annot=True, fmt='d', cmap='YlOrRd', xticklabels=['常常通顺', '偶尔通顺', '很少通顺'], yticklabels=['年青东说念主', '中年东说念主', '老年东说念主'])plt.title('不同庚岁段东说念主群通顺风俗散布')plt.showprint(f'卡方统计量:{chi2:.2f}')print(f'p值:{p_value:.4f}')print(f'目田度:{dof}')
卡方统计量:19.68 p值:0.0006 目田度:4
终端阐述
卡方值越大,示意不雅察值与生机值的相反越大
p值的阐述与上述换取,p
现实讹诈案例
案例1:医学接头中的U闇练
比拟两种维持轨范的后果相反:
# 两组患者的规复本事(天)treatment_A = [10, 12, 8, 15, 9, 11, 13, 7, 9, 12]treatment_B = [14, 16, 12, 18, 13, 15, 17, 11, 13, 16]# 实践U闇练statistic, pvalue = stats.mannwhitneyu(treatment_A, treatment_B)print(f'p值:{pvalue:.4f}')if pvalue
p值:0.0044 两种维持轨范的后果有权贵相反
案例2:商场调研中的卡方闇练
分析不同性别对家具偏好的关系:
# 创建列联表preferences = pd.DataFrame({ '家具A': [150, 100], '家具B': [120, 130], '家具C': [80, 120]}, index=['男性', '女性'])# 实践卡方闇练chi2, p_value, dof, expected = chi2_contingency(preferences)print(f'p值:{p_value:.4f}')if p_value
p值:0.0001 性别与家具偏好存在权贵关联
防卫事项和淡薄
样本量要求
U闇练:每组至少应有8个不雅测值
卡方闇练:每个单位格的生机频数最佳大于5
数据类型选定
U闇练适用于联贯数据或等第数据
而从最近一段时间的数据来看魔兽世界WLK怀旧服的时光徽章的价格趋于下降,虽然从目前数据来看并没有下降多少,但是时光徽章的最低价格居然已经达到了9429,虽然这个价格并没有稳住多久。但是可以证明一点便是魔兽世界WLK怀旧服游戏中的玩家们数量正在增加或者是玩家们的需求正在增加从而导致了时光徽章价格下跌G币上升。
再过不久,大唐官府服务器就要进入三年外大圈子了。区内的人气玩家赵波,也已经开始筹备大唐官府自己的服战队。为此,他也特意买了一个带160专用项链的天青号,这条项链满锻最高可达到370点灵力。
卡方闇练适用于分类数据
实践淡薄
在进行闇练前,先画图数据的描摹性图表
齐集现实布景阐述统计终端
防卫闇练的假定条款是否温柔
回来
本教程详备先容了U闇练和卡方闇练的Python已矣轨范。这些统计器具在现实接头中至极灵验,不错匡助咱们作念出更科学的决议。记着,统计闇练仅仅接济决议的器具,还需要齐集具体情况和专科常识来阐述终端。
参考资料迪士尼彩乐园代理登陆