انجام تست T در پایتون

بازنشر افلاطون

دنبال: 0

انجام تست T در پایتون
تصویر توسط ویرایشگر

گیرنده های کلیدی

آزمون t یک آزمون آماری است که با استفاده از آن می توان تفاوت معنی داری بین میانگین دو نمونه مستقل از داده ها را تعیین کرد.
ما نشان می‌دهیم که چگونه آزمون t را می‌توان با استفاده از مجموعه داده iris و کتابخانه Scipy پایتون اعمال کرد.

آزمون t یک آزمون آماری است که با استفاده از آن می توان تفاوت معنی داری بین میانگین دو نمونه مستقل از داده ها را تعیین کرد. در این آموزش، ابتدایی‌ترین نسخه آزمون t را نشان می‌دهیم، که برای آن فرض می‌کنیم که دو نمونه دارای واریانس مساوی هستند. سایر نسخه های پیشرفته آزمون t شامل آزمون t Welch است که اقتباسی از آزمون t است و زمانی که دو نمونه دارای واریانس نابرابر و احتمالاً حجم نمونه نابرابر باشند قابل اعتمادتر است.

آماره t یا t-value به صورت زیر محاسبه می شود:

انجام تست T در پایتون

جایی که $معادله$

$معادله$ میانگین نمونه 1 است، $معادله$ میانگین نمونه 2 است، واریانس نمونه 1 است، واریانس نمونه 2 است، حجم نمونه نمونه 1 است و حجم نمونه نمونه 2 است.

برای نشان دادن استفاده از آزمون t، یک مثال ساده با استفاده از مجموعه داده عنبیه نشان خواهیم داد. فرض کنید ما دو نمونه مستقل مانند طول کاسبرگ گل را مشاهده می کنیم و در نظر داریم که آیا این دو نمونه از یک جمعیت (مثلاً یک گونه گل یا دو گونه با ویژگی های کاسبرگ مشابه) گرفته شده اند یا از دو جمعیت متفاوت.

آزمون t تفاوت بین میانگین های حسابی دو نمونه را کمی می کند. p-value احتمال به دست آوردن نتایج مشاهده شده را با فرض صحت فرضیه صفر (که نمونه ها از جمعیت هایی با میانگین جمعیت یکسان گرفته شده اند) کمی می کند. مقدار p بزرگتر از یک آستانه انتخاب شده (مثلاً 5٪ یا 0.05) نشان می دهد که مشاهده ما چندان بعید نیست که تصادفی رخ داده باشد. بنابراین، فرضیه صفر میانگین جمعیت برابر را می پذیریم. اگر مقدار p کوچکتر از آستانه ما باشد، ما شواهدی علیه فرضیه صفر میانگین جمعیت برابر داریم.

ورودی T-Test

ورودی ها یا پارامترهای لازم برای انجام آزمون t عبارتند از:

دو آرایه a و b حاوی داده های نمونه 1 و نمونه 2 است

خروجی های T-Test

آزمون t موارد زیر را برمی گرداند:

آمار t محاسبه شده
مقدار p

کتابخانه های لازم را وارد کنید

import numpy as np
from scipy import stats import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

مجموعه داده Iris را بارگیری کنید

from sklearn import datasets
iris = datasets.load_iris()
sep_length = iris.data[:,0]
a_1, a_2 = train_test_split(sep_length, test_size=0.4, random_state=0)
b_1, b_2 = train_test_split(sep_length, test_size=0.4, random_state=1)

میانگین نمونه و واریانس نمونه را محاسبه کنید

mu1 = np.mean(a_1) mu2 = np.mean(b_1) np.std(a_1) np.std(b_1)

اجرای آزمون t

stats.ttest_ind(a_1, b_1, equal_var = False)

تولید

Ttest_indResult(statistic=0.830066093774641, pvalue=0.4076270841218671)

stats.ttest_ind(b_1, a_1, equal_var=False)

تولید

Ttest_indResult(statistic=-0.830066093774641, pvalue=0.4076270841218671)

stats.ttest_ind(a_1, b_1, equal_var=True)

تولید

Ttest_indResult(statistic=0.830066093774641, pvalue=0.4076132965045395)

مشاهدات

مشاهده می کنیم که استفاده از "درست" یا "نادرست" برای پارامتر "equal-var" نتایج آزمون t را چندان تغییر نمی دهد. همچنین مشاهده می‌کنیم که تعویض ترتیب آرایه‌های نمونه a_1 و b_1 یک مقدار آزمون t منفی به دست می‌دهد، اما آن‌طور که انتظار می‌رود، بزرگی مقدار آزمون t را تغییر نمی‌دهد. از آنجایی که مقدار p محاسبه شده بسیار بزرگتر از مقدار آستانه 0.05 است، می‌توانیم فرضیه صفر را رد کنیم که تفاوت بین میانگین‌های نمونه 1 و نمونه 2 معنی‌دار است. این نشان می دهد که طول کاسبرگ برای نمونه 1 و نمونه 2 از داده های جمعیت یکسان گرفته شده است.

a_1, a_2 = train_test_split(sep_length, test_size=0.4, random_state=0)
b_1, b_2 = train_test_split(sep_length, test_size=0.5, random_state=1)

میانگین نمونه و واریانس نمونه را محاسبه کنید

mu1 = np.mean(a_1) mu2 = np.mean(b_1) np.std(a_1) np.std(b_1)

اجرای آزمون t

stats.ttest_ind(a_1, b_1, equal_var = False)

تولید

stats.ttest_ind(a_1, b_1, equal_var = False)

مشاهدات

مشاهده می‌کنیم که استفاده از نمونه‌هایی با اندازه نابرابر، آمار t و p-value را به‌طور معنی‌داری تغییر نمی‌دهد.

انجام تست T در پایتون

به طور خلاصه، ما نشان دادیم که چگونه یک آزمون t ساده را می توان با استفاده از کتابخانه scipy در پایتون پیاده سازی کرد.

بنجامین او تایو یک فیزیکدان، مدرس علوم داده، و نویسنده، و همچنین مالک DataScienceHub است. پیش از این، بنجامین مهندسی و فیزیک را در U. of Central Oklahoma، Grand Canyon U. و Pittsburgh State U تدریس می کرد.

اطلاعات بیشتر در مورد این موضوع

محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
پلاتوبلاک چین. Web3 Metaverse Intelligence. دانش تقویت شده دسترسی به اینجا.
منبع: https://www.kdnuggets.com/2023/01/performing-ttest-python.html?utm_source=rss&utm_medium=rss&utm_campaign=performing-a-t-test-in-python

تمبر زمان: ژانویه 10، 2023

افزایش سرعت درک داده ها با اکتشاف تعاملی

خوشه منبع:

kdnuggets

گره منبع: 1052500

تمبر زمان: اوت 19، 2021

انجام تست T در پایتون

بازنشر افلاطون

گیرنده های کلیدی

ورودی T-Test

خروجی های T-Test

مشاهدات

مشاهدات

اطلاعات بیشتر در مورد این موضوع

بیشتر از kdnuggets

ویژگی های شما مهم هستند؟ این بدان معنا نیست که آنها خوب هستند - KDnuggets

ویندوز در اسنپدراگون، هوش مصنوعی هیبریدی را به اپلیکیشن‌ها در لبه می‌آورد – KDnuggets

برترین منابع رایگان برای یادگیری ChatGPT

اخبار KDnuggets™ 21:n32، 25 اوت: مجموعه داده های منبع باز برای Computer Vision. 9 برنامه رایج جنگو

یادگیری پایتون در چهار هفته: یک نقشه راه

MLOs ضروری: یک کتاب الکترونیکی رایگان – KDnuggets

افزایش سرعت درک داده ها با اکتشاف تعاملی

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب