Performing A T-Test In Python - Plato AiStream V2.1

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

ازگر میں ٹی ٹیسٹ کرنا
تصویر بذریعہ ایڈیٹر

کلیدی لے لو

ٹی ٹیسٹ ایک شماریاتی ٹیسٹ ہے جس کا استعمال اس بات کا تعین کرنے کے لیے کیا جا سکتا ہے کہ آیا ڈیٹا کے دو آزاد نمونوں کے ذرائع کے درمیان کوئی خاص فرق ہے۔
ہم واضح کرتے ہیں کہ کس طرح آئیرس ڈیٹاسیٹ اور پائتھون کی اسکائپی لائبریری کا استعمال کرتے ہوئے ٹی ٹیسٹ کا اطلاق کیا جا سکتا ہے۔

ٹی ٹیسٹ ایک شماریاتی ٹیسٹ ہے جس کا استعمال اس بات کا تعین کرنے کے لیے کیا جا سکتا ہے کہ آیا ڈیٹا کے دو آزاد نمونوں کے ذرائع کے درمیان کوئی خاص فرق ہے۔ اس ٹیوٹوریل میں، ہم t-ٹیسٹ کے سب سے بنیادی ورژن کی وضاحت کرتے ہیں، جس کے لیے ہم یہ فرض کریں گے کہ دونوں نمونوں میں مساوی تغیرات ہیں۔ t-ٹیسٹ کے دیگر جدید ورژنوں میں ویلچ کا t-ٹیسٹ شامل ہے، جو t-ٹیسٹ کی موافقت ہے، اور جب دو نمونوں میں غیر مساوی تغیرات اور ممکنہ طور پر غیر مساوی نمونے کے سائز ہوتے ہیں تو یہ زیادہ قابل اعتماد ہوتا ہے۔

ٹی کے اعدادوشمار یا ٹی ویلیو کا حساب اس طرح کیا جاتا ہے:

ازگر میں ٹی ٹیسٹ کرنا

کہاں $مساوات$

$مساوات$ نمونہ 1 کا اوسط ہے، $مساوات$ نمونہ 2 کا اوسط ہے، نمونہ 1 کا فرق ہے، نمونہ 2 کا فرق ہے، نمونہ 1 کا نمونہ سائز ہے، اور نمونہ 2 کا نمونہ سائز ہے۔

ٹی ٹیسٹ کے استعمال کو واضح کرنے کے لیے، ہم آئیرس ڈیٹاسیٹ کا استعمال کرتے ہوئے ایک سادہ سی مثال دکھائیں گے۔ فرض کریں کہ ہم دو آزاد نمونوں کا مشاہدہ کرتے ہیں، مثلاً پھول سیپل کی لمبائی، اور ہم اس بات پر غور کر رہے ہیں کہ آیا دونوں نمونے ایک ہی آبادی سے لیے گئے ہیں (مثلاً ایک ہی قسم کے پھول یا ایک جیسی سیپل خصوصیات والی دو نسلیں) یا دو مختلف آبادیوں سے۔

t-ٹیسٹ دو نمونوں کے ریاضی کے ذرائع کے درمیان فرق کی مقدار درست کرتا ہے۔ p-value مشاہدہ شدہ نتائج حاصل کرنے کے امکان کی مقدار بتاتی ہے، یہ فرض کرتے ہوئے کہ null hypothesis (کہ نمونے ایک ہی آبادی کے ذرائع سے حاصل کیے گئے ہیں) درست ہے۔ منتخب کردہ حد (مثلاً 5% یا 0.05) سے بڑی p-value اس بات کی نشاندہی کرتی ہے کہ ہمارا مشاہدہ اتفاقاً واقع ہونے کا امکان نہیں ہے۔ لہذا، ہم مساوی آبادی کے ذرائع کے کالعدم مفروضے کو قبول کرتے ہیں۔ اگر p-value ہماری حد سے چھوٹی ہے، تو ہمارے پاس مساوی آبادی کے ذرائع کے کالعدم مفروضے کے خلاف ثبوت ہیں۔

T-ٹیسٹ ان پٹ

ٹی ٹیسٹ کرنے کے لیے ضروری ان پٹ یا پیرامیٹرز یہ ہیں:

دو صفیں۔ a اور b نمونہ 1 اور نمونہ 2 کے ڈیٹا پر مشتمل ہے۔

T-ٹیسٹ آؤٹ پٹس

ٹی ٹیسٹ درج ذیل کو لوٹاتا ہے:

حسابی ٹی کے اعدادوشمار
پی ویلیو

ضروری لائبریریاں درآمد کریں۔

import numpy as np
from scipy import stats import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

Iris ڈیٹاسیٹ لوڈ کریں۔

from sklearn import datasets
iris = datasets.load_iris()
sep_length = iris.data[:,0]
a_1, a_2 = train_test_split(sep_length, test_size=0.4, random_state=0)
b_1, b_2 = train_test_split(sep_length, test_size=0.4, random_state=1)

نمونے کے ذرائع اور نمونے کے تغیرات کا حساب لگائیں۔

mu1 = np.mean(a_1) mu2 = np.mean(b_1) np.std(a_1) np.std(b_1)

ٹی ٹیسٹ کو لاگو کریں۔

stats.ttest_ind(a_1, b_1, equal_var = False)

آؤٹ پٹ

Ttest_indResult(statistic=0.830066093774641, pvalue=0.4076270841218671)

stats.ttest_ind(b_1, a_1, equal_var=False)

آؤٹ پٹ

Ttest_indResult(statistic=-0.830066093774641, pvalue=0.4076270841218671)

stats.ttest_ind(a_1, b_1, equal_var=True)

آؤٹ پٹ

Ttest_indResult(statistic=0.830066093774641, pvalue=0.4076132965045395)

تبصرے

ہم مشاہدہ کرتے ہیں کہ "برابر-وار" پیرامیٹر کے لیے "سچ" یا "غلط" کا استعمال ٹی ٹیسٹ کے نتائج کو اتنا تبدیل نہیں کرتا ہے۔ ہم یہ بھی مشاہدہ کرتے ہیں کہ نمونے کی صفوں کی ترتیب a_1 اور b_1 کو تبدیل کرنے سے منفی t-ٹیسٹ ویلیو حاصل ہوتی ہے، لیکن توقع کے مطابق t-ٹیسٹ ویلیو کی شدت میں کوئی تبدیلی نہیں آتی۔ چونکہ کیلکولیشن شدہ p-value 0.05 کی حد کی قدر سے بہت بڑی ہے، اس لیے ہم اس کالعدم مفروضے کو رد کر سکتے ہیں کہ نمونہ 1 اور نمونہ 2 کے ذرائع کے درمیان فرق اہم ہے۔ اس سے پتہ چلتا ہے کہ نمونہ 1 اور نمونہ 2 کے لئے سیپل کی لمبائی اسی آبادی کے اعداد و شمار سے تیار کی گئی تھی۔

a_1, a_2 = train_test_split(sep_length, test_size=0.4, random_state=0)
b_1, b_2 = train_test_split(sep_length, test_size=0.5, random_state=1)

نمونے کے ذرائع اور نمونے کے تغیرات کا حساب لگائیں۔

mu1 = np.mean(a_1) mu2 = np.mean(b_1) np.std(a_1) np.std(b_1)

ٹی ٹیسٹ کو لاگو کریں۔

stats.ttest_ind(a_1, b_1, equal_var = False)

آؤٹ پٹ

stats.ttest_ind(a_1, b_1, equal_var = False)

تبصرے

ہم مشاہدہ کرتے ہیں کہ غیر مساوی سائز کے نمونے استعمال کرنے سے t-statistics اور p-value نمایاں طور پر تبدیل نہیں ہوتی ہے۔

ازگر میں ٹی ٹیسٹ کرنا

خلاصہ طور پر، ہم نے دکھایا ہے کہ python میں اسکائپی لائبریری کا استعمال کرتے ہوئے ایک سادہ ٹی ٹیسٹ کو کیسے لاگو کیا جا سکتا ہے۔

بینجمن او ٹیو ایک ماہر طبیعیات، ڈیٹا سائنس معلم، اور مصنف کے ساتھ ساتھ DataScienceHub کے مالک ہیں۔ اس سے پہلے، بینجمن سینٹرل اوکلاہوما، گرینڈ کینین یو، اور پِٹسبرگ اسٹیٹ یو میں انجینئرنگ اور فزکس پڑھا رہے تھے۔

اس عنوان پر مزید

SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
پلیٹو بلاک چین۔ Web3 Metaverse Intelligence. علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
ماخذ: https://www.kdnuggets.com/2023/01/performing-ttest-python.html?utm_source=rss&utm_medium=rss&utm_campaign=performing-a-t-test-in-python

ٹائم اسٹیمپ: جنوری۳۱، ۲۰۱۹

انٹرایکٹو ایکسپلوریشن کے ذریعے ڈیٹا کی تفہیم کو تیز کرنا

ماخذ کلسٹر:

KDnuggets

ماخذ نوڈ: 1052500

ٹائم اسٹیمپ: اگست 19، 2021

ازگر میں ٹی ٹیسٹ کرنا

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

کلیدی لے لو

T-ٹیسٹ ان پٹ

T-ٹیسٹ آؤٹ پٹس

تبصرے

تبصرے

اس عنوان پر مزید

سے زیادہ KDnuggets

آپ کی خصوصیات اہم ہیں؟ اس کا یہ مطلب نہیں کہ وہ اچھے ہیں – KDnuggets

ونڈوز آن اسنیپ ڈریگن ایپس پر ہائبرڈ AI لاتا ہے - KDnuggets

چیٹ جی پی ٹی سیکھنے کے لیے سرفہرست مفت وسائل

KDnuggets™ نیوز 21:n32، 25 اگست: کمپیوٹر ویژن کے لیے اوپن سورس ڈیٹا سیٹس؛ جینگو کی 9 سب سے عام ایپلی کیشنز

چار ہفتوں میں ازگر سیکھنا: ایک روڈ میپ

ضروری MLOps: ایک مفت eBook – KDnuggets

انٹرایکٹو ایکسپلوریشن کے ذریعے ڈیٹا کی تفہیم کو تیز کرنا

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ