ازگر میں ٹی ٹیسٹ کرنا

ازگر میں ٹی ٹیسٹ کرنا

ماخذ نوڈ: 1902069

ازگر میں ٹی ٹیسٹ کرنا
تصویر بذریعہ ایڈیٹر

کلیدی لے لو

  • ٹی ٹیسٹ ایک شماریاتی ٹیسٹ ہے جس کا استعمال اس بات کا تعین کرنے کے لیے کیا جا سکتا ہے کہ آیا ڈیٹا کے دو آزاد نمونوں کے ذرائع کے درمیان کوئی خاص فرق ہے۔
  • ہم واضح کرتے ہیں کہ کس طرح آئیرس ڈیٹاسیٹ اور پائتھون کی اسکائپی لائبریری کا استعمال کرتے ہوئے ٹی ٹیسٹ کا اطلاق کیا جا سکتا ہے۔

ٹی ٹیسٹ ایک شماریاتی ٹیسٹ ہے جس کا استعمال اس بات کا تعین کرنے کے لیے کیا جا سکتا ہے کہ آیا ڈیٹا کے دو آزاد نمونوں کے ذرائع کے درمیان کوئی خاص فرق ہے۔ اس ٹیوٹوریل میں، ہم t-ٹیسٹ کے سب سے بنیادی ورژن کی وضاحت کرتے ہیں، جس کے لیے ہم یہ فرض کریں گے کہ دونوں نمونوں میں مساوی تغیرات ہیں۔ t-ٹیسٹ کے دیگر جدید ورژنوں میں ویلچ کا t-ٹیسٹ شامل ہے، جو t-ٹیسٹ کی موافقت ہے، اور جب دو نمونوں میں غیر مساوی تغیرات اور ممکنہ طور پر غیر مساوی نمونے کے سائز ہوتے ہیں تو یہ زیادہ قابل اعتماد ہوتا ہے۔

ٹی کے اعدادوشمار یا ٹی ویلیو کا حساب اس طرح کیا جاتا ہے:

 

ازگر میں ٹی ٹیسٹ کرنا
 

کہاں مساوات

مساوات نمونہ 1 کا اوسط ہے، مساوات نمونہ 2 کا اوسط ہے، مساوات نمونہ 1 کا فرق ہے، مساوات نمونہ 2 کا فرق ہے، مساوات نمونہ 1 کا نمونہ سائز ہے، اور مساوات نمونہ 2 کا نمونہ سائز ہے۔

ٹی ٹیسٹ کے استعمال کو واضح کرنے کے لیے، ہم آئیرس ڈیٹاسیٹ کا استعمال کرتے ہوئے ایک سادہ سی مثال دکھائیں گے۔ فرض کریں کہ ہم دو آزاد نمونوں کا مشاہدہ کرتے ہیں، مثلاً پھول سیپل کی لمبائی، اور ہم اس بات پر غور کر رہے ہیں کہ آیا دونوں نمونے ایک ہی آبادی سے لیے گئے ہیں (مثلاً ایک ہی قسم کے پھول یا ایک جیسی سیپل خصوصیات والی دو نسلیں) یا دو مختلف آبادیوں سے۔

t-ٹیسٹ دو نمونوں کے ریاضی کے ذرائع کے درمیان فرق کی مقدار درست کرتا ہے۔ p-value مشاہدہ شدہ نتائج حاصل کرنے کے امکان کی مقدار بتاتی ہے، یہ فرض کرتے ہوئے کہ null hypothesis (کہ نمونے ایک ہی آبادی کے ذرائع سے حاصل کیے گئے ہیں) درست ہے۔ منتخب کردہ حد (مثلاً 5% یا 0.05) سے بڑی p-value اس بات کی نشاندہی کرتی ہے کہ ہمارا مشاہدہ اتفاقاً واقع ہونے کا امکان نہیں ہے۔ لہذا، ہم مساوی آبادی کے ذرائع کے کالعدم مفروضے کو قبول کرتے ہیں۔ اگر p-value ہماری حد سے چھوٹی ہے، تو ہمارے پاس مساوی آبادی کے ذرائع کے کالعدم مفروضے کے خلاف ثبوت ہیں۔

T-ٹیسٹ ان پٹ

ٹی ٹیسٹ کرنے کے لیے ضروری ان پٹ یا پیرامیٹرز یہ ہیں:

  • دو صفیں۔ a اور b نمونہ 1 اور نمونہ 2 کے ڈیٹا پر مشتمل ہے۔

T-ٹیسٹ آؤٹ پٹس

ٹی ٹیسٹ درج ذیل کو لوٹاتا ہے:

  • حسابی ٹی کے اعدادوشمار
  • پی ویلیو

ضروری لائبریریاں درآمد کریں۔

import numpy as np
from scipy import stats import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

 

Iris ڈیٹاسیٹ لوڈ کریں۔

from sklearn import datasets
iris = datasets.load_iris()
sep_length = iris.data[:,0]
a_1, a_2 = train_test_split(sep_length, test_size=0.4, random_state=0)
b_1, b_2 = train_test_split(sep_length, test_size=0.4, random_state=1)

 

نمونے کے ذرائع اور نمونے کے تغیرات کا حساب لگائیں۔

mu1 = np.mean(a_1) mu2 = np.mean(b_1) np.std(a_1) np.std(b_1)

 

ٹی ٹیسٹ کو لاگو کریں۔

stats.ttest_ind(a_1, b_1, equal_var = False)

 

آؤٹ پٹ 

Ttest_indResult(statistic=0.830066093774641, pvalue=0.4076270841218671)

 

stats.ttest_ind(b_1, a_1, equal_var=False)

 

آؤٹ پٹ 

Ttest_indResult(statistic=-0.830066093774641, pvalue=0.4076270841218671)

 

stats.ttest_ind(a_1, b_1, equal_var=True)

 

آؤٹ پٹ

Ttest_indResult(statistic=0.830066093774641, pvalue=0.4076132965045395)

تبصرے

ہم مشاہدہ کرتے ہیں کہ "برابر-وار" پیرامیٹر کے لیے "سچ" یا "غلط" کا استعمال ٹی ٹیسٹ کے نتائج کو اتنا تبدیل نہیں کرتا ہے۔ ہم یہ بھی مشاہدہ کرتے ہیں کہ نمونے کی صفوں کی ترتیب a_1 اور b_1 کو تبدیل کرنے سے منفی t-ٹیسٹ ویلیو حاصل ہوتی ہے، لیکن توقع کے مطابق t-ٹیسٹ ویلیو کی شدت میں کوئی تبدیلی نہیں آتی۔ چونکہ کیلکولیشن شدہ p-value 0.05 کی حد کی قدر سے بہت بڑی ہے، اس لیے ہم اس کالعدم مفروضے کو رد کر سکتے ہیں کہ نمونہ 1 اور نمونہ 2 کے ذرائع کے درمیان فرق اہم ہے۔ اس سے پتہ چلتا ہے کہ نمونہ 1 اور نمونہ 2 کے لئے سیپل کی لمبائی اسی آبادی کے اعداد و شمار سے تیار کی گئی تھی۔

a_1, a_2 = train_test_split(sep_length, test_size=0.4, random_state=0)
b_1, b_2 = train_test_split(sep_length, test_size=0.5, random_state=1)

 

نمونے کے ذرائع اور نمونے کے تغیرات کا حساب لگائیں۔

mu1 = np.mean(a_1) mu2 = np.mean(b_1) np.std(a_1) np.std(b_1)

 

ٹی ٹیسٹ کو لاگو کریں۔

stats.ttest_ind(a_1, b_1, equal_var = False)

 

آؤٹ پٹ

stats.ttest_ind(a_1, b_1, equal_var = False)

تبصرے

ہم مشاہدہ کرتے ہیں کہ غیر مساوی سائز کے نمونے استعمال کرنے سے t-statistics اور p-value نمایاں طور پر تبدیل نہیں ہوتی ہے۔ 
 

ازگر میں ٹی ٹیسٹ کرنا

 

خلاصہ طور پر، ہم نے دکھایا ہے کہ python میں اسکائپی لائبریری کا استعمال کرتے ہوئے ایک سادہ ٹی ٹیسٹ کو کیسے لاگو کیا جا سکتا ہے۔
 
 
بینجمن او ٹیو ایک ماہر طبیعیات، ڈیٹا سائنس معلم، اور مصنف کے ساتھ ساتھ DataScienceHub کے مالک ہیں۔ اس سے پہلے، بینجمن سینٹرل اوکلاہوما، گرینڈ کینین یو، اور پِٹسبرگ اسٹیٹ یو میں انجینئرنگ اور فزکس پڑھا رہے تھے۔
 

ٹائم اسٹیمپ:

سے زیادہ KDnuggets