แม้ว่าหลายคนอยากจะลืมปี 2020 แต่นักวิทยาศาสตร์ด้านข้อมูลจะยังคงเป็นปีแรกที่เราคำนึงถึง ในขณะที่เราพิจารณาว่าผลกระทบของโรคระบาดใหญ่ทำให้ข้อมูลในปี 2020 ผิดปกติหรือเป็นการบ่งชี้ถึงการเปลี่ยนแปลงอย่างถาวรในระดับอุดมศึกษา เมื่อเราพัฒนาโมเดลการคาดการณ์ใหม่และอัปเดตโมเดลที่มีอยู่ด้วยข้อมูลที่รวบรวมในปีที่แล้ว เราจะต้องวิเคราะห์ผลกระทบของมันและตัดสินใจว่าจะชั่งน้ำหนักข้อมูลนั้นมากเพียงใดเมื่อพยายามคาดการณ์ว่าจะเกิดอะไรขึ้นต่อไป
เกิน การเปลี่ยนแปลงอย่างมากของจำนวนนักศึกษาที่สมัครและลงทะเบียนปีที่แล้วแม้แต่ข้อมูลที่คุ้นเคยจากเอกสารประกอบการสมัครก็ยังมีน้อยลง ทำให้วิทยาลัยคาดการณ์ได้ยากขึ้นว่าผู้สมัครและนักศึกษาที่กลับมาเรียนมีแนวโน้มที่จะประพฤติตัวอย่างไร เนื่องจากความยากที่นักเรียนต้องสอบ SAT หรือ ACT ในช่วงการระบาดใหญ่ หลายสถาบันได้ไปทดสอบตัวเลือก. ข้อมูลการสอบที่ยากขึ้นและการเปลี่ยนแปลงจำนวน ประเภท และระยะเวลาของการสมัครและการลงทะเบียนสูง ทำให้รอบประจำปีที่คุ้นเคยของการดำเนินการ ed ที่สูงขึ้นคาดเดาน้อยลง
เจ้าหน้าที่ฝ่ายธุรการและผู้จัดการการลงทะเบียนกำลังถามตัวเองหลายคำถาม พวกเขาควรคาดหวังให้สิ่งต่างๆ กลับสู่รูปแบบ "ปกติ" ก่อนเกิดโควิด-XNUMX ในปีนี้หรือเปลี่ยนแปลงความคาดหวังของตนอย่างถาวรหรือไม่ พวกเขาควรเปลี่ยนเกณฑ์การรับเข้าเรียนหรือทุนการศึกษาหรือไม่? พวกเขาควรละทิ้งแบบจำลองการทำนายที่พวกเขาฝึกฝนเกี่ยวกับข้อมูลที่ผ่านมาหลังจากปีที่ไม่เคยมีมาก่อนหรือไม่? และหากพวกเขารักษากระบวนการและเครื่องมือที่มีอยู่ พวกเขาจะทำงานร่วมกับนักวิทยาศาสตร์ข้อมูลเพื่อปรับเทียบใหม่เพื่อให้ยังคงมีประโยชน์ได้อย่างไร
ฉันเชื่อว่าแบบจำลองการคาดการณ์ยังคงให้คุณค่ามากมายแก่มหาวิทยาลัย ประการหนึ่ง โมเดลที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลในอดีตจะมีประโยชน์อย่างยิ่งในการทำความเข้าใจว่าความเป็นจริงแตกต่างจากความคาดหวังอย่างไร แต่ปีที่แล้วได้เผยให้เห็นถึงความสำคัญเพียงใดที่เราเข้าใจอย่างถ่องแท้ว่า "อย่างไร" และ "ทำไม" ของการคาดคะเนที่เครื่องมือเหล่านี้ทำขึ้นเกี่ยวกับ "ใคร" ที่มีแนวโน้มจะลงทะเบียนมากที่สุดหรืออาจต้องการบริการเพิ่มเติมเพื่อช่วยให้พวกเขาประสบความสำเร็จใน สถาบัน.
โมเดลอะไรผิดพลาดและถูกต้อง
เมื่อประเมินแบบจำลองที่ฉันสร้างก่อนเกิดโควิด-19 ฉันพบว่าการระบาดใหญ่กระตุ้นแนวโน้มและความสัมพันธ์ที่แบบจำลองระบุไว้ในข้อมูลที่ผ่านมา โดยพื้นฐานแล้ว มันคาดการณ์เสียง แต่ไม่ได้คาดการณ์อัตราและขนาด
ตัวอย่างหนึ่งคือความสัมพันธ์ระหว่างความต้องการทางการเงินที่ไม่เป็นไปตามข้อกำหนดและการรักษานักศึกษาไว้ นักเรียนที่มีความต้องการซึ่งไม่ได้รับการคุ้มครองโดยความช่วยเหลือทางการเงินมักจะลงทะเบียนซ้ำในอัตราที่ต่ำกว่า รูปแบบนั้นดูเหมือนว่าจะดำเนินต่อไปในช่วงการแพร่ระบาด และแบบจำลองมักจะระบุได้อย่างถูกต้องว่านักเรียนคนใดมีความเสี่ยงมากที่สุดที่จะไม่ลงทะเบียนเรียนในภาคเรียนถัดไปอันเนื่องมาจากปัญหาทางการเงิน
แต่ในบริบทของวิกฤต ตัวแบบอาจมองโลกในแง่ดีเกินไปเกี่ยวกับความเป็นไปได้ที่นักเรียนคนอื่นๆ จะกลับมา เนื่องจากอนาคตทางการเงินของครอบครัวเริ่มมีความแน่นอนน้อยลง ความต้องการทางการเงินที่ไม่ได้รับการแก้ไขโดยการกู้ยืม ทุนการศึกษา และเงินช่วยเหลืออาจส่งผลกระทบมากกว่าปกติต่อการตัดสินใจของนักเรียนที่จะไม่ลงทะเบียนเรียนซ้ำ ซึ่งอาจช่วยอธิบายได้ว่าทำไมอัตราการรักษาโดยรวมจึงลดลงอย่างรวดเร็วในปี 2020 มากกว่าแบบจำลองที่สถาบันหลายแห่งคาดไว้
โมเดลที่สร้างคะแนนความเป็นไปได้ในการเก็บรักษาโดยใช้แนวทาง "กล่องดำ" มากกว่า (อธิบายได้น้อยกว่า) และไม่มีบริบทเพิ่มเติมว่าตัวแปรใดมีน้ำหนักมากที่สุด ให้ข้อมูลเชิงลึกที่มีคุณค่าน้อยลงเพื่อช่วยให้สถาบันจัดการกับความเสี่ยงในการเก็บรักษาที่ขยายวงกว้างขึ้นในขณะนี้ สถาบันที่ใช้แบบจำลองประเภทนี้มีความเข้าใจน้อยกว่าว่าการระบาดใหญ่ส่งผลต่อผลลัพธ์ของการคาดการณ์อย่างไร ทำให้ยากต่อการพิจารณาว่าจะใช้งานต่อไปหรือไม่และภายใต้สถานการณ์ใด
เพียงเพราะแบบจำลองการคาดการณ์ทำงานได้ดีและสามารถอธิบายได้ ไม่ได้หมายความว่าแบบจำลองและระบบที่แสดงนั้นได้รับการยกเว้นจากการตรวจสอบอย่างละเอียด อาจเป็นเรื่องดีที่เราต้องพิจารณาผลลัพธ์ของแบบจำลองของเราให้ละเอียดยิ่งขึ้น และพิจารณาว่ารุ่นใดเป็นรุ่นใดและทำงานได้ไม่ดีภายใต้สถานการณ์ใหม่ของเรา
หากครอบครัวที่ร่ำรวยสามารถ "หลบหนี" การระบาดใหญ่ได้ดีขึ้น นักเรียนจากครอบครัวเหล่านั้นอาจลงทะเบียนใกล้กับอัตราก่อนเกิดโรคระบาด ในทางกลับกัน โมเดลคาดการณ์การลงทะเบียนได้ดี แต่ครอบครัวที่ไวรัสแสดงสุขภาพหรือความเสี่ยงทางเศรษฐกิจที่สูงขึ้นอาจทำการตัดสินใจที่แตกต่างกันเกี่ยวกับการส่งลูกไปเรียนที่วิทยาลัยในช่วงการระบาดใหญ่ แม้ว่าสถานะปัจจุบันของพวกเขาจะไม่เปลี่ยนแปลง “บนกระดาษ” หรือในชุดข้อมูลที่แบบจำลองใช้ การระบุกลุ่มที่การคาดการณ์ของแบบจำลองมีความแม่นยำน้อยกว่าในยามยากจะเน้นถึงปัจจัยที่แบบจำลองไม่ทราบ ซึ่งมีผลกระทบต่อนักเรียนในโลกแห่งความเป็นจริง
อคติอัลกอริทึมที่ท้าทาย
การระบุบุคคลที่เป็นแบบอย่างมองข้ามหรือมีลักษณะผิดเพี้ยนในเวลาที่ความเหลื่อมล้ำทางสังคมปรากฏให้เห็นและเป็นอันตรายยิ่งมีความสำคัญยิ่งขึ้นไปอีก ชุมชนชายขอบได้รับผลกระทบจากสุขภาพและผลกระทบทางการเงินของ COVID-19 มี อคติทางสังคมในอดีต “หลอมรวม” ข้อมูลของเรา และระบบการสร้างแบบจำลอง และเครื่องจักรที่เร่งและขยายกระบวนการที่มีอยู่มักจะทำให้อคติเหล่านั้นคงอยู่ต่อไป แบบจำลองการคาดการณ์และนักวิทยาศาสตร์ด้านข้อมูลมนุษย์ควรทำงานร่วมกันเพื่อให้แน่ใจว่าบริบททางสังคมและปัจจัยสำคัญอื่นๆ แจ้งผลลัพธ์ของอัลกอริทึม
ตัวอย่างเช่น ปีที่แล้ว อัลกอริธึมเข้ามาแทนที่การสอบเข้าวิทยาลัยของสหราชอาณาจักร โดยคาดการณ์ว่านักเรียนจะทำข้อสอบอย่างไรหากพวกเขาทำข้อสอบ อัลกอริธึมสร้างผลลัพธ์ที่ขัดแย้งกันอย่างมาก
ครูประมาณการว่านักเรียนของพวกเขาจะทำข้อสอบอย่างไร จากนั้นอัลกอริธึมก็ปรับการทำนายของมนุษย์ตามผลงานในอดีตของนักเรียนจากแต่ละโรงเรียน เนื่องจาก Axios รายงาน“เหยื่อที่ใหญ่ที่สุดคือนักเรียนที่ได้คะแนนสูงจากโรงเรียนด้อยโอกาส ซึ่งมีแนวโน้มว่าคะแนนจะถูกลดระดับลง ในขณะที่นักเรียนจากโรงเรียนที่ร่ำรวยกว่ามีแนวโน้มที่จะได้คะแนนเพิ่มขึ้น”
บทความสรุปว่า: “อัลกอริธึมที่ออกแบบมาไม่ดีนั้นเสี่ยงต่ออคติรูปแบบใหม่ที่อาจส่งผลกระทบไปไกลกว่าตำแหน่งในมหาวิทยาลัย” รัฐบาลอังกฤษได้ละทิ้งอัลกอริธึม หลังจากการโห่ร้องของประชาชนจำนวนมาก รวมถึงจากนักเรียนที่ทำข้อสอบจำลองได้ดีกว่าผลลัพธ์ที่สร้างโดยอัลกอริธึม
เพื่อหลีกเลี่ยงสถานการณ์ที่ไม่เป็นธรรมที่ส่งผลต่อวิถีชีวิตของนักเรียน ไม่ควรใช้แบบจำลองการคาดการณ์ในการตัดสินใจที่มีผลกระทบสูงโดยที่ผู้เชี่ยวชาญในโดเมนไม่ตรวจสอบทุกผลลัพธ์และมีอำนาจที่จะท้าทายหรือแทนที่พวกเขา โมเดลเหล่านี้ต้องโปร่งใสและอธิบายได้ดีที่สุด ข้อมูลและวิธีการต้องได้รับการจัดทำเป็นเอกสารและพร้อมสำหรับการตรวจสอบ การคาดคะเนอัตโนมัติสามารถแจ้งให้ผู้มีอำนาจตัดสินใจของมนุษย์ทราบ แต่ไม่ควรแทนที่ นอกจากนี้ ควรเปรียบเทียบการคาดคะเนกับผลลัพธ์จริงเสมอ และต้องติดตามแบบจำลองเพื่อกำหนดว่าเมื่อใดที่จำเป็นต้องฝึกใหม่ เนื่องจากความเป็นจริงที่เปลี่ยนแปลงไป
ในท้ายที่สุด ในขณะที่ปี 2020 เปิดเผยความจริงที่ยากเกี่ยวกับระบบและแบบจำลองที่มีอยู่ของเรา แต่ปี 2021 กลับเปิดโอกาสให้สถาบันต่างๆ ตระหนักถึงข้อบกพร่อง จัดการกับอคติ และแนวทางการรีเซ็ต รุ่นต่อไปของแบบจำลองจะแข็งแกร่งขึ้น ข้อมูลและข้อมูลเชิงลึกที่ดีขึ้นจะเป็นประโยชน์ต่อทุกคน
ที่มา: https://www.edsurge.com/news/2021-04-16-can-college-predictive-models-survive-the-pandemic
- เพิ่มเติม
- ขั้นตอนวิธี
- อัลกอริทึม
- การใช้งาน
- การใช้งาน
- บทความ
- อัตโนมัติ
- Axios
- ที่ใหญ่ที่สุด
- British
- ท้าทาย
- เปลี่ยนแปลง
- เด็ก
- ใกล้ชิด
- วิทยาลัย
- ชุมชน
- ต่อ
- Covid-19
- วิกฤติ
- ปัจจุบัน
- ข้อมูล
- พัฒนา
- ด้านเศรษฐกิจ
- ครอบครัว
- ทางการเงิน
- ความช่วยเหลือทางการเงิน
- ข้อบกพร่อง
- ฟอร์ม
- ฟิวเจอร์ส
- ดี
- รัฐบาล
- ทุน
- สุขภาพ
- จุดสูง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTTPS
- แยกแยะ
- ส่งผลกระทบ
- รวมทั้ง
- ข้อมูล
- ข้อมูลเชิงลึก
- สถาบัน
- สถาบัน
- ปัญหา
- IT
- การเก็บรักษา
- เงินให้กู้ยืม
- เครื่อง
- การทำ
- วัสดุ
- แบบ
- การสร้างแบบจำลอง
- เสนอ
- การดำเนินการ
- โอกาส
- อื่นๆ
- การระบาดกระจายทั่ว
- แบบแผน
- คน
- การปฏิบัติ
- อำนาจ
- การคาดการณ์
- ผลิต
- สาธารณะ
- ราคา
- ความจริง
- ผลสอบ
- ทบทวน
- ความเสี่ยง
- ขนาด
- โรงเรียน
- โรงเรียน
- นักวิทยาศาสตร์
- บริการ
- สังคม
- Status
- นักเรียน
- ระบบ
- ระบบ
- เวลา
- ด้านบน
- แนวโน้ม
- สหราชอาณาจักร
- มหาวิทยาลัย
- มหาวิทยาลัย
- บันทึก
- ความคุ้มค่า
- ไวรัส
- ชั่งน้ำหนัก
- น้ำหนัก
- WHO
- งาน
- ปี