ภาพจาก Pexels
หน้าหนาวที่แล้วผมได้นำเสนอเรื่อง 'โมเดลอนุกรมเวลาที่สามารถคาดเดาได้มากขึ้นด้วย BQML'ที่ GDG DevFest ทาชเคนต์ 2022 ที่เมืองทาชเคนต์ เมืองหลวงของอุซเบกิสถาน
ฉันจะแชร์เนื้อหาและโค้ดบางส่วนหลังจาก DevFest ที่ใช้ในการนำเสนอ แต่เวลาผ่านไปแล้ว และฟีเจอร์ใหม่ๆ ได้รับการเผยแพร่ใน BQML ที่ทับซ้อนกับเนื้อหาบางส่วน
ดังนั้น ฉันจะพูดถึงฟีเจอร์ใหม่และบางสิ่งที่ยังคงใช้ได้ในช่วงสั้นๆ แทน
ข้อมูลอนุกรมเวลา ถูกใช้โดยองค์กรหลายแห่งเพื่อวัตถุประสงค์ที่หลากหลาย และสิ่งสำคัญที่ควรทราบก็คือ “การวิเคราะห์เชิงคาดการณ์s” เป็นเรื่องเกี่ยวกับ "อนาคต" ในเวลา การวิเคราะห์เชิงคาดการณ์อนุกรมเวลาถูกนำมาใช้ในระยะสั้น กลาง และระยะยาว และถึงแม้จะมีความไม่ถูกต้องและความเสี่ยงมากมาย แต่ก็มีการปรับปรุงอย่างต่อเนื่องเช่นกัน
เนื่องจาก "การคาดการณ์" ดูเหมือนจะมีประโยชน์มาก คุณอาจถูกล่อลวงให้ใช้แบบจำลองการคาดการณ์อนุกรมเวลา หากคุณมีข้อมูลอนุกรมเวลา แต่แบบจำลองการทำนายอนุกรมเวลามักจะใช้การประมวลผลอย่างเข้มข้น และหากคุณมีข้อมูลจำนวนมาก ก็จะใช้การประมวลผลอย่างเข้มข้นมากขึ้น ดังนั้นจึงยุ่งยากและประมวลผลได้ยาก โหลดเข้าสู่สภาพแวดล้อมการวิเคราะห์และวิเคราะห์
หากคุณกำลังใช้ Google BigQuery สำหรับการจัดการข้อมูลคุณสามารถใช้ บีคิวเอ็มL (BigQuery ML) เพื่อนำอัลกอริธึมแมชชีนเลิร์นนิงไปใช้กับข้อมูลของคุณด้วยวิธีที่ง่าย สะดวก และรวดเร็ว ผู้คนจำนวนมากใช้ BigQuery เพื่อประมวลผลข้อมูลจำนวนมาก และข้อมูลส่วนใหญ่มักเป็นข้อมูลอนุกรมเวลา และ BQML ยังรองรับโมเดลอนุกรมเวลาอีกด้วย
พื้นฐานของโมเดลอนุกรมเวลาที่รองรับโดย BQML ในปัจจุบันคือ ค่าเฉลี่ยเคลื่อนที่รวมแบบถดถอยอัตโนมัติ (ARIMA) แบบอย่าง. แบบจำลอง ARIMA คาดการณ์โดยใช้เฉพาะข้อมูลอนุกรมเวลาที่มีอยู่ และเป็นที่ทราบกันว่ามีประสิทธิภาพการคาดการณ์ระยะสั้นที่ดี และเนื่องจากแบบจำลองนี้รวม AR และ MA เข้าด้วยกัน จึงเป็นแบบจำลองยอดนิยมที่สามารถครอบคลุมแบบจำลองอนุกรมเวลาได้หลากหลาย
อย่างไรก็ตาม โมเดลนี้มีความเข้มข้นในการคำนวณโดยรวม และเนื่องจากใช้เฉพาะข้อมูลอนุกรมเวลาตามปกติ จึงเป็นเรื่องยากที่จะใช้ในกรณีที่มีแนวโน้มหรือฤดูกาล ดังนั้น, ARIMA_PLUS ใน BQML มีคุณสมบัติเพิ่มเติมหลายประการเป็นตัวเลือก คุณสามารถเพิ่มการแยกย่อยอนุกรมเวลา ปัจจัยตามฤดูกาล การเพิ่มขึ้นและการลดลง การเปลี่ยนแปลงค่าสัมประสิทธิ์ และอื่นๆ ให้กับโมเดลของคุณ หรือคุณสามารถดูแยกกันและปรับโมเดลด้วยตนเองได้ โดยส่วนตัวแล้วฉันชอบความจริงที่ว่าคุณสามารถปรับเปลี่ยนช่วงเวลาได้โดยการรวมตัวเลือกวันหยุดเข้าด้วยกันโดยอัตโนมัติ ซึ่งเป็นหนึ่งในข้อดีของการใช้แพลตฟอร์มที่ไม่ต้องการให้คุณเพิ่มข้อมูลที่เกี่ยวข้องกับวันที่ด้วยตนเอง
โครงสร้างของ ARIMA_PLUS (จาก คู่มือ BQML)
คุณสามารถอ้างถึงสิ่งนี้ หน้า สำหรับข้อมูลเพิ่มเติม
อย่างไรก็ตาม เมื่อพูดถึงแอปพลิเคชันในโลกแห่งความเป็นจริง การทำนายอนุกรมเวลาไม่ง่ายเท่านี้ แน่นอนว่า เราสามารถระบุหลายรอบและเพิ่มการแทรกแซงให้กับอนุกรมเวลาหลายรายการด้วย ARIMA_PLUS ได้ แต่มีปัจจัยภายนอกมากมายที่เกี่ยวข้องกับข้อมูลอนุกรมเวลา และมีเหตุการณ์เพียงไม่กี่เหตุการณ์เท่านั้นที่เกิดขึ้นแยกกัน ความคงที่นั้นหาได้ยากในข้อมูลอนุกรมเวลา
ในการนำเสนอดั้งเดิม ฉันดูวิธีจัดการกับข้อมูลอนุกรมเวลาในโลกแห่งความเป็นจริงสำหรับการสร้างแบบจำลองการทำนาย สลายอนุกรมเวลาเหล่านี้ทำความสะอาดข้อมูลที่แยกส่วน นำเข้าสู่ Python จากนั้น นำมารวมกับตัวแปรอื่นๆ เพื่อสร้างฟังก์ชันอนุกรมเวลาหลายตัวแปร ประมาณการความเป็นเหตุเป็นผลและรวมเข้ากับแบบจำลองการทำนาย และประมาณระดับที่ผลกระทบจะแตกต่างกันไปตามการเปลี่ยนแปลงของเหตุการณ์
และในช่วงไม่กี่เดือนที่ผ่านมานี้เอง คุณสมบัติใหม่สำหรับการสร้างฟังก์ชันอนุกรมเวลาหลายตัวแปรพร้อมตัวแปรภายนอก (ARIMA_PLUS_XREG, XREG ด้านล่าง) ได้กลายเป็นคุณสมบัติโดยสิ้นเชิงใน BQML.
คุณสามารถอ่านทั้งหมดเกี่ยวกับเรื่องนี้ โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม(อยู่ในช่วงตัวอย่าง ณ เดือนกรกฎาคม 2023 แต่คาดว่าจะวางจำหน่ายในปลายปีนี้)
ฉันสมัคร บทช่วยสอนอย่างเป็นทางการ เพื่อดูว่ามันเปรียบเทียบกับแบบจำลองอนุกรมเวลาแบบไม่แปรผันแบบดั้งเดิมอย่างไร และเราจะดูว่ามันทำงานอย่างไร
ขั้นตอนเหมือนกับในบทช่วยสอน ดังนั้นฉันจะไม่ทำซ้ำขั้นตอนเหล่านี้ แต่นี่คือโมเดลทั้งสองที่ฉันสร้างขึ้น ขั้นแรก ฉันสร้างแบบดั้งเดิม ARIMA_PLUS รุ่นและจากนั้น เอ็กซ์เร็ก โดยใช้ข้อมูลเดียวกันแต่เพิ่มอุณหภูมิและความเร็วลมในขณะนั้น
# ARIMA_PLUS
# ARIMA_PLUS
CREATE OR REPLACE MODEL test_dt_us.seattle_pm25_plus_model
OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS', time_series_timestamp_col = 'date', time_series_data_col = 'pm25') AS
SELECT date, pm25
FROM test_dt_us.seattle_air_quality_daily
WHERE date BETWEEN DATE('2012-01-01') AND DATE('2020-12-31')
#ARIMA_PLUS_XREG
CREATE OR REPLACE MODEL test_dt_us.seattle_pm25_xreg_model OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS_XREG', time_series_timestamp_col = 'date', time_series_data_col = 'pm25') AS
SELECT date, pm25, temperature, wind_speed
FROM test_dt_us.seattle_air_quality_daily
WHERE date BETWEEN DATE('2012-01-01') AND DATE('2020-12-31')
โมเดลที่ใช้ข้อมูลหลายรายการเหล่านี้จะมีลักษณะดังนี้
โครงสร้าง ARIMA_PLUS_XREG (จาก คู่มือ BQML)
มีการเปรียบเทียบสองโมเดลกับ ML.Evaluate
SELECT * FROM ML.EVALUATE ( MODEL test_dt_us.seattle_pm25_plus_model, ( SELECT date, pm25 FROM test_dt_us.seattle_air_quality_daily WHERE date > DATE('2020-12-31') ))
SELECT * FROM ML.EVALUATE ( MODEL test_dt_us.seattle_pm25_xreg_model, ( SELECT date, pm25, temperature, wind_speed FROM test_dt_us.seattle_air_quality_daily WHERE date > DATE('2020-12-31') ), STRUCT( TRUE AS perform_aggregation, 30 AS horizon))
ผลลัพธ์อยู่ด้านล่าง
ARIMA_PLUS
ARIMA_PLUS_XREG
คุณจะเห็นว่าไฟล์ โมเดล XREG ล้ำหน้าในด้านการวัดประสิทธิภาพพื้นฐาน เช่น MAE, MSE และ MAPE (แน่นอนว่านี่ไม่ใช่วิธีแก้ปัญหาที่สมบูรณ์แบบ ขึ้นอยู่กับข้อมูลและเราบอกได้เลยว่าเรามีเครื่องมือที่มีประโยชน์อีกอย่างหนึ่ง)
การวิเคราะห์อนุกรมเวลาหลายตัวแปรเป็นตัวเลือกที่จำเป็นมากในหลายกรณี แต่มักจะนำไปใช้ได้ยากเนื่องจากเหตุผลหลายประการ ตอนนี้เราสามารถใช้มันได้หากเหตุผลอยู่ในข้อมูลและขั้นตอนการวิเคราะห์ ดูเหมือนว่าเราจะมีตัวเลือกที่ดีสำหรับการทำเช่นนั้น ดังนั้นจึงเป็นเรื่องดีที่จะทราบเรื่องนี้ และหวังว่าจะเป็นประโยชน์ในหลาย ๆ กรณี
จองมิน ควอน เป็นนักวิทยาศาสตร์ข้อมูลอาวุโสอิสระที่มีประสบการณ์ตรงมากกว่า 10 ปี โดยใช้ประโยชน์จากโมเดลการเรียนรู้ของเครื่องและการขุดข้อมูล
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. ยานยนต์ / EVs, คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- BlockOffsets การปรับปรุงการเป็นเจ้าของออฟเซ็ตด้านสิ่งแวดล้อมให้ทันสมัย เข้าถึงได้ที่นี่.
- ที่มา: https://www.kdnuggets.com/2023/07/multivariate-timeseries-prediction-bqml.html?utm_source=rss&utm_medium=rss&utm_campaign=multivariate-time-series-prediction-with-bqml
- :มี
- :เป็น
- :ไม่
- :ที่ไหน
- $ ขึ้น
- 2023
- 30
- a
- สามารถ
- เกี่ยวกับเรา
- เกี่ยวกับมัน
- เพิ่ม
- เพิ่ม
- เพิ่มเติม
- หลังจาก
- ก่อน
- อัลกอริทึม
- ทั้งหมด
- ด้วย
- an
- การวิเคราะห์
- การวิเคราะห์
- วิเคราะห์
- และ
- อื่น
- การใช้งาน
- ใช้
- AR
- เป็น
- AS
- At
- อัตโนมัติ
- ใช้ได้
- เฉลี่ย
- ขั้นพื้นฐาน
- รากฐาน
- BE
- กลายเป็น
- รับ
- ด้านล่าง
- ประโยชน์ที่ได้รับ
- ระหว่าง
- คำถามใหญ่
- สั้น
- แต่
- by
- CAN
- เมืองหลวง
- กรณี
- การเปลี่ยนแปลง
- รหัส
- รวม
- มา
- ชุมชน
- เมื่อเทียบกับ
- เนื้อหา
- หลักสูตร
- หน้าปก
- สร้าง
- ที่สร้างขึ้น
- การสร้าง
- ขณะนี้
- รอบ
- ข้อมูล
- การจัดการข้อมูล
- การทำเหมืองข้อมูล
- นักวิทยาศาสตร์ข้อมูล
- วันที่
- วันที่
- จัดการ
- องศา
- ยาก
- ไม่
- สอง
- ง่าย
- ผล
- สิ่งแวดล้อม
- ประมาณการ
- ประเมินค่า
- เหตุการณ์
- ที่มีอยู่
- ประสบการณ์
- ภายนอก
- ความจริง
- ปัจจัย
- FAST
- ลักษณะ
- คุณสมบัติ
- สองสาม
- หา
- ชื่อจริง
- สำหรับ
- อาชีพอิสระ
- ราคาเริ่มต้นที่
- ฟังก์ชัน
- ฟังก์ชั่น
- Go
- ไป
- ดี
- มือบน
- เกิดขึ้น
- ยาก
- มี
- โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม
- วันหยุด
- หวังว่า
- ขอบฟ้า
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- ทำอย่างไร
- HTTPS
- i
- ฉันเป็น
- แยกแยะ
- if
- นำเข้า
- สำคัญ
- การปรับปรุง
- in
- รวมถึง
- รวมเข้าด้วยกัน
- ผสมผสาน
- ข้อมูล
- แทน
- แบบบูรณาการ
- เข้าไป
- ความเหงา
- IT
- jpg
- กรกฎาคม
- เพียงแค่
- KD นักเก็ต
- ทราบ
- ที่รู้จักกัน
- ชื่อสกุล
- ต่อมา
- การเรียนรู้
- การใช้ประโยชน์
- กดไลก์
- โหลด
- นาน
- ดู
- มอง
- LOOKS
- Lot
- เครื่อง
- เรียนรู้เครื่อง
- การทำ
- การจัดการ
- ด้วยมือ
- หลาย
- วัสดุ
- กลาง
- ตัวชี้วัด
- อาจ
- การทำเหมืองแร่
- ML
- แบบ
- โมเดล
- เดือน
- ข้อมูลเพิ่มเติม
- การย้าย
- ค่าเฉลี่ยการเคลื่อนที่
- จำเป็นมาก
- หลาย
- ใหม่
- คุณลักษณะใหม่
- คุณสมบัติใหม่
- ตอนนี้
- of
- เป็นทางการ
- มักจะ
- on
- ONE
- เพียง
- ตัวเลือกเสริม (Option)
- Options
- or
- องค์กร
- เป็นต้นฉบับ
- อื่นๆ
- ทั้งหมด
- ผ่าน
- คน
- สมบูรณ์
- การปฏิบัติ
- ส่วนตัว
- เวที
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- ยอดนิยม
- ทายได้
- คำทำนาย
- การวิเคราะห์เชิงทำนาย
- คาดการณ์
- การเสนอ
- ดูตัวอย่าง
- กระบวนการ
- วัตถุประสงค์
- หลาม
- พิสัย
- อ่าน
- โลกแห่งความจริง
- เหตุผล
- ที่เกี่ยวข้อง
- การเผยแพร่
- แทนที่
- ต้องการ
- ความเสี่ยง
- เดียวกัน
- กล่าว
- นักวิทยาศาสตร์
- เห็น
- ดูเหมือนว่า
- ระดับอาวุโส
- ชุด
- หลาย
- Share
- สั้น
- ระยะสั้น
- ง่าย
- ตั้งแต่
- So
- ทางออก
- บาง
- บางสิ่งบางอย่าง
- ความเร็ว
- แหลม
- ขั้นตอน
- ยังคง
- อย่างเช่น
- ที่สนับสนุน
- รองรับ
- ระยะ
- ที่
- พื้นที่
- เมืองหลวง
- พวกเขา
- แล้วก็
- ที่นั่น
- ดังนั้น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- สิ่ง
- นี้
- ในปีนี้
- ตลอด
- เวลา
- อนุกรมเวลา
- ไปยัง
- เครื่องมือ
- แบบดั้งเดิม
- แนวโน้ม
- จริง
- เกี่ยวกับการสอน
- สอง
- ใช้
- มือสอง
- ใช้
- การใช้
- มักจะ
- ใช้ประโยชน์
- อุซเบกิ
- ความหลากหลาย
- ต่างๆ
- มาก
- คือ
- ทาง..
- we
- เมื่อ
- ที่
- ในขณะที่
- กว้าง
- ช่วงกว้าง
- วิกิพีเดีย
- จะ
- ลม
- ฤดูหนาว
- กับ
- โรงงาน
- จะ
- ปี
- ปี
- เธอ
- ของคุณ
- ลมทะเล