ความสามารถในการสังเกตข้อมูล: มันคืออะไรและเหตุใดจึงสำคัญ - DATAVERSITY

ความสามารถในการสังเกตข้อมูล: มันคืออะไรและเหตุใดจึงสำคัญ – DATAVERSITY

โหนดต้นทาง: 2691645
ความสามารถในการสังเกตข้อมูลความสามารถในการสังเกตข้อมูล

ในกระบวนการ ความสามารถในการสังเกตข้อมูลถูกใช้โดยธุรกิจที่ทำงานกับข้อมูลจำนวนมหาศาล องค์กรขนาดใหญ่และทันสมัยหลายแห่งพยายามตรวจสอบข้อมูลโดยใช้แอปพลิเคชันและเครื่องมือที่หลากหลาย น่าเสียดายที่มีธุรกิจไม่กี่แห่งที่พัฒนาการมองเห็นที่จำเป็นสำหรับภาพรวมที่เหมือนจริง 

ความสามารถในการสังเกตข้อมูลให้ภาพรวมนั้น เพื่อขจัดปัญหาการไหลของข้อมูลโดยเร็วที่สุด

กระบวนการสังเกตได้ประกอบด้วยวิธีการและเทคโนโลยีที่หลากหลายซึ่งช่วยระบุและแก้ไขปัญหาข้อมูลแบบเรียลไทม์ กระบวนการนี้สร้างแผนที่หลายมิติของโฟลว์ข้อมูลทั้งหมดของธุรกิจ ซึ่งนำเสนอข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับประสิทธิภาพและคุณภาพของข้อมูลของระบบ 

เมื่อถูกถามเกี่ยวกับความสามารถในการสังเกตข้อมูล Ryan Yackel, CMO ของ Databand บริษัท IBM ให้ความเห็นว่า

“ในขณะที่ปริมาณ ความเร็ว และความซับซ้อนของท่อบิ๊กดาต้าเติบโตอย่างต่อเนื่อง บริษัทต่างๆ ต่างพึ่งพาทีมวิศวกรรมข้อมูลและแพลตฟอร์มเป็นแกนหลักของธุรกิจที่ขับเคลื่อนด้วยข้อมูล ปัญหาคือทีมเหล่านี้ส่วนใหญ่มีการตัดงานสำหรับพวกเขา พวกเขากำลังต่อสู้กับข้อมูลด้วยความน่าเชื่อถือและเหตุการณ์ด้านคุณภาพ ทำให้ยากต่อการมุ่งเน้นไปที่ความคิดริเริ่มเชิงกลยุทธ์ที่เกี่ยวข้องกับ AL/ML การวิเคราะห์ และผลิตภัณฑ์ข้อมูล ความสามารถในการสังเกตข้อมูลช่วยแก้ปัญหาได้”

ในขั้นต้น ความสามารถในการสังเกตข้อมูลอาจดูเหมือนเป็นรูปแบบของ สายข้อมูลแต่ทั้งสองกระบวนการมีจุดประสงค์ที่แตกต่างกัน 

ความสามารถในการสังเกตข้อมูลมุ่งเน้นไปที่การแก้ปัญหาเกี่ยวกับข้อมูลอย่างรวดเร็วและมีประสิทธิภาพโดยใช้ระบบการวัด อย่างไรก็ตาม สายเลือดของข้อมูลจะใช้เป็นหลักในการรวบรวมและจัดเก็บข้อมูลคุณภาพสูง ซึ่งเป็นข้อมูลที่สามารถเชื่อถือได้

นอกจากนี้ สายเลือดสามารถใช้เป็นส่วนประกอบเพื่อสนับสนุนโปรแกรมการสังเกตได้ (บางบทความส่งเสริมความสามารถในการสังเกตของข้อมูลโดยมีวัตถุประสงค์เดียวกันกับสายเลือดของข้อมูล และข้อเรียกร้องก็มีความจริงบางประการ สายเลือดของข้อมูลเป็นส่วนประกอบของความสามารถในการสังเกตข้อมูล) 

คำว่า "การสังเกตได้" เดิมเป็นแนวคิดทางปรัชญาที่พัฒนาโดย Heraclitus ประมาณ 510 ปีก่อนคริสตศักราช เขาพิจารณาว่าความสามารถในการสังเกตนั้นต้องการความแตกต่างเชิงเปรียบเทียบ - สามารถสังเกตความเย็นได้เมื่อเปรียบเทียบกับความอบอุ่น ในปี พ.ศ. 1871 เจมส์ ซี. แมกซ์เวลล์ นักฟิสิกส์ ได้พัฒนาแนวคิดที่ว่าเป็นไปไม่ได้ที่จะทราบตำแหน่งของอนุภาคทั้งหมดภายในการทดลองทางอุณหพลศาสตร์ แต่ด้วยการสังเกต "ผลลัพธ์ที่สำคัญบางอย่าง" สำหรับการเปลี่ยนแปลงเชิงเปรียบเทียบ ทำให้สามารถคาดการณ์ได้อย่างแม่นยำ 

คำอธิบายของ Maxwell เกี่ยวกับความสามารถในการสังเกตโดยใช้เอาต์พุตหลักได้รับการปรับและนำไปใช้กับแอปพลิเคชันอัตโนมัติที่หลากหลาย ตั้งแต่อุปกรณ์ในโรงงานไปจนถึงเซ็นเซอร์บนเครื่องบิน จากนั้น DevOps ได้นำแนวคิดนี้มาใช้สำหรับการดีบักและจัดการกับ "เหตุการณ์การผลิต" ในช่วงประมาณปี 2016 ในปี 2019 Barr Moses ซึ่งเป็น CEO และผู้ร่วมก่อตั้งของ Monte Carlo ได้พัฒนากระบวนการสังเกตการณ์ซึ่งออกแบบมาเพื่อให้ภาพรวมของการไหลของข้อมูลขององค์กร . 

โมเสสเขียน

“ความสามารถในการสังเกตข้อมูลคือความสามารถขององค์กรในการทำความเข้าใจความสมบูรณ์ของข้อมูลในระบบของตน ความสามารถในการสังเกตข้อมูลช่วยลดเวลาหยุดทำงานของข้อมูลโดยใช้แนวทางปฏิบัติที่ดีที่สุดที่ได้เรียนรู้มา DevOps ไปยัง ความสามารถในการสังเกตไปป์ไลน์ข้อมูล".

ห้าเสาหลักของความสามารถในการสังเกตข้อมูล

ความสามารถในการสังเกตข้อมูลทำงานเพื่อแก้ไขปัญหาข้อมูลและสารสนเทศโดยการจัดเตรียมแผนที่ข้อมูลอย่างละเอียดแบบเรียลไทม์ ให้การมองเห็นสำหรับกิจกรรมข้อมูลขององค์กร ธุรกิจจำนวนมากมีข้อมูลที่ถูกแยกออกจากกัน ทำให้ไม่สามารถสังเกตได้ ต้องกำจัดไซโลข้อมูลเพื่อรองรับโปรแกรมการสังเกตข้อมูล 

เมื่อกิจกรรมต่างๆ เช่น การติดตาม การมอนิเตอร์ การแจ้งเตือน การวิเคราะห์ การบันทึก และ "การเปรียบเทียบ" ถูกดำเนินการโดยไม่มีแดชบอร์ดที่สังเกตได้ รูปแบบของการแบ่งพาร์ติชันขององค์กรอาจเกิดขึ้นได้ คนในแผนกหนึ่งไม่ตระหนักว่าความพยายามของพวกเขามีผลลัพธ์ที่ไม่ได้ตั้งใจในอีกแผนกหนึ่ง เช่น ข้อมูลขาดหายไป/ขาดหายไปซึ่งส่งเสริมการตัดสินใจที่ไม่ดี หรือส่วนหนึ่งของระบบหยุดทำงานและไม่มีใครรับรู้ 

โปรดจำไว้ว่าความสามารถในการสังเกตนั้นเกี่ยวกับการวัดเอาต์พุตหลักบางอย่าง เสาหลักทั้งห้า (หรือเอาต์พุตหลัก) Barr Moses ที่พัฒนาขึ้นเพื่อวัตถุประสงค์ในการวัดคือ: 

  • ที่มีคุณภาพ: ข้อมูลคุณภาพสูงถือว่าถูกต้อง ส่วนข้อมูลคุณภาพต่ำถือว่าไม่ถูกต้อง การวัดคุณภาพของข้อมูลให้ข้อมูลเชิงลึกว่าข้อมูลของคุณสามารถเชื่อถือได้หรือไม่ มีหลากหลายวิธี ในการวัด คุณภาพของข้อมูล
  • สคีมา: ซึ่งเกี่ยวข้องกับการเปลี่ยนแปลงวิธีการจัดระเบียบข้อมูล และการวัดสคีมาสามารถแสดงการหยุดพักในการไหลของข้อมูล การระบุว่าเมื่อใด อย่างไร และใครเป็นผู้ทำการเปลี่ยนแปลงจะมีประโยชน์ในแง่ของการบำรุงรักษาเชิงป้องกัน 
  • ปริมาตร: ข้อมูลจำนวนมากมีประโยชน์สำหรับการวิจัยและการตลาด สิ่งนี้สามารถให้องค์กรมีมุมมองแบบบูรณาการของลูกค้าและตลาดของพวกเขา ยิ่งใช้ข้อมูลปัจจุบันและประวัติระหว่างการวิจัยมากเท่าใด ข้อมูลเชิงลึกก็ยิ่งมากขึ้นเท่านั้น
  • เชื้อสายข้อมูล: โปรแกรมสายเลือดที่ดีจะบันทึกการเปลี่ยนแปลงข้อมูลและตำแหน่งของข้อมูล และโดยปกติจะใช้เพื่อปรับปรุงคุณภาพข้อมูล อย่างไรก็ตาม ยังสามารถใช้เป็นส่วนหนึ่งของโปรแกรมสังเกตการณ์ข้อมูลได้อีกด้วย ในความสามารถนี้ ใช้เพื่อแก้ไขปัญหาการหยุดทำงานที่อาจเกิดขึ้น และแสดงรายการสิ่งที่ได้ทำไปแล้วก่อนที่จะเกิดความเสียหาย 
  • ความสดใหม่: นี่คือหลักเกี่ยวกับการไม่ใช้ข้อมูลเก่า หรือตามที่ Barr Moses อ้างถึงคือข้อมูลเก่า ความสด เน้นข้อมูลที่เป็นปัจจุบันซึ่งเป็นสิ่งสำคัญในการตัดสินใจที่ขับเคลื่อนด้วยข้อมูล การประทับเวลามักใช้เพื่อระบุว่าข้อมูลเก่าหรือไม่ 

เมื่อรวมกันแล้ว การวัดส่วนประกอบหรือเสาเหล่านี้สามารถให้ข้อมูลเชิงลึกอันมีค่าเกี่ยวกับปัญหาที่พัฒนาขึ้นหรือเพิ่งปรากฏขึ้น และส่งเสริมความสามารถในการซ่อมแซมโดยเร็วที่สุด

ความท้าทายในการสังเกตข้อมูล

แพลตฟอร์มการสังเกตข้อมูลที่เหมาะสมสามารถเปลี่ยนวิธีที่ธุรกิจดูแลรักษาและจัดการข้อมูลของตนได้ น่าเสียดายที่การนำแพลตฟอร์มไปใช้อาจก่อให้เกิดความท้าทายบางประการ ปัญหาความเข้ากันได้จะปรากฏขึ้นเมื่อแพลตฟอร์มไม่เหมาะสม 

แพลตฟอร์มและเครื่องมือความสามารถในการสังเกตสามารถถูกจำกัดได้หากไปป์ไลน์ข้อมูล ซอฟต์แวร์ เซิร์ฟเวอร์ และฐานข้อมูลเข้ากันไม่ได้อย่างสมบูรณ์ แพลตฟอร์มเหล่านี้ไม่ทำงานในสุญญากาศ สิ่งสำคัญคือต้องกำจัดสิ่งใดๆ ข้อมูลไซโล จากระบบและมั่นใจว่าระบบข้อมูลทั้งหมดภายในองค์กรถูกรวมเข้าด้วยกัน 

สิ่งสำคัญคือต้องทดสอบแพลตฟอร์มการสังเกตข้อมูลก่อนเซ็นสัญญา

น่าเศร้าที่แม้ว่าแหล่งข้อมูลภายในและภายนอกทั้งหมดของธุรกิจจะถูกรวมเข้ากับแพลตฟอร์มอย่างถูกต้อง แต่ก็แตกต่างกัน แบบจำลองข้อมูล อาจทำให้เกิดปัญหา ธุรกิจจำนวนมากรองรับแหล่งข้อมูล 400 แหล่งขึ้นไป และแหล่งข้อมูลภายนอกแต่ละแหล่งอาจมีปัญหาหากไม่ได้ใช้มาตรฐานและรูปแบบเดียวกัน

ยกเว้นเครื่องมือโอเพ่นซอร์ส แพลตฟอร์มการสังเกตการณ์เป็นแบบคลาวด์และอาจให้ความยืดหยุ่นที่สนับสนุนการปรับแต่งอย่างละเอียด 

แพลตฟอร์มการสังเกตที่ดีที่สุดนั้นมุ่งเน้นไปที่กระบวนการวัดที่เป็นมาตรฐานและแนวทางการบันทึก สิ่งนี้ส่งเสริมความสัมพันธ์ที่มีประสิทธิภาพของข้อมูล แต่แหล่งข้อมูลภายนอกและไปป์ไลน์ข้อมูลที่กำหนดเองอาจทำให้เกิดปัญหาและต้องใช้ความพยายามด้วยตนเองเพิ่มเติมเพื่อบรรลุงานที่ควรจะเป็นแบบอัตโนมัติ

นอกจากนี้ เครื่องมือบางอย่างอาจมีค่าใช้จ่ายในการจัดเก็บที่ผิดปกติซึ่งจำกัดความสามารถในการปรับขนาด

แพลตฟอร์มการสังเกตข้อมูล

แพลตฟอร์มการสังเกตข้อมูลโดยทั่วไปมีเครื่องมือที่มีประโยชน์มากมาย ซึ่งมักจะรวมถึงการสนับสนุนอัตโนมัติสำหรับสายข้อมูลอัตโนมัติ การวิเคราะห์สาเหตุ คุณภาพของข้อมูล และการตรวจสอบเพื่อระบุ แก้ไข และป้องกันความผิดปกติภายในโฟลว์ข้อมูล 

แพลตฟอร์มดังกล่าวส่งเสริมการผลิตที่เพิ่มขึ้น ท่อส่งที่ดียิ่งขึ้น และลูกค้าที่มีความสุขมากขึ้น แพลตฟอร์มการสังเกตการณ์ข้อมูลที่ได้รับความนิยม ได้แก่:

  • ดาต้าแบนด์ มอบแพลตฟอร์มความสามารถในการสังเกตที่ใช้งานได้สูงซึ่งสามารถตรวจจับและแก้ไขปัญหาข้อมูลได้อย่างรวดเร็ว โดยใช้กระบวนการสังเกตการณ์ที่ต่อเนื่องซึ่งระบุปัญหาข้อมูลก่อนที่จะส่งผลกระทบต่อธุรกิจของคุณ 
  • Monte Carlo เสนอแพลตฟอร์มการสังเกตที่สามารถอธิบายได้ว่าให้ความสามารถในการสังเกต "จากไปป์ไลน์ถึง ระบบธุรกิจอัจฉริยะ” นำความน่าเชื่อถือของข้อมูลมาสู่การจัดการบริการข้อมูลและเครื่องมือต่างๆ 
  • เมตาเพลน มีความสามารถในการสังเกตตั้งแต่ต้นจนจบ
  • มีความหลากหลายของที่มี โอเพนซอร์ส มีเครื่องมือการสังเกตซึ่งควรค่าแก่การตรวจสอบ

ความสำคัญของความสามารถในการสังเกตข้อมูล

สำหรับองค์กรที่ต้องจัดการกับการไหลของข้อมูลขนาดใหญ่ สามารถใช้ความสามารถในการสังเกตเพื่อตรวจสอบระบบข้อมูลโดยรวม และส่งสัญญาณเตือนเมื่อเกิดปัญหาขึ้น 

เมื่อธุรกิจรวบรวมข้อมูลจำนวนมหาศาลจากแหล่งต่างๆ พวกเขาพัฒนาระบบเพื่อจัดการกับมัน ทีละชั้น ระบบเหล่านี้ประกอบด้วยการจัดเก็บข้อมูล ไปป์ไลน์ข้อมูล และเครื่องมือจำนวนหนึ่ง ความซับซ้อนที่เพิ่มขึ้นแต่ละชั้นจะเพิ่มโอกาสที่ข้อมูลจะหยุดทำงานจากปัญหาต่างๆ เช่น ความเข้ากันไม่ได้ หรือข้อมูลเก่าและขาดหายไป

Yackel กล่าวว่า “การใช้ความสามารถในการสังเกตข้อมูลอย่างต่อเนื่องเพื่อตรวจสอบไปป์ไลน์ข้อมูล ชุดข้อมูล และตารางข้อมูล จะแจ้งเตือนทีมข้อมูลเมื่อมีเหตุการณ์ข้อมูลเกิดขึ้น และแสดงวิธีแก้ไขต้นเหตุก่อนที่จะส่งผลกระทบต่อธุรกิจของตน ด้วยความสามารถในการสังเกตข้อมูล วิศวกรรมสามารถมุ่งเน้นไปที่การสร้างผลิตภัณฑ์ข้อมูลที่ยอดเยี่ยมมากกว่าการรักษากระบวนการที่เสียหาย” 

ความสามารถในการสังเกตข้อมูลจะช่วยให้ธุรกิจสามารถระบุแหล่งที่มาของปัญหาไปป์ไลน์ ข้อผิดพลาดของข้อมูล และความไม่สอดคล้องกันของการไหลของข้อมูลในเชิงรุก เพื่อเสริมสร้างความสัมพันธ์กับลูกค้าและปรับปรุงคุณภาพของข้อมูล

รูปภาพที่ใช้ภายใต้ลิขสิทธิ์จาก Shutterstock.com

ประทับเวลา:

เพิ่มเติมจาก ข้อมูล