ขอแนะนำแนวคิด Data Analytics Fabric - DATAVERSITY

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

องค์กรต่างๆ ทั่วโลก ทั้งที่เป็นผลกำไรและไม่แสวงหากำไร กำลังมองหาการใช้ประโยชน์จากการวิเคราะห์ข้อมูลเพื่อปรับปรุงประสิทธิภาพทางธุรกิจ ข้อค้นพบจากก แบบสำรวจของ McKinsey ระบุว่าองค์กรที่ขับเคลื่อนด้วยข้อมูลมีแนวโน้มที่จะได้ลูกค้ามากกว่า 23 เท่า มีแนวโน้มที่จะรักษาลูกค้าไว้ได้ 19 เท่า และทำกำไรได้มากกว่า 1 เท่า [XNUMX] การวิจัยโดยเอ็มไอที พบว่าบริษัทที่เติบโตทางดิจิทัลนั้นทำกำไรได้มากกว่าบริษัทอื่นๆ ถึง 26% [2] แต่บริษัทหลายแห่ง แม้จะอุดมไปด้วยข้อมูล แต่ก็ยังประสบปัญหาในการใช้การวิเคราะห์ข้อมูล เนื่องจากลำดับความสำคัญที่ขัดแย้งกันระหว่างความต้องการทางธุรกิจ ความสามารถที่มีอยู่ และทรัพยากร วิจัยโดย Gartner พบว่ามากกว่า 85% ของโครงการข้อมูลและการวิเคราะห์ล้มเหลว [3] และ a รายงานร่วม จาก IBM และ Carnegie Melon แสดงให้เห็นว่า 90% ของข้อมูลในองค์กรไม่เคยถูกนำไปใช้เพื่อวัตถุประสงค์เชิงกลยุทธ์ใดๆ เลย [4]

ด้วยฉากหลังนี้ เราขอแนะนำแนวคิด “data analytics fabric (DAF)” ในฐานะระบบนิเวศหรือโครงสร้างที่ช่วยให้การวิเคราะห์ข้อมูลทำงานได้อย่างมีประสิทธิภาพโดยยึดตาม (a) ความต้องการหรือวัตถุประสงค์ทางธุรกิจ (b) ความสามารถที่มีอยู่ เช่น ผู้คน/ทักษะ กระบวนการ วัฒนธรรม เทคโนโลยี ข้อมูลเชิงลึก ความสามารถในการตัดสินใจ และอื่นๆ และ (ค) ทรัพยากร (เช่น องค์ประกอบที่ธุรกิจจำเป็นต้องมีในการดำเนินธุรกิจ)

เป้าหมายหลักของเราในการแนะนำโครงสร้างการวิเคราะห์ข้อมูลคือการตอบคำถามพื้นฐานนี้: “สิ่งที่จำเป็นในการสร้างระบบที่เปิดใช้งานการตัดสินใจได้อย่างมีประสิทธิภาพจาก ข้อมูลวิทยาศาสตร์ อัลกอริธึมในการวัดและปรับปรุงประสิทธิภาพทางธุรกิจ?” โครงสร้างการวิเคราะห์ข้อมูลและลักษณะสำคัญห้าประการจะแสดงและอภิปรายไว้ด้านล่าง

1. เน้นการวัดผล

หัวใจหลักคือการวิเคราะห์เป็นเรื่องเกี่ยวกับการใช้ข้อมูลเพื่อให้ได้มาซึ่งข้อมูลเชิงลึกในการวัดและปรับปรุงประสิทธิภาพทางธุรกิจ [5] การวิเคราะห์มีสามประเภทหลักเพื่อวัดและปรับปรุงประสิทธิภาพทางธุรกิจ:

การวิเคราะห์เชิงพรรณนา ถามคำถาม “เกิดอะไรขึ้น?” การวิเคราะห์เชิงพรรณนาใช้ในการวิเคราะห์ข้อมูลในอดีตเพื่อระบุรูปแบบ แนวโน้ม และความสัมพันธ์โดยใช้เทคนิคการวิเคราะห์ข้อมูลเชิงสำรวจ การเชื่อมโยง และเชิงอนุมาน เทคนิคการวิเคราะห์ข้อมูลเชิงสำรวจ วิเคราะห์และสรุปชุดข้อมูล การวิเคราะห์เชิงพรรณนาเชิงเชื่อมโยงอธิบายความสัมพันธ์ระหว่างตัวแปร การวิเคราะห์ข้อมูลเชิงพรรณนาเชิงอนุมานใช้เพื่ออนุมานหรือสรุปแนวโน้มเกี่ยวกับประชากรจำนวนมากขึ้นโดยอิงตามชุดข้อมูลตัวอย่าง
การวิเคราะห์เชิงทำนาย มองตอบคำถาม “จะเกิดอะไรขึ้น” โดยพื้นฐานแล้ว การวิเคราะห์เชิงคาดการณ์คือกระบวนการใช้ข้อมูลเพื่อคาดการณ์แนวโน้มและเหตุการณ์ในอนาคต การวิเคราะห์เชิงคาดการณ์สามารถทำได้ด้วยตนเอง (หรือที่รู้จักกันทั่วไปในชื่อการวิเคราะห์เชิงคาดการณ์ที่ขับเคลื่อนโดยนักวิเคราะห์) หรือใช้ก็ได้ อัลกอริทึมการเรียนรู้ของเครื่อง (หรือเรียกอีกอย่างว่าการวิเคราะห์เชิงคาดการณ์ที่ขับเคลื่อนด้วยข้อมูล) ไม่ว่าจะด้วยวิธีใด ข้อมูลในอดีตจะถูกนำมาใช้เพื่อคาดการณ์ในอนาคต
การวิเคราะห์เชิงกำหนด ช่วยตอบคำถามว่า “เราจะทำให้มันเกิดขึ้นได้อย่างไร” โดยพื้นฐานแล้ว การวิเคราะห์เชิงกำหนดจะแนะนำแนวทางปฏิบัติที่ดีที่สุดสำหรับการก้าวไปข้างหน้าโดยใช้เทคนิคการปรับให้เหมาะสมและการจำลอง โดยทั่วไปแล้ว การวิเคราะห์เชิงคาดการณ์และการวิเคราะห์เชิงกำหนดจะทำงานร่วมกัน เนื่องจากการวิเคราะห์เชิงคาดการณ์ช่วยค้นหาผลลัพธ์ที่เป็นไปได้ ในขณะที่การวิเคราะห์เชิงกำหนดจะพิจารณาผลลัพธ์เหล่านั้นและค้นหาตัวเลือกเพิ่มเติม

2. เน้นตัวแปร

นอกจากนี้ยังสามารถวิเคราะห์ข้อมูลตามจำนวนตัวแปรที่มีอยู่ ทั้งนี้ ขึ้นอยู่กับจำนวนตัวแปร เทคนิคการวิเคราะห์ข้อมูลอาจเป็นแบบตัวแปรเดียว ตัวแปรคู่ หรือหลายตัวแปรก็ได้

การวิเคราะห์ตัวแปรเดียว: การวิเคราะห์ตัวแปรเดียวเกี่ยวข้องกับการวิเคราะห์รูปแบบที่มีอยู่ในตัวแปรตัวเดียวโดยใช้การวัดศูนย์กลาง (ค่าเฉลี่ย ค่ามัธยฐาน โหมด และอื่นๆ) และการแปรผัน (ค่าเบี่ยงเบนมาตรฐาน ข้อผิดพลาดมาตรฐาน ความแปรปรวน และอื่นๆ)
การวิเคราะห์สองตัวแปร: มีตัวแปรสองตัวที่การวิเคราะห์เกี่ยวข้องกับสาเหตุและความสัมพันธ์ระหว่างตัวแปรทั้งสอง ตัวแปรทั้งสองนี้อาจขึ้นอยู่กับหรือเป็นอิสระจากกัน เทคนิคความสัมพันธ์เป็นเทคนิคการวิเคราะห์ไบวาเรียตที่ใช้มากที่สุด
การวิเคราะห์หลายตัวแปร: เทคนิคนี้ใช้สำหรับการวิเคราะห์ตัวแปรมากกว่าสองตัว ในการตั้งค่าหลายตัวแปร โดยทั่วไปเราจะดำเนินการในเวทีการวิเคราะห์เชิงคาดการณ์และอัลกอริทึมการเรียนรู้ของเครื่อง (ML) ที่รู้จักกันดีส่วนใหญ่ เช่น การถดถอยเชิงเส้น การถดถอยโลจิสติก ต้นไม้การถดถอย เครื่องเวกเตอร์ที่รองรับ และเครือข่ายประสาทเทียม โดยทั่วไปจะนำไปใช้กับหลายตัวแปร การตั้งค่า

3. มุ่งเน้นการกำกับดูแล

โครงสร้างการวิเคราะห์ข้อมูลประเภทที่สามเกี่ยวข้องกับการฝึกอบรมข้อมูลอินพุตหรือข้อมูลตัวแปรอิสระที่ได้รับการติดป้ายกำกับสำหรับเอาต์พุตเฉพาะ (เช่น ตัวแปรตาม) โดยพื้นฐานแล้ว ตัวแปรอิสระคือตัวแปรที่ผู้ทดลองควบคุม ตัวแปรตามคือตัวแปรที่เปลี่ยนแปลงตามตัวแปรอิสระ DAF ที่เน้นการควบคุมดูแลอาจเป็นหนึ่งในสองประเภท

สาเหตุ: ข้อมูลที่มีป้ายกำกับ ไม่ว่าจะสร้างขึ้นโดยอัตโนมัติหรือด้วยตนเอง เป็นสิ่งจำเป็นสำหรับการเรียนรู้แบบมีผู้สอน ข้อมูลที่ติดป้ายกำกับช่วยให้สามารถกำหนดตัวแปรตามได้อย่างชัดเจน จากนั้นจึงเป็นเรื่องของอัลกอริธึมการวิเคราะห์เชิงคาดการณ์เพื่อสร้างเครื่องมือ AI/ML ที่จะสร้างความสัมพันธ์ระหว่างป้ายกำกับ (ตัวแปรตาม) และชุดของตัวแปรอิสระ ความจริงที่ว่าเรามีการแบ่งเขตที่ชัดเจนระหว่างแนวคิดของตัวแปรตามและชุดของตัวแปรอิสระ เราอนุญาตให้ตัวเองแนะนำคำว่า "สาเหตุ" เพื่ออธิบายความสัมพันธ์ได้ดีที่สุด
การไม่ก่อเหตุ: เมื่อเราระบุว่า "มุ่งเน้นการกำกับดูแล" เป็นมิติของเรา เรายังหมายถึง "ขาดการกำกับดูแล" และนั่นนำแบบจำลองที่ไม่เป็นสาเหตุมาสู่การอภิปราย โมเดลที่ไม่เป็นสาเหตุสมควรได้รับการกล่าวถึงเนื่องจากไม่ต้องการข้อมูลที่ติดป้ายกำกับ เทคนิคพื้นฐานที่นี่คือการจัดกลุ่ม และวิธีที่ได้รับความนิยมมากที่สุดคือ k-Means และการจัดกลุ่มแบบลำดับชั้น

4. เน้นประเภทข้อมูล

มิติหรือการแสดงให้เห็นของแฟบริคการวิเคราะห์ข้อมูลนี้มุ่งเน้นไปที่ตัวแปรข้อมูลสามประเภทที่แตกต่างกันที่เกี่ยวข้องกับทั้งตัวแปรอิสระและตัวแปรตามที่ใช้ในเทคนิคการวิเคราะห์ข้อมูลเพื่อรับข้อมูลเชิงลึก

ข้อมูลที่กำหนด ใช้สำหรับการติดป้ายกำกับหรือจัดหมวดหมู่ข้อมูล มันไม่เกี่ยวข้องกับค่าตัวเลข ดังนั้นจึงไม่สามารถคำนวณทางสถิติกับข้อมูลที่ระบุได้ ตัวอย่างของข้อมูลที่ระบุ ได้แก่ เพศ รายละเอียดสินค้า ที่อยู่ลูกค้า และอื่นๆ
ข้อมูลลำดับหรืออันดับ คือลำดับของค่าต่างๆ แต่ความแตกต่างระหว่างแต่ละค่านั้นไม่เป็นที่ทราบแน่ชัด ตัวอย่างทั่วไปในที่นี้คือการจัดอันดับบริษัทตามมูลค่าหลักทรัพย์ตามราคาตลาด เงื่อนไขการชำระเงินของผู้ขาย คะแนนความพึงพอใจของลูกค้า ลำดับความสำคัญในการจัดส่ง และอื่นๆ
ข้อมูลตัวเลข ไม่ต้องมีการแนะนำและเป็นค่าตัวเลข ตัวแปรเหล่านี้เป็นประเภทข้อมูลพื้นฐานที่สุดที่สามารถใช้เพื่อจำลองอัลกอริทึมทุกประเภท

5. เน้นผลลัพธ์

โครงสร้างการวิเคราะห์ข้อมูลประเภทนี้จะพิจารณาถึงวิธีที่มูลค่าทางธุรกิจสามารถส่งมอบได้จากข้อมูลเชิงลึกที่ได้รับจากการวิเคราะห์ มีสองวิธีที่มูลค่าทางธุรกิจสามารถขับเคลื่อนได้ด้วยการวิเคราะห์ และผ่านทางผลิตภัณฑ์หรือโครงการ แม้ว่าผลิตภัณฑ์อาจจำเป็นต้องจัดการกับการขยายสาขาเพิ่มเติมเกี่ยวกับประสบการณ์ผู้ใช้และวิศวกรรมซอฟต์แวร์ แต่แบบฝึกหัดการสร้างแบบจำลองที่ทำเพื่อให้ได้แบบจำลองจะคล้ายกันทั้งในโปรเจ็กต์และผลิตภัณฑ์

A ผลิตภัณฑ์วิเคราะห์ข้อมูล เป็นสินทรัพย์ข้อมูลที่สามารถนำกลับมาใช้ใหม่ได้เพื่อตอบสนองความต้องการระยะยาวของธุรกิจ โดยรวบรวมข้อมูลจากแหล่งข้อมูลที่เกี่ยวข้อง รับประกันคุณภาพของข้อมูล ประมวลผล และทำให้ทุกคนที่ต้องการเข้าถึงได้ โดยทั่วไปผลิตภัณฑ์ได้รับการออกแบบสำหรับบุคคลและมีขั้นตอนวงจรชีวิตหลายขั้นตอนหรือการวนซ้ำเพื่อให้ทราบถึงมูลค่าของผลิตภัณฑ์
A โครงการวิเคราะห์ข้อมูล ได้รับการออกแบบมาเพื่อตอบสนองความต้องการทางธุรกิจเฉพาะหรือเฉพาะตัว และมีฐานผู้ใช้หรือวัตถุประสงค์ที่กำหนดไว้หรือแคบลง โดยพื้นฐานแล้ว โครงการคือความพยายามชั่วคราวที่มีจุดมุ่งหมายเพื่อส่งมอบโซลูชันตามขอบเขตที่กำหนด ภายในงบประมาณและตรงเวลา

เศรษฐกิจโลกจะเปลี่ยนแปลงไปอย่างมากในอีกไม่กี่ปีข้างหน้า เนื่องจากองค์กรต่างๆ จะใช้ข้อมูลและการวิเคราะห์เพิ่มมากขึ้นเพื่อรับข้อมูลเชิงลึกและตัดสินใจเพื่อวัดผลและปรับปรุงประสิทธิภาพทางธุรกิจ McKinsey พบว่าบริษัทที่ขับเคลื่อนด้วยข้อมูลเชิงลึกรายงาน EBITDA (กำไรก่อนดอกเบี้ย ภาษี ค่าเสื่อมราคา และค่าตัดจำหน่าย) เพิ่มขึ้นถึง 25% [5] อย่างไรก็ตาม หลายองค์กรไม่ประสบความสำเร็จในการใช้ประโยชน์จากข้อมูลและการวิเคราะห์เพื่อปรับปรุงผลลัพธ์ทางธุรกิจ แต่ไม่มีวิธีหรือแนวทางมาตรฐานเดียวในการส่งมอบการวิเคราะห์ข้อมูล การใช้งานหรือการนำโซลูชันการวิเคราะห์ข้อมูลไปใช้จะขึ้นอยู่กับวัตถุประสงค์ทางธุรกิจ ความสามารถ และทรัพยากร DAF และลักษณะทั้งห้าประการที่กล่าวถึงในที่นี้สามารถทำให้การวิเคราะห์นำไปใช้งานได้อย่างมีประสิทธิภาพตามความต้องการทางธุรกิจ ความสามารถที่มีอยู่ และทรัพยากร

อ้างอิง