5 เคล็ดลับในการจัดการข้อมูลที่ไม่เป็นระเบียบ (Messy Data) ใน Minitab

คุณเคยพบว่า “ตัวเองกำลังพยายามอย่างมากที่จะทำความสะอาดและจัดการข้อมูลสำหรับการวิเคราะห์ข้อมูล และบางครั้งก็ใช้ระยะเวลานาน ก่อนที่จะนำข้อมูลเข้าสู่โปรแกรม Minitabหรือไม่?”  แน่นอนว่าโปรแกรม Minitab มีทุกสิ่งที่คุณต้องการในการจัดระเบียบข้อมูล การทำความสะอาดข้อมูลและการจัดการข้อมูล เพียงแต่คุณต้องทราบก่อนว่ามีเครื่องมือใดบ้างที่เหมาะสม ในบทความนี้ ฉันจะให้คำแนะนำสั้นๆ สำหรับ 5 เคล็ดลับในการทำความสะอาดข้อมูลของคุณในโปรแกรม Minitab


1. แสดงค่าของข้อมูลที่ไม่เหมือนกันในคอลัมน์ และทำการนับจำนวนค่าของข้อมูลเหล่านี้

ไปที่เมนู Stat > Tables > Tally Individual Variables เพื่อดูรายการของค่าของข้อมูลที่ไม่เหมือนกันและนับจำนวนค่าของข้อมูลที่เหมือนกัน โดยผลลัพธ์จะปรากฏที่ output pane บนโปรแกรม Minitab ในขณะเดียวกันคุณสามารถเลือกที่จะเก็บผลลัพธ์ไว้ใน Worksheet ซึ่งมีประโยชน์อย่างยิ่ง หากคุณวางแผนที่จะแปลงค่าของข้อมูลที่ไม่เหมือนกันมากกว่า 100 รายการ ด้วยการใช้คำสั่ง Conversion Table

5 Tips Messy Data 1 Tally

2. แปลงค่าของข้อมูลให้สอดคล้องกัน ด้วยคำสั่ง Conversion Table

เมนู Data > Recode ของโปรแกรม Minitab จะมีประโยชน์ในการแปลงค่าของข้อมูล เพื่อแก้ไขการพิมพ์ผิดให้ถูกต้องหรือการแปลงค่าของข้อมูลที่เป็นตัวเลขเป็นข้อความหรือแปลงค่าของข้อมูลที่เป็นจากข้อความเป็นตัวเลขและถ้าหากต้องการแปลงค่าของข้อมูลที่ไม่เหมือนกันที่มีจำนวนมากกว่า 100 รายการ การใช้คำสั่ง conversion table สามารถช่วยแปลงข้อมูลเหล่านี้ได้

5 Tips Messy Data 2 Recode
เคล็ดลับสำหรับมืออาชีพ:
หากต้องการแปลงค่าของข้อมูลเพียงไม่กี่ค่า ให้คลิกขวาที่คอลัมน์ของข้อมูลใน worksheet จากนั้นเลือก Find and Replace แทน

3. การใช้คำสั่ง Stack Columns หรือ Unstack Columns ของข้อมูล

ไปที่เมนู Data > Stack > Columns เพื่อสร้างคอลัมน์ใหม่ โดยนำคอลัมน์หลาย ๆ คอลัมน์มาซ้อนกันเป็นคอลัมน์เดียว

5 Tips Messy Data 3 Stack

ในกรณีนี้ หากคุณต้องการสร้างคอลัมน์ใหม่ โดยแยกค่าของข้อมูลที่ไม่เหมือนกันตามคอลัมน์ที่ใช้จำแนกแบ่งกลุ่ม (Categorical column) ให้ไปที่เมนู Data > Unstack Columns

5 Tips Messy Data 3 Unstack

4. เปลี่ยนลำดับของข้อมูลที่มีค่าเป็นข้อความ ในผลลัพธ์ที่เป็นตารางหรือกราฟ

คลิกขวาบนคอลัมน์ที่มีค่าของข้อมูลเป็นประเภทข้อความ (text data) จากนั้นเลือก Column Properties > Value Order เพื่อเลือกลำดับในการเรียงลำดับของคอลัมน์ที่ค่าของข้อมูลเป็นประเภทข้อความ โดยโปรแกรม Minitab ใช้การเรียงลำดับตามตัวอักษรภาษาอังกฤษเป็นค่าเริ่มต้น อย่างไรก็ตาม คุณสามารถเปลี่ยนการเรียงลำดับของข้อมูลได้ด้วยวิธีที่เหมาะสมสำหรับการวิเคราะห์ของคุณ

5 Tips Messy Data 4 Value Order

5. สร้างคอลัมน์วันในแต่ละสัปดาห์จากคอลัมน์วันที่ และ/หรือ เวลา

ไปที่เมนู Data > Date/Time > Extract to Text เพื่อสร้างคอลัมน์ใหม่ที่แสดงค่าของข้อมูลที่เป็นวันในแต่ละสัปดาห์ ซึ่งเป็นวิธีที่สะดวกในการสร้างคอลัมน์ที่ใช้จำแนกแบ่งกลุ่ม เพื่อใช้สำหรับในการวิเคราะห์เพิ่มเติม ตัวอย่างเช่น การสร้างกราฟเพื่ออธิบายความแตกต่างโดยแยกตามวันในแต่ละสัปดาห์

5 Tips Messy Data 5 Extract Date Time

กำลังมองหาอะไรเพิ่มเติมอยู่หรือเปล่า?

ฉันขอนำเสนอเคล็ดลับเหล่านี้และอื่นๆ อีกมากมายในการสัมมนาผ่านเว็บล่าสุด ลองดูด้านล่าง!

3a04cd7f 584b 4f0e 80da C65a29b46e61

บทความต้นฉบับ : 5 Tips for Handling Messy Data in Minitab

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยรัฐพงษ์ ยอดสีมา

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ