บทความจากลูกค้า : มันยากที่จะคาดการณ์โดยเฉพาะเกี่ยวกับอนาคต (แม้แต่ด้วย Machine Learning)

Bill Kahn ทำการสร้างโมเดลทางสถิติสำหรับกลุ่มธนาคารเพื่อผู้บริโภคของธนาคารแห่งอเมริกา ทีมของเขาสร้างหลายร้อยโมเดลโดยใช้เทคนิคของสถิติและ Machine Learning ที่หลากหลาย  โมเดลเหล่านี้ช่วยสร้างความมั่นใจในเสถียรภาพทางการเงินของบุคคล ผู้ประกอบการ และคณะบุคคลทั่วประเทศ ในช่วงไม่กี่ทศวรรษที่ผ่านมา Bill ได้นำเอาสถิติมาใช้กับกลุ่มบริษัทผู้ใช้บริการทางการเงินที่อยู่ในอันดับ Fortune 500 ,บริษัทให้คำปรึกษา และบริษัทผู้ผลิต เขาจบปริญญาตรีสาขาฟิสิกส์และปริญญาโทสาขาสถิติจากเบิร์กลีย์และปริญญาเอกสาขาสถิติจากมหาวิทยาลัยเยล

Minitab เชิญ Bill ให้ร่วมแบ่งปันประสบการณ์ของเขาเกี่ยวกับ Machine Learning (ML) ในหัวข้อ “พื้นฐานการปฎิบัติ” ในโลกธุรกิจ

ขั้นตอนวิธีของ Machine Learning (ML Algorithms)

หัวใจหลัก ขั้นตอนวิธีของ Machine Learning (ML Algorithm) ทั้งหมดจะมีสิ่งที่เหมือนกันคือสองส่วนของกระบวนการ ส่วนแรกลำดับของฟังก์ชั่นที่ซับซ้อนมากนั้นเหมาะสมกับบางส่วนของข้อมูล (เรียกว่า training data set) จากนั้นแต่ละโมเดลในลำดับจะถูกประเมินว่าประสิทธิภาพการทำงานของข้อมูลที่จัดขึ้นเพื่อทดสอบโมเดลนั้นดีเพียงใด (เรียกว่า holdout set) เลือกโมเดลที่ดีสุดจากชุดข้อมูลจัดขึ้น (holdout set) มีการเปลี่ยนแปลงมากมายในขั้นตอนเหล่านี้รวมถึง ลำดับการสำรวจ, พบโมเดลที่ดีสุดอย่างไร, โมเดลดีสุดให้คำจำกัดความว่าอย่างไร, และอะไรคือชุดข้อมูล(holdout set) ที่ถูกลือก และปรากฎว่า ด้วยข้อควรระวังเล็กน้อย, ลำดับธรรมดาๆนี้มักจะสร้างผลลัพธ์ที่ดีในการทำนาย

ข้อควรระวังสองข้อ

ข้อแรก, เราต้องใช้ฟังก์ชั่นการสูญเสีย(loss function) ที่เหมาะสมและประเมินโมเดล หากฟังก์ชั่นการสูญเสียไม่ได้ระบุอัลกอรึทึมของ Machine Learning อย่างถูกต้องทั้งหมดมันสามารถสร้างผลลัพธ์ที่ไร้สาระได้เช่นกัน – เช่นการจำแนกทุกคนในกลุ่มที่มีอิทธิพล เราจำเป็นต้องใช้ประสบการณ์ของเราเพื่อเลือกฟังก์ชั่นการสูญเสียที่เกี่ยวข้องกับธุรกิจ วิทยาศาสตร์หรือวิศวกรรม

ข้อสอง, เนื่องจากขั้นตอนวิธีทุกอันมีพารามิเตอร์หลายตัว (พารามิเตอร์ที่ไม่สามารถสร้างขึ้นได้บนพื้นฐานของแนวคิดล้วนๆ) เราต้องสำรวจช่วงกว้างที่เพียงพอสำหรับการใช้งานเพื่อให้แน่ใจว่าเราไม่ได้กำลังใข้ชุดค่าที่น่ากลัว ซึ่งจะนำไปสู่การคาดการณ์ที่แย่ไม่สามารถยอมรับได้

ทำนายอนาคต

อย่างไรก็ตามขณะที่วิธีการของ Machine Learning นั้นดีในการทำนายภายในตัวอย่าง แต่นั่นไม่ใช่สิ่งที่เราต้องการ เราต้องการการคาดการณ์ที่ดีใช้กับนอกกลุ่มตัวอย่าง การก้าวกระโดดนี้จากประสบการณ์ในอดีตไปสู่พฤติกรรมในอนาคต เรื่องใหญ่เรื่องหนึ่งและต้องพิจารณาเพิ่มเติมโดยได้ต้องได้ข้อสนับสนุนจากหลักการทางสถิติ ข้อพิจารณาเหล่านี้รวมถึง: การเลือกปัญหาที่ถูกต้อง การเลือกตัวแปรอิสระที่มีความหมาย การเรียกข้อมูลที่ขัดแย้ง การทำความเข้าใจลำดับชั้นและการพึ่งพาระหว่างการสังเกตและการสร้างลำดับที่ถูกต้องของโมเดล ไม่มีข้อกำหนดเหล่านี้เป็นเอกลักษณ์เฉพาะของ Machine Learning ทั้งหมดล้วนต้องการการวิเคราะห์ทางสถิติเพื่อความน่าเชื่อถือ

และในที่สุดสิ่งที่ดีที่สุดที่โมเดลสามารถทำได้คือดึงสารสนเทศที่อยู่ในข้อมูลออกมา เพื่อให้มีคุณค่าจะต้องมีสารสนเทศในข้อมูลในที่แรก เพื่อให้แน่ใจว่าข้อมูลของเรามีสารสนเทศที่มีค่าอยู่ในนั้น การออกแบบการทดลองมีความสำคัญในโมเดล ML (Machine Learning) มันเป็นสิ่งสำคัญสำหรับโมเดลทำนายอื่นๆ เมื่อมีการออกแบบที่มีโครงสร้างที่ดีตอนนี้คุณสามารถสร้างโมเดล ML และให้คะแนนทุกครั้งที่แทนค่าลงไปของทุกๆเงื่อนไขของกลุ่มตัวแปรที่ควบคุมได้ เราเรียนรู้วิธีที่ดีที่สุดในการตั้งค่าป้อนเข้าที่สามารถควบคุมได้ทั้งหมด (เช่น ราคาที่แสดงหรือช่องทางการตลาดหรืออุณหภูมิหรือความเร็ว) เพื่อให้ได้ผลลัพธ์ที่ดีที่สุดสำหรับทุกค่าที่ป้อนเข้า

วิธีการนี้ให้ประโยชน์สูงสุดจากสิ่งที่เรารู้ แต่มีข้อเสียอย่างมีนัยสำคัญสำหรับระบบใดๆที่เป็นช่วงคิดค้นสิ่งใหม่อย่างแท้จริง เงื่อนไขที่ดีที่สุดของปัจจัยควบคุมย้ายเปลี่ยนด้วยตัวมันเองได้เมื่อปัจจัยสิ่งแวดล้อมภายนอกเปลี่ยน (เช่น การพัฒนาคุณภาพของวัตถุดิบ, การเจรจาผลประโยชน์ของผู้บริโภค, หรือการตอบโต้ของคู่แข่ง) ถ้าเราทำการกำหนดค่าเงื่อนไขที่ดีที่สุดอย่างจำเพาะเจาะจงเพียงครั้งเดียวตลอดเมื่อนั้นคุณจะสับสนว่าอะไรคือสิ่งที่สังเกตเห็นกับอะไรคือสิ่งที่เราทำ วิธีการนี้จะทำการสร้างโมเดลใหม่และปรับปรุงที่เป็นไปไม่ได้ให้ การออกแบบการทดลองที่ทันสมัยกว่า ตัวอย่างเช่น การสุ่มแบบ Thomson แก้ปัญหานี้โดยท้าทายความเชื่อปัจจุบันของเราอย่างต่อเนื่อง การออกแบบเหล่านี้ช่วยให้เราสามารถสร้างสมดุลระหว่างผลลัพธ์ทางตัวเงินตอนนี้และเรียนรู้สิ่งที่เราต้องการเพื่อให้สามารถสร้างรายได้ในอนาคตเช่นกัน

ML คือชุดเครื่องมือที่เป็นส่วนเสริมที่มีประสิทธิภาพมากสำหรับมืออาชีพ ด้วยข้อระมัดระวังขั้นพื้นฐานบางข้อ ทำให้เราสามารถหลีกเลี่ยงความโง่เขลาและความน่าสะพรึงกลัวและเมื่อรวมกับทักษะทางสถิติแบบเต็มชุด ML ช่วยให้เราเป็นนัดสถิติที่ดีกว่าเดิม


บทความต้นฉบับ : Guest Post: It’s Tough to Make Predictions, Especially about the Future (even with Machine Learning)

ต้นฉบับนำมาจาก Minitab blog , แปลและเรียบเรียงโดยชลทิชา จํารัสพร

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ