วันอังคารที่ 6 สิงหาคม พ.ศ. 2562

risk of overfitting

เมื่อวานเขียนถึงเรื่อง overfitting วันนี้เอา paper หนึ่งมาฝาก ชื่อ Real numbers, data science and chaos: How to fit any dataset with a single parameter ช่วยให้เห็นภาพเข้าใจปัญหาของประเด็นนี้มากขึ้น (ไม่ต้องหลายพารามิเตอร์ แค่หนึ่งพารามิเตอร์ก็ over fit ได้)
ถ้าใครไม่ชอบอ่าน paper ที่มี math เยอะๆ ลองดู code ภาษา python โปรเจค single-parameter-fit ด้านล่างก็ได้ เขาสาธิตให้เห็นการเทคนิค สร้างโมเดล ที่มา fit กับ traning dataset หรือข้อมูลในอดีต ที่เตรียมไว้ ด้วยตัวแปรเดียว นอกจากข้อมูลทั่วไป เขายังสาธิตข้อมูลประเภท time series เช่น S&P500 index ด้วย
เชื่อว่าได้ลองศึกษาบทความนี้ จะช่วยให้เรากระจ่างมากขึ้น ส่วนเทคนิคลดทอนการ over fiitting ของการพัฒนาโมเดล / พัฒนาระบบเทรด ก็มีหลายทาง เช่นการทดสอบจาก simulation ของข้อมูลจำนวนมากๆ, การทำ Regularization,การทดสอบ Cross-validation , การทำ Walk Forward Analysis and Optimization เป็นต้น


นี้เป็นอีกคำตอบหนึ่ง ที่ว่าทำไมระบบเทรด สถิติจาก back test สวยๆเวอร์ๆ จึงเอาไปเทรดจริง ในตลาดไม่รอด ...