ชีวิตจริง Data Scientist วันๆ ทำอะไรบ้าง (ไม่ได้เท่เหมือนในหนัง?)

ชีวิตจริง Data Scientist วันๆ ทำอะไรบ้าง (ไม่ได้เท่เหมือนในหนัง?)

หากคุณจินตนาการว่า Data Scientist คือคนที่นั่งหน้าจอมอนิเตอร์ 10 จอ มีโค้ดสีเขียวไหลผ่านหน้าแบบ The Matrix หรือกำลังคุยกับ AI ล้ำสมัยแบบใน Iron Man คุณกำลังเข้าใจผิดครับ ชีวิตจริงของคนทำข้อมูลนั้นมีความ “ถึก” และ “ละเอียด” มากกว่าที่หลายคนคิด

นี่คือความจริง 5 ด้านที่ Data Scientist ทั่วโลกต้องเผชิญในแต่ละวัน

ชีวิตจริง Data Scientist วันๆ ทำอะไรบ้าง (ไม่ได้เท่เหมือนในหนัง?)

1. 80% ของเวลาคือ “ภารกิจล้างถังขยะ” (Data Cleaning)

ในหนังเราจะเห็น Data Scientist กดปุ่มเดียวแล้วกราฟสวยๆ ก็โผล่มา แต่ในโลกความจริง ข้อมูลในบริษัทมักจะ “สกปรก” (Dirty Data) เช่น ข้อมูลขาดหาย, พิมพ์ผิด, หรือระบบบันทึกค่าผิดพลาด

  • ความจริง: งานส่วนใหญ่คือการเขียนโค้ดเพื่อทำความสะอาดข้อมูล (Data Wrangling) เพื่อให้มั่นใจว่าข้อมูลที่จะนำไปวิเคราะห์นั้น “เชื่อถือได้” เพราะถ้าข้อมูลนำเข้าขยะ ผลลัพธ์ที่ได้ก็จะเป็นขยะ (Garbage In, Garbage Out)

2. นักสืบสวนสอบสวน (Business Understanding)

ก่อนจะแตะโค้ด Data Scientist ต้องใช้เวลาส่วนใหญ่ไปกับการ “คุยกับคน” เพื่อหาคำตอบว่า “โจทย์ธุรกิจจริงๆ คืออะไร?” หลายครั้งที่ฝ่ายบริหารอยากได้ AI แต่พอคุยไปคุยมา ผลลัพธ์ที่เขาต้องการอาจเป็นเพียงแค่ตาราง Excel สรุปยอดขายธรรมดาๆ การตีโจทย์ให้แตกจึงสำคัญกว่าการสร้างโมเดลล้ำๆ

3. การต่อสู้กับโครงสร้างพื้นฐาน (Data Infrastructure)

การจะได้ข้อมูลมาสักชุด ไม่ใช่แค่กด Download แต่บ่อยครั้งต้องไป “งัด” ข้อมูลออกมาจากฐานข้อมูลที่กระจัดกระจาย หรือต้องดีลกับฝ่าย IT เพื่อขอสิทธิ์เข้าถึงข้อมูล การเขียนคำสั่ง SQL ยาวเหยียดเพื่อดึงข้อมูลจากหลายตารางมาประกอบกัน คือกิจกรรมหลักที่ทำบ่อยกว่าการสร้างโมเดล AI เสียอีก

4. การเป็น “ล่าม” แปลภาษาคอมพิวเตอร์ (Data Storytelling)

โมเดลที่แม่นยำที่สุดจะไม่มีค่าเลยถ้าเจ้าของธุรกิจ “ฟังไม่รู้เรื่อง” Data Scientist ต้องเปลี่ยนผลลัพธ์จากค่าสถิติที่ซับซ้อน เช่น $p-value$ หรือ $F1-score$ ให้กลายเป็นภาษาง่ายๆ ว่า “ทำสิ่งนี้แล้วจะได้กำไรเพิ่มขึ้นเท่าไหร่?” หรือ “ลูกค้ากลุ่มไหนกำลังจะหนีเราไป?”

5. โมเดลพังคือเรื่องปกติ (Iteration & Failure)

ในหนังทุกอย่างสำเร็จในครั้งเดียว แต่ความจริงคือการลองผิดลองถูก (Trial and Error) โมเดลที่อุตส่าห์ทำมาเป็นสัปดาห์อาจจะใช้ไม่ได้ผลเมื่อเจอข้อมูลชุดใหม่ หรือความแม่นยำต่ำเกินกว่าจะใช้งานจริง การรับมือกับความผิดหวังและการ “จูน” โมเดลซ้ำแล้วซ้ำเล่าคือกิจวัตรที่เลี่ยงไม่ได้

ชีวิตจริง Data Scientist วันๆ ทำอะไรบ้าง (ไม่ได้เท่เหมือนในหนัง?)

เทรนด์ระดับโลก จาก Model-Centric สู่ Data-Centric

ปัจจุบันเทรนด์ของโลก (โดยเฉพาะแนวคิดของ Andrew Ng ปรมาจารย์ด้าน AI) กำลังเปลี่ยนจากการพยายามสร้างอัลกอริทึมที่ซับซ้อนที่สุด ไปเป็นการให้ความสำคัญกับ “คุณภาพของข้อมูล” (Data Quality) มากกว่า ซึ่งยิ่งตอกย้ำว่าชีวิตจริงของ Data Scientist จะต้องคลุกคลีอยู่กับการคัดกรองและปรับปรุงข้อมูลให้มีคุณภาพสูงที่สุด

อาชีพ Data Scientist ยังคงเป็นอาชีพที่น่าตื่นเต้นและสร้างมูลค่ามหาศาลให้กับองค์กรครับ แต่มันไม่ได้เท่เพราะความล้ำของเทคโนโลยีเพียงอย่างเดียว แต่มันเท่ตรงที่ “ความสามารถในการแก้ปัญหา” ท่ามกลางความยุ่งเหยิงของข้อมูล และเปลี่ยนมันให้กลายเป็นเข็มทิศที่นำพาธุรกิจไปข้างหน้าได้ต่างหาก

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *


ติดต่อ "แว่นTalk"