ปี 2016 บริษัทจัดหางานชื่อดัง Glassdoor ได้จัดทำรายงานเกี่ยวกับอาชีพที่ดีที่สุดในสหรัฐอเมริกา จากการรวบรวมและวิเคราะห์ความคิดเห็นเกี่ยวกับอาชีพจากบุคคลทั่วไป โดยใช้เกณฑ์การตัดสินจากจำนวนตำแหน่งงานที่เปิดรับ ข้อมูลฐานเงินเดือนเฉลี่ย และคะแนนเรตติ้งเกี่ยวกับโอกาสทางการงาน
ผลปรากฏว่า Data Scientist หรือนักวิทยาศาสตร์ข้อมูลได้รับการโหวตให้เป็นอาชีพยอดเยี่ยมอันดับหนึ่งจาก 1,700 อาชีพ มีค่ามัธยฐานเงินเดือนหรือรายได้เฉลี่ยต่อปีเกือบ 117,000 ดอลลาร์สหรัฐ! และเป็นที่ต้องการในตลาดมากที่สุด รองลงมาคือ ผู้จัดการบัญชีภาษี (อันดับ 2 – รายได้เฉลี่ยต่อปี 108,000 ดอลลาร์สหรัฐ) และสถาปนิกไอทีด้านโซลูชัน (อันดับ 3 – รายได้เฉลี่ยต่อปี 119,500 ดอลลาร์สหรัฐ)
ไม่ใช่แค่ Glassdoor เว็บไซต์ต่างประเทศหลายรายล้วนประสานเป็นเสียงเดียวกันว่า ‘ศาสตร์แห่งวิทยาศาสตร์ข้อมูลเป็นหนึ่งในสาขาวิชาชีพที่กำลังมาแรงมากที่สุดในศตวรรษที่ 21’ จากตำแหน่งอาชีพที่แทบไม่มีใครรู้จัก ในปี 2014 มหาวิทยาลัยนิวยอร์กได้เพิ่มหลักสูตรและปริญญาโทด้าน Data Science โดยเฉพาะ
ทุกวันนี้ มีอาชีพแปลกใหม่ผุดเพิ่มขึ้นเร็วพอๆ กับการเปิดตัวแกดเจ็ตรุ่นใหม่ แต่จะเกิดอะไรขึ้นเมื่ออาชีพเหล่านี้เริ่มเป็นที่ต้องการในตลาด แต่ยังขาดคนที่มีทักษะความเชี่ยวชาญ?
แค่พูดถึงศาสตร์แห่งวิทยาศาสตร์ข้อมูล (Data Science) หลายคนก็พร้อมจะตีหน้ามึน หรือมีเครื่องหมายคำถามเต็มสองตา
นักวิทยาศาสตร์ข้อมูลต้องใส่เสื้อกาวน์ทำงานอยู่ในห้องแล็บเท่านั้นหรือเปล่า?
รายได้ดีจริงไหม?
ถ้าสนใจอยากเป็นนักวิทยาศาสตร์ข้อมูลควรเริ่มต้นจากตรงไหน?
มีบริษัทในไทยรองรับอาชีพนี้แล้วหรือยัง?
The Momentum ได้รวบรวมสารพัดคำถามและข้อสงสัยไปพูดคุยกับคนไทย 2 คนที่มีความรู้ ความเชี่ยวชาญ และประสบการณ์การทำงานเกี่ยวกับศาสตร์แห่งวิทยาศาสตร์ข้อมูลโดยตรง ได้แก่ ต้า-วิโรจน์ จิรพัฒนกุล ซึ่งเคยทำงานเป็น Data Scientist ในบริษัทที่มาแรงสุดๆ อย่างเฟซบุ๊ก ก่อนจะกลับมาทำงานในเมืองไทย และ โจ้-ภูริพันธุ์ รุจิขจร ผู้ร่วมก่อตั้ง Boonmee Lab และเป็นอาจารย์สอนวิชา Data Visualization ที่คณะพาณิชยศาสตร์และการบัญชี จุฬาลงกรณ์มหาวิทยาลัย
ถอดรหัส Data Scientist อาชีพที่มาแรงสุดในอเมริกา
เราเริ่มพูดคุยกับ ต้า-วิโรจน์ จิรพัฒนกุล กันก่อนว่าอาชีพนี้คืออะไร ทำหน้าที่อะไรบ้าง และทำไมการจัดการข้อมูลจึงสำคัญในยุคนี้
ต้าอธิบายว่า โลกเราในปัจจุบันเต็มไปด้วยข้อมูลมหาศาลที่สร้างขึ้นโดยผู้ใช้งานบนโซเชียลมีเดียและแพลตฟอร์มมากมาย และจากเทคโนโลยีที่คอยติดตามเราทุกขณะ เมื่อผู้คนเปลี่ยนพฤติกรรมจากออฟไลน์ไปสู่ออนไลน์มากขึ้น การวิเคราะห์พฤติกรรมผู้บริโภคหรือทำการตลาดแบบเดิมจึงใช้ไม่ได้ผลเสมอไป
แล้วนักวิทยาศาสตร์ข้อมูลเข้ามามีบทบาทอย่างไร? คำตอบคือ คนทำงานด้าน วิทยาศาสตร์ข้อมูลจะนำข้อมูลที่กระจัดกระจายจากแหล่งต่างๆ มาจัดการและวิเคราะห์ เพื่อใช้ประโยชน์ ซึ่งขึ้นอยู่กับโจทย์หรือวัตถุประสงค์การใช้งาน เช่น สร้าง predictive model หรือระบบอัลกอริทึมขึ้นมาประมวลผล เพื่อค้นหาอินไซต์เกี่ยวกับผู้ใช้งาน (user) หรือเก็บข้อมูลเพื่อใช้ประกอบการตัดสินใจขององค์กรบริษัท
“เช่น กูเกิล เป็นเสิร์ชเอนจินที่สามารถเอาข้อมูลจากการเสิร์ชมาดูได้ว่ากลุ่มคนแบบไหนสนใจอะไร และขายช่องทางโฆษณาให้กับบริษัทต่างๆ ซึ่งเป็นการสร้างมูลค่าให้กับองค์กรอย่างหนึ่ง ขณะเดียวกันก็จะมีแง่มุมของการช่วยเหลือสังคม เช่น กูเกิลสามารถคาดการณ์เทรนด์ไข้หวัดในช่วงที่เกิดไข้หวัดระบาดได้”
หลังจากเรียนจบปริญญาตรี ต้าได้รับทุนมูลนิธิอานันทมหิดลไปศึกษาต่อระดับปริญญาโทและปริญญาเอกที่สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) สาขา Transportation และ Operation Research (OR) ซึ่งมีความใกล้เคียงกับศาสตร์วิทยาศาสตร์ข้อมูล แต่กว่าจะได้เข้าไปทำงานในบริษัทชั้นนำแห่งซิลิคอนวัลเลย์ที่เด็กรุ่นใหม่หลายคนใฝ่ฝันถึง เขาต้องเรียนรู้เองทั้งหมด…
“เราสนุกกับการเขียนโปรแกรมนะ แต่ชอบการเขียนโปรแกรมเพื่อแก้ปัญหาอะไรบางอย่างมากกว่า เลยได้ไปรู้จักกับศาสตร์ที่เรียกว่า Operation Research (OR) ซึ่งต้องบูรณาการความรู้ทางสถิติ คณิตศาสตร์ และคอมพิวเตอร์ มาทำแบบจำลองทางธุรกิจเพื่อ optimize อะไรบางอย่าง ยกตัวอย่างเช่น ในระบบโลจิสติกส์ เราจะต้องดูว่าจะวางคลังสินค้าตรงไหนเพื่อให้ค่าขนส่งต่ำที่สุด ค่าใช้จ่ายน้อยที่สุด หรือในระบบซื้อของออนไลน์มันจะมี revenue management ถ้าเราเป็นธุรกิจโรงแรม หรือบริษัทสายการบิน เราก็ต้องอยากรู้ว่าจะต้องกำหนดราคาเท่าไร ณ เวลาใด จึงจะทำรายได้เยอะที่สุด เราต้องดูว่าข้อมูลในอดีตเป็นยังไง แล้วลองวิเคราะห์และคาดการณ์ดู (predict)
“ตอนที่เรียน MIT ผมเคยวางแผนระบบเช่าจักรยานว่าควรจะตั้งสถานีเช่าจักรยานที่ไหนบ้าง เพื่อเชื่อมต่อกับระบบขนส่งสาธารณะที่มีอยู่ให้ได้มากที่สุด กลายเป็นว่าเราคลุกคลีกับข้อมูลค่อนข้างเยอะ แล้วช่วงนั้น Data Science มันบูมพอดี ผมก็เลยไปสัมภาษณ์งานนี้ที่เฟซบุ๊กในปี 2012 และเริ่มทำตอนปี 2013
“ตอนนั้น big data เป็นเรื่องใหม่ กว่าจะได้งานมา เราต้องศึกษาด้วยตัวเองเยอะมาก เรียนออนไลน์ ทดลองทำนู่นทำนี่ เราเลยรู้สึกว่าการเรียนออนไลน์มันมีประโยชน์มาก แล้วเทคโนโลยีมันเปลี่ยนเร็ว ตอนเรียนมหาวิทยาลัย เทรนด์มือถือมันยังไม่มาเลย แต่ทุกวันนี้ mobile developer เป็นที่ต้องการในตลาดโมบายล์แอปพลิเคชัน พอกลับมาทำงานในไทย เราก็อยากจะเปิดบริษัทด้านการศึกษาในไทย เป็นแพลตฟอร์มออนไลน์ที่ช่วยเพิ่มพูนทักษะสมัยใหม่ ซึ่งเป็นที่ต้องการของตลาด เช่น ความรู้ด้านวิทยาศาสตร์ข้อมูล เทคโนโลยี การเขียนโค้ด”
วิทย์หรือคณิต? อะไรคือทักษะสำคัญที่ต้องมี?
ประเด็นนี้อาจจะยุ่งยากและซับซ้อนสักหน่อย เพราะต้าบอกกับเราว่า นักวิทยาศาสตร์ข้อมูลนั้นเป็นอาชีพที่ถูกคาดหวังว่าจะต้องมีองค์ความรู้อย่างหลากหลาย หรือสหวิทยาการ (interdisciplinary) เรียกง่ายๆ ว่าสามารถทำได้หลายอย่างนั่นเอง
แต่อย่าเพิ่งถอดใจกันตอนนี้ เพราะต้าแนะนำมาว่าลองศึกษาวิชาความรู้ต่อไปนี้กันดู
1) ความรู้ด้านวิทยาการคอมพิวเตอร์ (Computer Science)
เนื่องจากข้อมูลในปัจจุบันมีปริมาณมหาศาล จึงต้องอาศัยระบบประมวลผลข้อมูลอัตโนมัติมากขึ้น นักวิทยาศาสตร์ข้อมูลจึงควรมีความรู้เกี่ยวกับคอมพิวเตอร์ เช่น การเขียนโค้ดหรือโปรแกรมให้เครื่องสร้างโมเดลขึ้นมา หรือ machine-learning ซึ่งจะช่วยวิเคราะห์ได้แม่นยำกว่าการวิเคราะห์ข้อมูลแบบดั้งเดิมในโปรแกรม Excel หรือซอฟต์แวร์เก่า
2) ความรู้ด้านสถิติ (Statistics)
โดยปกติหน้าที่หลักของนักวิทยาศาสตร์ข้อมูลคือ การวิเคราะห์ข้อมูล ซึ่งในบางครั้งต้องนำความรู้ด้านสถิติเข้ามาช่วยวิเคราะห์และเปรียบเทียบความแตกต่างของพฤติกรรมผู้ใช้งานให้ชัดเจนขึ้น เช่น การทำ A/B testing ทดสอบว่าการวางเลย์เอาต์หน้าเว็บแบบ A กับ B แบบไหนกระตุ้นให้คนซื้อของเยอะมากกว่ากัน โดยใช้ความรู้เชิงสถิติเข้ามาช่วย
3) ความรู้เฉพาะสาขา (Domain Knowledge)
ในที่นี้ ต้าอธิบายว่า นักวิทยาศาสตร์ข้อมูลควรจะมีความเข้าใจทางธุรกิจประมาณหนึ่ง เพื่อนำข้อมูลมาใช้ประโยชน์ทางธุรกิจได้ เช่น ถ้าเราเข้าใจปัญหาของผู้บริโภค เราก็อาจจะหาความสัมพันธ์ของพฤติกรรมผู้บริโภค และสามารถขายพื้นที่โฆษณาให้กับผู้บริโภคได้ตรงกลุ่ม
4) ความอยากรู้อยากเห็น และความคิดสร้างสรรค์ (Curiosity & Creativity)
สองอย่างนี้คือส่วนผสมสำคัญที่จะช่วยผลักดันให้เกิดนวัตกรรมและความคิดใหม่ๆ ที่นำข้อมูลมาใช้ให้เกิดประโยชน์ได้นั่นเอง
ยุคแห่ง Big Data เมื่อทุกคนผลิตคอนเทนต์เอง ก็ต้องมีคนช่วยจัดการข้อมูล
ทำไมอาชีพนี้จึงทำรายได้มหาศาลและเป็นที่ต้องการในสหรัฐอเมริกาภายในระยะเวลาไม่กี่ปี หรือนี่จะเป็นแค่กระแสที่สะพัดขึ้นโดยสื่อมวลชนเท่านั้น
ต้าอธิบายว่า ตลาดของนักวิทยาศาสตร์ข้อมูลนั้นโตจริงๆ ส่วนหนึ่งเป็นผลสืบเนื่องมาจากการเปลี่ยนผ่านเข้าสู่ยุคอินเทอร์เน็ตใหม่ที่เต็มไปด้วยคอนเทนต์ซึ่งคนทั่วไปสร้างขึ้น หรือ user-generated content ส่วนตัวเลขฐานเงินเดือน เขายอมรับว่าเป็นอาชีพที่มีรายได้สูงจริงๆ เมื่อเทียบกับฐานรายได้ของวิศวกรซอฟต์แวร์ระดับจูเนียร์
“เนื่องจากข้อมูลในโลกของเรามันเยอะขึ้น อินเทอร์เน็ตมีความเจริญก้าวหน้าและเข้ามาสู่ยุคใหม่ที่มีสิ่งที่เรียกว่า user-generated content คือผู้ใช้งานเป็นคนใส่ข้อมูลเข้าไป ทำให้มีข้อมูลในระบบมากขึ้น ด้วยการเติบโตของโซเชียลมีเดียต่างๆ เฟซบุ๊ก อินสตาแกรม ทวิตเตอร์ ทำให้มีคอนเทนต์อยู่ในโลกอินเทอร์เน็ตค่อนข้างเยอะ นอกจากนี้ก็มีความเจริญก้าวหน้าด้านเทคโนโลยี อย่างเช่น Fitbit หรือโทรศัพท์มือถือที่แทร็กข้อมูลของเราตลอดเวลา แล้วส่งข้อมูลกลับไปที่เซิร์ฟเวอร์ว่าเรามีพฤติกรรมการใช้งานยังไง เมื่อก่อนกิจวัตรประจำวันของเราเป็นแอนะล็อก แต่ทุกวันนี้กลายเป็นดิจิทัลหมด ซึ่งข้อมูลเหล่านี้สามารถนำมาใช้ประโยชน์ได้
“หรือตัวอย่างการใช้ข้อมูลในเรื่อง personalization หรือ recommender systems เช่น เฟซบุ๊กที่จะเก็บข้อมูลทุกครั้งเวลาที่เราไปกดไลก์เพจและโพสต์ต่างๆ เพื่อทำ ranking เพราะรายได้ส่วนใหญ่ของเฟซบุ๊กมาจากโฆษณา เขาก็ต้องคิดว่าจะทำยังไงให้นิวส์ฟีดน่าสนใจ ทุกสตอรีดูน่าสนใจหมด และทำให้คนใช้เวลาอยู่บนนั้นนานๆ
“เช่นเดียวกัน Amazon งานหลักเขาคือขายของ คนกดดูสินค้าเทียบอันนี้กับอันนั้น ทำยังไงที่เรา (นักวิทยาศาสตร์ข้อมูล) จะเอาข้อมูลเหล่านี้มาช่วยเขาขายของได้ดีขึ้น อันนี้ก็เป็นพาร์ตที่คนพูดถึงกันเยอะ เพราะ machine-learning เริ่มเข้ามามีบทบาทและเรียนรู้จากพฤติกรรมการใช้งานในอดีตของผู้ใช้งาน เราก็จะวิเคราะห์และจัดประเภทออกมาว่าคนนี้อยู่ในกลุ่มผู้ใช้งานประเภทนี้ ควรจะขายของอะไร
“แต่ตอนนี้คำว่า Data Scientist มันถูกใช้กันมากเกินไป สตาร์ทอัพบางแห่งที่ยังไม่มีโครงสร้างพื้นฐานด้านข้อมูล Data Scientist ก็อาจจะต้องทำงานด้านวิศวกรรมข้อมูลด้วย”
นักวิทยาศาสตร์ข้อมูลไม่ได้ทำงานอยู่ในห้องทดลอง แต่จะเข้าไปอยู่ในทุกๆ บริษัท
มาถึงบรรทัดนี้ หลายๆ คนน่าจะหายข้องใจแล้วว่านักวิทยาศาสตร์ข้อมูลทำงานอยู่ในห้องแล็บ หรือทำงานเฉพาะทางมากๆ ในอุตสาหกรรมวิทยาศาสตร์เท่านั้นหรือไม่ แต่ที่น่าสนใจกว่านั้นอาชีพนี้จะมีบทบาทสำคัญต่อทุกอุตสาหกรรมธุรกิจในอนาคต
“อาชีพ Data Scientist มันต่อยอดได้กับทุกธุรกิจเลยครับ เช่น ธุรกิจสื่อออนไลน์ในอเมริกา เขาต้องคิดว่าจะนำเสนอข่าวยังไงให้น่าสนใจ เช่น ทำ A/B testing ทดสอบการพาดหัวข่าว และค้นหาความสัมพันธ์ว่าคนอ่านของเราสนใจเรื่องเกี่ยวกับอะไรบ้าง แต่จริงๆ ผมว่าคนไทยส่วนใหญ่ค่อนข้างหลงทางเวลาพูดถึงวิทยาศาสตร์ข้อมูล คนจะโฟกัสเรื่องเครื่องมือ (tools) กันเยอะ หรือระบบการเรียนรู้ของเครื่อง (machine-learning) ที่คาดการณ์สิ่งต่างๆ ได้ หลายองค์กรควรจะเริ่มจากเอาข้อมูลขั้นพื้นฐานที่มีมาประกอบการตัดสินใจในองค์กร ทำยังไงจึงจะเอาข้อมูลมาใช้งานได้มากขึ้น เพราะยังมีหลายอาชีพที่ยังไม่ได้เอาข้อมูลมาใช้ ทุกองค์กรได้ยินเรื่องนี้ แต่ยังไม่มีการทำระบบดีๆ ที่พนักงานสามารถเข้าถึงข้อมูลและเอามาใช้ได้ง่ายๆ”
เมื่อเครื่องจักรเริ่มทำงานแทนคน แล้วนักวิทยาศาสตร์ข้อมูลจะยืนอยู่ตรงไหน?
ในฐานะคนที่ต้องทำงานอยู่กับข้อมูลมหาศาล คอมพิวเตอร์ และอุปกรณ์ไอทีต่างๆ ทุกวัน ถ้าหากเครื่องจักรและหุ่นยนต์พัฒนาความฉลาดจนสามารถทำงานได้ดีกว่ามนุษย์ แล้วนักวิทยาศาสตร์ข้อมูลจะตกงานไหม
เรื่องนี้ ต้าตอบว่าอาชีพนี้ยังจำเป็นอยู่ โดยเฉพาะกับภาคธุรกิจ
“สิ่งสำคัญที่สุดคือการนำข้อมูลมาใช้ประโยชน์ในทางธุรกิจ เพราะฉะนั้นมันยังต้องอาศัยอะไรที่มันเป็นความคิดสร้างสรรค์ว่า เราจะเอาท่าไหนมาเล่น สุดท้ายมันต้องกลับมาที่เรื่องการออกแบบผลิตภัณฑ์อีกครั้ง นักวิทยาศาสตร์ข้อมูลไม่ได้เป็นคนทำสินค้า มันเหมือนกับเราเอาข้อมูลจากคนอื่น ถ้าต้นทางข้อมูลมันมาไม่ถึง ก็ทำงานยาก ถ้ายกตัวอย่างให้ชัดเจนอีกอันหนึ่งคือ เวลาคนคอมเมนต์เฟซบุ๊ก ถ้าเป็นสาย machine-learning เขาจะคาดเดากันว่าโพสต์นี้คนเห็นแล้วจะตลกหรือโกรธ ซึ่งพอจะทำได้ แต่ก็ทำยาก แต่พอเฟซบุ๊กออกแบบปุ่มรีแอ็กชันขึ้นมา โพสต์นี้คนกด haha เยอะ เราก็เห็นได้เลยว่ามันตลก ในมุมของคนใช้ เขาก็อยากแสดงอารมณ์ของตัวเองออกมาเหมือนกัน สุดท้ายผมมองว่ามันเป็นเฟืองอันหนึ่งที่ต้องทำควบคู่กันไปกับการออกแบบผลิตภัณฑ์และธุรกิจ”
Data Visualization โอกาสที่ซ่อนอยู่ในภาพข้อมูล
ทำความเข้าใจใหม่ Data Visualization ไม่ใช่ภาพอินโฟกราฟิก
การจัดการข้อมูลให้เป็นภาพไม่ใช่เรื่องใหม่ ปัจจุบันมีการจัดทำ Data Visualization ขึ้น เพื่อประโยชน์ทางการจัดเก็บวิเคราะห์ข้อมูลทางธุรกิจ การแพทย์ การจัดการภัยพิบัติ หรือแม้แต่การแก้ปัญหาเมืองใหญ่อย่างบอสตัน ที่ขับเคลื่อนเมืองด้วยข้อมูลอย่างชาญฉลาด โดยนายกเทศมนตรีและคณะจะคอยตรวจดูสถานการณ์ต่างๆ ทุกวัน ผ่านแดชบอร์ดที่แสดงข้อมูลเชิงสถิติเกี่ยวกับเมืองทั้งหมดแบบอินเตอร์แอ็กทีฟ เช่น ข้อมูลประชากร ความปลอดภัยทางสาธารณะ การควบคุมไฟจราจร การจัดเก็บขยะ หรือแม้แต่รายงานจำนวนภาพกราฟฟิตี้ที่ถูกแจ้งลบ
ทางฝั่งสำนักข่าวระดับโลกนั้นตื่นตัวกับเรื่องนี้เช่นกัน อาทิ นิวยอร์กไทม์ส ได้เปิดแผนก R&D สำหรับค้นคว้าวิจัยและทำงานด้าน Data Visualization ในประเด็นข่าวต่างๆ โดยเฉพาะ ขณะที่ ยูเอสเอ ทูเดย์ ได้นำข้อมูลเชิงสถิติมาออกแบบเป็นแอนิเมชันและอินเตอร์แอ็กทีฟประกอบการนำเสนอข่าวอยู่บ่อยครั้ง
สำนักข่าว ยูเอสเอ ทูเดย์ ได้ออกแบบระบบอินเตอร์แอ็กทีฟ
เพื่อนำเสนอข้อมูลเชิงสถิติเกี่ยวกับผู้ตกเป็นเหยื่อจากการสังหารหมู่ให้เข้าใจง่ายและเห็นภาพชัดขึ้น
ด้วย Data Visualization โดยแบ่งตามกลุ่มอายุ และอาวุธ/วิธีการสังหาร