Photo: glassdoor.com

ปี 2016 บริษัทจัดหางานชื่อดัง Glassdoor ได้จัดทำรายงานเกี่ยวกับอาชีพที่ดีที่สุดในสหรัฐอเมริกา จากการรวบรวมและวิเคราะห์ความคิดเห็นเกี่ยวกับอาชีพจากบุคคลทั่วไป โดยใช้เกณฑ์การตัดสินจากจำนวนตำแหน่งงานที่เปิดรับ ข้อมูลฐานเงินเดือนเฉลี่ย และคะแนนเรตติ้งเกี่ยวกับโอกาสทางการงาน

ผลปรากฏว่า Data Scientist หรือนักวิทยาศาสตร์ข้อมูลได้รับการโหวตให้เป็นอาชีพยอดเยี่ยมอันดับหนึ่งจาก 1,700 อาชีพ มีค่ามัธยฐานเงินเดือนหรือรายได้เฉลี่ยต่อปีเกือบ 117,000 ดอลลาร์สหรัฐ! และเป็นที่ต้องการในตลาดมากที่สุด รองลงมาคือ ผู้จัดการบัญชีภาษี (อันดับ 2 – รายได้เฉลี่ยต่อปี 108,000 ดอลลาร์สหรัฐ) และสถาปนิกไอทีด้านโซลูชัน (อันดับ 3 – รายได้เฉลี่ยต่อปี 119,500 ดอลลาร์สหรัฐ)

ไม่ใช่แค่ Glassdoor เว็บไซต์ต่างประเทศหลายรายล้วนประสานเป็นเสียงเดียวกันว่า ‘ศาสตร์แห่งวิทยาศาสตร์ข้อมูลเป็นหนึ่งในสาขาวิชาชีพที่กำลังมาแรงมากที่สุดในศตวรรษที่ 21’ จากตำแหน่งอาชีพที่แทบไม่มีใครรู้จัก ในปี 2014 มหาวิทยาลัยนิวยอร์กได้เพิ่มหลักสูตรและปริญญาโทด้าน Data Science โดยเฉพาะ

via GIPHY

ทุกวันนี้ มีอาชีพแปลกใหม่ผุดเพิ่มขึ้นเร็วพอๆ กับการเปิดตัวแกดเจ็ตรุ่นใหม่ แต่จะเกิดอะไรขึ้นเมื่ออาชีพเหล่านี้เริ่มเป็นที่ต้องการในตลาด แต่ยังขาดคนที่มีทักษะความเชี่ยวชาญ?

แค่พูดถึงศาสตร์แห่งวิทยาศาสตร์ข้อมูล (Data Science) หลายคนก็พร้อมจะตีหน้ามึน หรือมีเครื่องหมายคำถามเต็มสองตา

นักวิทยาศาสตร์ข้อมูลต้องใส่เสื้อกาวน์ทำงานอยู่ในห้องแล็บเท่านั้นหรือเปล่า?

รายได้ดีจริงไหม?

ถ้าสนใจอยากเป็นนักวิทยาศาสตร์ข้อมูลควรเริ่มต้นจากตรงไหน?

มีบริษัทในไทยรองรับอาชีพนี้แล้วหรือยัง?

The Momentum ได้รวบรวมสารพัดคำถามและข้อสงสัยไปพูดคุยกับคนไทย 2 คนที่มีความรู้ ความเชี่ยวชาญ และประสบการณ์การทำงานเกี่ยวกับศาสตร์แห่งวิทยาศาสตร์ข้อมูลโดยตรง ได้แก่ ต้า-วิโรจน์ จิรพัฒนกุล ซึ่งเคยทำงานเป็น Data Scientist ในบริษัทที่มาแรงสุดๆ อย่างเฟซบุ๊ก ก่อนจะกลับมาทำงานในเมืองไทย และ โจ้-ภูริพันธุ์ รุจิขจร ผู้ร่วมก่อตั้ง Boonmee Lab และเป็นอาจารย์สอนวิชา Data Visualization ที่คณะพาณิชยศาสตร์และการบัญชี จุฬาลงกรณ์มหาวิทยาลัย

Photo: Lee Celano, Reuters/Profile

ถอดรหัส Data Scientist อาชีพที่มาแรงสุดในอเมริกา

เราเริ่มพูดคุยกับ ต้า-วิโรจน์ จิรพัฒนกุล กันก่อนว่าอาชีพนี้คืออะไร ทำหน้าที่อะไรบ้าง และทำไมการจัดการข้อมูลจึงสำคัญในยุคนี้

ต้าอธิบายว่า โลกเราในปัจจุบันเต็มไปด้วยข้อมูลมหาศาลที่สร้างขึ้นโดยผู้ใช้งานบนโซเชียลมีเดียและแพลตฟอร์มมากมาย และจากเทคโนโลยีที่คอยติดตามเราทุกขณะ เมื่อผู้คนเปลี่ยนพฤติกรรมจากออฟไลน์ไปสู่ออนไลน์มากขึ้น การวิเคราะห์พฤติกรรมผู้บริโภคหรือทำการตลาดแบบเดิมจึงใช้ไม่ได้ผลเสมอไป

แล้วนักวิทยาศาสตร์ข้อมูลเข้ามามีบทบาทอย่างไร? คำตอบคือ คนทำงานด้าน วิทยาศาสตร์ข้อมูลจะนำข้อมูลที่กระจัดกระจายจากแหล่งต่างๆ มาจัดการและวิเคราะห์ เพื่อใช้ประโยชน์ ซึ่งขึ้นอยู่กับโจทย์หรือวัตถุประสงค์การใช้งาน เช่น สร้าง predictive model หรือระบบอัลกอริทึมขึ้นมาประมวลผล เพื่อค้นหาอินไซต์เกี่ยวกับผู้ใช้งาน (user) หรือเก็บข้อมูลเพื่อใช้ประกอบการตัดสินใจขององค์กรบริษัท

“เช่น กูเกิล เป็นเสิร์ชเอนจินที่สามารถเอาข้อมูลจากการเสิร์ชมาดูได้ว่ากลุ่มคนแบบไหนสนใจอะไร และขายช่องทางโฆษณาให้กับบริษัทต่างๆ ซึ่งเป็นการสร้างมูลค่าให้กับองค์กรอย่างหนึ่ง ขณะเดียวกันก็จะมีแง่มุมของการช่วยเหลือสังคม เช่น กูเกิลสามารถคาดการณ์เทรนด์ไข้หวัดในช่วงที่เกิดไข้หวัดระบาดได้”

หลังจากเรียนจบปริญญาตรี ต้าได้รับทุนมูลนิธิอานันทมหิดลไปศึกษาต่อระดับปริญญาโทและปริญญาเอกที่สถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) สาขา Transportation และ Operation Research (OR) ซึ่งมีความใกล้เคียงกับศาสตร์วิทยาศาสตร์ข้อมูล แต่กว่าจะได้เข้าไปทำงานในบริษัทชั้นนำแห่งซิลิคอนวัลเลย์ที่เด็กรุ่นใหม่หลายคนใฝ่ฝันถึง เขาต้องเรียนรู้เองทั้งหมด…

“เราสนุกกับการเขียนโปรแกรมนะ แต่ชอบการเขียนโปรแกรมเพื่อแก้ปัญหาอะไรบางอย่างมากกว่า เลยได้ไปรู้จักกับศาสตร์ที่เรียกว่า Operation Research (OR) ซึ่งต้องบูรณาการความรู้ทางสถิติ คณิตศาสตร์ และคอมพิวเตอร์ มาทำแบบจำลองทางธุรกิจเพื่อ optimize อะไรบางอย่าง ยกตัวอย่างเช่น ในระบบโลจิสติกส์ เราจะต้องดูว่าจะวางคลังสินค้าตรงไหนเพื่อให้ค่าขนส่งต่ำที่สุด ค่าใช้จ่ายน้อยที่สุด หรือในระบบซื้อของออนไลน์มันจะมี revenue management ถ้าเราเป็นธุรกิจโรงแรม หรือบริษัทสายการบิน เราก็ต้องอยากรู้ว่าจะต้องกำหนดราคาเท่าไร ณ เวลาใด จึงจะทำรายได้เยอะที่สุด เราต้องดูว่าข้อมูลในอดีตเป็นยังไง แล้วลองวิเคราะห์และคาดการณ์ดู (predict)

“ตอนที่เรียน MIT ผมเคยวางแผนระบบเช่าจักรยานว่าควรจะตั้งสถานีเช่าจักรยานที่ไหนบ้าง เพื่อเชื่อมต่อกับระบบขนส่งสาธารณะที่มีอยู่ให้ได้มากที่สุด กลายเป็นว่าเราคลุกคลีกับข้อมูลค่อนข้างเยอะ แล้วช่วงนั้น Data Science มันบูมพอดี ผมก็เลยไปสัมภาษณ์งานนี้ที่เฟซบุ๊กในปี 2012 และเริ่มทำตอนปี 2013

“ตอนนั้น big data เป็นเรื่องใหม่ กว่าจะได้งานมา เราต้องศึกษาด้วยตัวเองเยอะมาก เรียนออนไลน์ ทดลองทำนู่นทำนี่ เราเลยรู้สึกว่าการเรียนออนไลน์มันมีประโยชน์มาก แล้วเทคโนโลยีมันเปลี่ยนเร็ว ตอนเรียนมหาวิทยาลัย เทรนด์มือถือมันยังไม่มาเลย แต่ทุกวันนี้ mobile developer เป็นที่ต้องการในตลาดโมบายล์แอปพลิเคชัน พอกลับมาทำงานในไทย เราก็อยากจะเปิดบริษัทด้านการศึกษาในไทย เป็นแพลตฟอร์มออนไลน์ที่ช่วยเพิ่มพูนทักษะสมัยใหม่ ซึ่งเป็นที่ต้องการของตลาด เช่น ความรู้ด้านวิทยาศาสตร์ข้อมูล เทคโนโลยี การเขียนโค้ด”

via GIPHY

วิทย์หรือคณิต? อะไรคือทักษะสำคัญที่ต้องมี?

ประเด็นนี้อาจจะยุ่งยากและซับซ้อนสักหน่อย เพราะต้าบอกกับเราว่า นักวิทยาศาสตร์ข้อมูลนั้นเป็นอาชีพที่ถูกคาดหวังว่าจะต้องมีองค์ความรู้อย่างหลากหลาย หรือสหวิทยาการ (interdisciplinary) เรียกง่ายๆ ว่าสามารถทำได้หลายอย่างนั่นเอง

แต่อย่าเพิ่งถอดใจกันตอนนี้ เพราะต้าแนะนำมาว่าลองศึกษาวิชาความรู้ต่อไปนี้กันดู

1) ความรู้ด้านวิทยาการคอมพิวเตอร์ (Computer Science)

เนื่องจากข้อมูลในปัจจุบันมีปริมาณมหาศาล จึงต้องอาศัยระบบประมวลผลข้อมูลอัตโนมัติมากขึ้น นักวิทยาศาสตร์ข้อมูลจึงควรมีความรู้เกี่ยวกับคอมพิวเตอร์ เช่น การเขียนโค้ดหรือโปรแกรมให้เครื่องสร้างโมเดลขึ้นมา หรือ machine-learning ซึ่งจะช่วยวิเคราะห์ได้แม่นยำกว่าการวิเคราะห์ข้อมูลแบบดั้งเดิมในโปรแกรม Excel หรือซอฟต์แวร์เก่า

2) ความรู้ด้านสถิติ (Statistics)

โดยปกติหน้าที่หลักของนักวิทยาศาสตร์ข้อมูลคือ การวิเคราะห์ข้อมูล ซึ่งในบางครั้งต้องนำความรู้ด้านสถิติเข้ามาช่วยวิเคราะห์และเปรียบเทียบความแตกต่างของพฤติกรรมผู้ใช้งานให้ชัดเจนขึ้น เช่น การทำ A/B testing ทดสอบว่าการวางเลย์เอาต์หน้าเว็บแบบ A กับ B แบบไหนกระตุ้นให้คนซื้อของเยอะมากกว่ากัน โดยใช้ความรู้เชิงสถิติเข้ามาช่วย

3) ความรู้เฉพาะสาขา (Domain Knowledge)

ในที่นี้ ต้าอธิบายว่า นักวิทยาศาสตร์ข้อมูลควรจะมีความเข้าใจทางธุรกิจประมาณหนึ่ง เพื่อนำข้อมูลมาใช้ประโยชน์ทางธุรกิจได้ เช่น ถ้าเราเข้าใจปัญหาของผู้บริโภค เราก็อาจจะหาความสัมพันธ์ของพฤติกรรมผู้บริโภค และสามารถขายพื้นที่โฆษณาให้กับผู้บริโภคได้ตรงกลุ่ม

4) ความอยากรู้อยากเห็น และความคิดสร้างสรรค์ (Curiosity & Creativity)

สองอย่างนี้คือส่วนผสมสำคัญที่จะช่วยผลักดันให้เกิดนวัตกรรมและความคิดใหม่ๆ ที่นำข้อมูลมาใช้ให้เกิดประโยชน์ได้นั่นเอง

via GIPHY

ยุคแห่ง Big Data เมื่อทุกคนผลิตคอนเทนต์เอง ก็ต้องมีคนช่วยจัดการข้อมูล

ทำไมอาชีพนี้จึงทำรายได้มหาศาลและเป็นที่ต้องการในสหรัฐอเมริกาภายในระยะเวลาไม่กี่ปี หรือนี่จะเป็นแค่กระแสที่สะพัดขึ้นโดยสื่อมวลชนเท่านั้น

ต้าอธิบายว่า ตลาดของนักวิทยาศาสตร์ข้อมูลนั้นโตจริงๆ ส่วนหนึ่งเป็นผลสืบเนื่องมาจากการเปลี่ยนผ่านเข้าสู่ยุคอินเทอร์เน็ตใหม่ที่เต็มไปด้วยคอนเทนต์ซึ่งคนทั่วไปสร้างขึ้น หรือ user-generated content ส่วนตัวเลขฐานเงินเดือน เขายอมรับว่าเป็นอาชีพที่มีรายได้สูงจริงๆ เมื่อเทียบกับฐานรายได้ของวิศวกรซอฟต์แวร์ระดับจูเนียร์

“เนื่องจากข้อมูลในโลกของเรามันเยอะขึ้น อินเทอร์เน็ตมีความเจริญก้าวหน้าและเข้ามาสู่ยุคใหม่ที่มีสิ่งที่เรียกว่า user-generated content คือผู้ใช้งานเป็นคนใส่ข้อมูลเข้าไป ทำให้มีข้อมูลในระบบมากขึ้น ด้วยการเติบโตของโซเชียลมีเดียต่างๆ เฟซบุ๊ก อินสตาแกรม ทวิตเตอร์ ทำให้มีคอนเทนต์อยู่ในโลกอินเทอร์เน็ตค่อนข้างเยอะ นอกจากนี้ก็มีความเจริญก้าวหน้าด้านเทคโนโลยี อย่างเช่น Fitbit หรือโทรศัพท์มือถือที่แทร็กข้อมูลของเราตลอดเวลา แล้วส่งข้อมูลกลับไปที่เซิร์ฟเวอร์ว่าเรามีพฤติกรรมการใช้งานยังไง เมื่อก่อนกิจวัตรประจำวันของเราเป็นแอนะล็อก แต่ทุกวันนี้กลายเป็นดิจิทัลหมด ซึ่งข้อมูลเหล่านี้สามารถนำมาใช้ประโยชน์ได้

“หรือตัวอย่างการใช้ข้อมูลในเรื่อง personalization หรือ recommender systems เช่น เฟซบุ๊กที่จะเก็บข้อมูลทุกครั้งเวลาที่เราไปกดไลก์เพจและโพสต์ต่างๆ เพื่อทำ ranking เพราะรายได้ส่วนใหญ่ของเฟซบุ๊กมาจากโฆษณา เขาก็ต้องคิดว่าจะทำยังไงให้นิวส์ฟีดน่าสนใจ ทุกสตอรีดูน่าสนใจหมด และทำให้คนใช้เวลาอยู่บนนั้นนานๆ

“เช่นเดียวกัน Amazon งานหลักเขาคือขายของ คนกดดูสินค้าเทียบอันนี้กับอันนั้น ทำยังไงที่เรา (นักวิทยาศาสตร์ข้อมูล) จะเอาข้อมูลเหล่านี้มาช่วยเขาขายของได้ดีขึ้น อันนี้ก็เป็นพาร์ตที่คนพูดถึงกันเยอะ เพราะ machine-learning เริ่มเข้ามามีบทบาทและเรียนรู้จากพฤติกรรมการใช้งานในอดีตของผู้ใช้งาน เราก็จะวิเคราะห์และจัดประเภทออกมาว่าคนนี้อยู่ในกลุ่มผู้ใช้งานประเภทนี้ ควรจะขายของอะไร

“แต่ตอนนี้คำว่า Data Scientist มันถูกใช้กันมากเกินไป สตาร์ทอัพบางแห่งที่ยังไม่มีโครงสร้างพื้นฐานด้านข้อมูล Data Scientist ก็อาจจะต้องทำงานด้านวิศวกรรมข้อมูลด้วย”

via GIPHY

นักวิทยาศาสตร์ข้อมูลไม่ได้ทำงานอยู่ในห้องทดลอง แต่จะเข้าไปอยู่ในทุกๆ บริษัท

มาถึงบรรทัดนี้ หลายๆ คนน่าจะหายข้องใจแล้วว่านักวิทยาศาสตร์ข้อมูลทำงานอยู่ในห้องแล็บ หรือทำงานเฉพาะทางมากๆ ในอุตสาหกรรมวิทยาศาสตร์เท่านั้นหรือไม่ แต่ที่น่าสนใจกว่านั้นอาชีพนี้จะมีบทบาทสำคัญต่อทุกอุตสาหกรรมธุรกิจในอนาคต

“อาชีพ Data Scientist มันต่อยอดได้กับทุกธุรกิจเลยครับ เช่น ธุรกิจสื่อออนไลน์ในอเมริกา เขาต้องคิดว่าจะนำเสนอข่าวยังไงให้น่าสนใจ เช่น ทำ A/B testing ทดสอบการพาดหัวข่าว และค้นหาความสัมพันธ์ว่าคนอ่านของเราสนใจเรื่องเกี่ยวกับอะไรบ้าง แต่จริงๆ ผมว่าคนไทยส่วนใหญ่ค่อนข้างหลงทางเวลาพูดถึงวิทยาศาสตร์ข้อมูล คนจะโฟกัสเรื่องเครื่องมือ (tools) กันเยอะ หรือระบบการเรียนรู้ของเครื่อง (machine-learning) ที่คาดการณ์สิ่งต่างๆ ได้ หลายองค์กรควรจะเริ่มจากเอาข้อมูลขั้นพื้นฐานที่มีมาประกอบการตัดสินใจในองค์กร ทำยังไงจึงจะเอาข้อมูลมาใช้งานได้มากขึ้น เพราะยังมีหลายอาชีพที่ยังไม่ได้เอาข้อมูลมาใช้ ทุกองค์กรได้ยินเรื่องนี้ แต่ยังไม่มีการทำระบบดีๆ ที่พนักงานสามารถเข้าถึงข้อมูลและเอามาใช้ได้ง่ายๆ”

เมื่อเครื่องจักรเริ่มทำงานแทนคน แล้วนักวิทยาศาสตร์ข้อมูลจะยืนอยู่ตรงไหน?

ในฐานะคนที่ต้องทำงานอยู่กับข้อมูลมหาศาล คอมพิวเตอร์ และอุปกรณ์ไอทีต่างๆ ทุกวัน ถ้าหากเครื่องจักรและหุ่นยนต์พัฒนาความฉลาดจนสามารถทำงานได้ดีกว่ามนุษย์ แล้วนักวิทยาศาสตร์ข้อมูลจะตกงานไหม

เรื่องนี้ ต้าตอบว่าอาชีพนี้ยังจำเป็นอยู่ โดยเฉพาะกับภาคธุรกิจ

“สิ่งสำคัญที่สุดคือการนำข้อมูลมาใช้ประโยชน์ในทางธุรกิจ เพราะฉะนั้นมันยังต้องอาศัยอะไรที่มันเป็นความคิดสร้างสรรค์ว่า เราจะเอาท่าไหนมาเล่น สุดท้ายมันต้องกลับมาที่เรื่องการออกแบบผลิตภัณฑ์อีกครั้ง นักวิทยาศาสตร์ข้อมูลไม่ได้เป็นคนทำสินค้า มันเหมือนกับเราเอาข้อมูลจากคนอื่น ถ้าต้นทางข้อมูลมันมาไม่ถึง ก็ทำงานยาก ถ้ายกตัวอย่างให้ชัดเจนอีกอันหนึ่งคือ เวลาคนคอมเมนต์เฟซบุ๊ก ถ้าเป็นสาย machine-learning เขาจะคาดเดากันว่าโพสต์นี้คนเห็นแล้วจะตลกหรือโกรธ ซึ่งพอจะทำได้ แต่ก็ทำยาก แต่พอเฟซบุ๊กออกแบบปุ่มรีแอ็กชันขึ้นมา โพสต์นี้คนกด haha เยอะ เราก็เห็นได้เลยว่ามันตลก ในมุมของคนใช้ เขาก็อยากแสดงอารมณ์ของตัวเองออกมาเหมือนกัน สุดท้ายผมมองว่ามันเป็นเฟืองอันหนึ่งที่ต้องทำควบคู่กันไปกับการออกแบบผลิตภัณฑ์และธุรกิจ”

Data Visualization โอกาสที่ซ่อนอยู่ในภาพข้อมูล

นอกเหนือจากการคิดคำนวณ วิเคราะห์ข้อมูล และสร้างโมเดลเพื่อนำไปต่อยอดทางธุรกิจ อีกสาขาวิชาย่อยในศาสตร์ว่าด้วยข้อมูลก็คือ Data Visualization ที่กำลังได้รับความนิยมไม่แพ้กัน

เรียกได้ว่าคนที่มีความรู้ทางด้านนี้โดยตรงค่อนข้างจับตัวได้ยากในไทย เราจึงขอให้ โจ้-ภูริพันธุ์ รุจิขจร ซึ่งจบการศึกษาระดับปริญญาเอกจากมหาวิทยาลัยสโตนีบรุก (Stony Brook) ด้าน Visualization (ทุน International Fulbright Science and Technology Award) และเคยฝึกงานกับบริษัทไอบีเอ็ม ก่อนจะมาเป็นอาจารย์สอนวิชานี้ที่จุฬาลงกรณ์มหาวิทยาลัย ช่วยแนะนำความรู้เบื้องต้นสำหรับคนที่สนใจทำงานสายนี้กันบ้าง

โจ้เริ่มจากอธิบายให้เราเข้าใจก่อนว่า ตามปกติแล้วนักวิทยาศาสตร์ข้อมูลจะเอาข้อมูลมาวิเคราะห์ตามโจทย์ และพยายามหาสิ่งที่น่าสนใจในข้อมูลนั้นๆ โดยที่ผลลัพธ์อาจจะเป็นตัวเลข ข้อความ หรือแม้แต่ภาพ ซึ่ง Data Visualization ก็เป็นอีกสาขาวิชาหนึ่งที่นำข้อมูลจากการวิเคราะห์มาเสนอเป็นภาพนั่นเอง

“เพราะข้อมูลบางอย่างมันแสดงด้วยข้อความหรือตัวเลขเท่านั้นไม่ได้ ข้อมูลบางชุด เวลาที่เราย่อยออกมาเป็นตัวเลขแล้ว ผลลัพธ์มันจะคล้ายๆ กันไปหมด เช่น การหาค่าเฉลี่ย ข้อมูลมันอาจจะใกล้กันมากจนกลายเป็นก้อนเดียว เราก็ต้องดูข้อมูลโดยแสดงผลออกมาเป็นภาพ ซึ่งจริงๆ แล้ว คนเราสามารถแยกแยะสิ่งของด้วยการมองเห็นได้ดีกว่าประสาทสัมผัสอื่นๆ

“คนทำงานด้าน Data Visualization ก็จะมีทักษะคล้ายกับนักวิทยาศาสตร์ข้อมูล เพียงแต่อาจจะต้องทำงานเกี่ยวกับเว็บได้ดี สามารถใช้เครื่องมือทั่วไปเกี่ยวกับการเขียนโปรแกรมประเภท HTML หรือ JavaScript ได้ ต่างกันตรงที่อาจจะต้องมีเรื่องความสวยงามเข้ามาเกี่ยวข้อง ถ้าไม่ได้ทำงานร่วมกับดีไซเนอร์ ก็จะต้องมีเซนส์ด้านการออกแบบนิดหนึ่ง

“ที่ผ่านมา งานวิชวลไลเซชันที่เคยทำของ Boonmee Lab ก็จะมีเรื่องชุดข้อมูลอุบัติเหตุในประเทศไทยในช่วงปีใหม่ โดยแสดงผลข้อมูลทั้งตำแหน่งสถานที่ ลักษณะของอุบัติเหตุว่าเกิดขึ้นอย่างไร ผู้ชาย ผู้หญิง รถยนต์ รถจักรยานยนต์ สวมหมวกกันน็อกหรือไม่ คาดเข็มขัดนิรภัยหรือไม่ เราก็เอามาดูกัน ซึ่งจริงๆ ก็จะเห็นว่ามีอุบัติเหตุเกิดขึ้นเยอะมาก ตอนแรกเราไม่รู้ว่ามาแสดงผลแล้วจะเกิดอะไรขึ้น แต่พอทำเสร็จปุ๊บ เราก็จะเห็นคำถามหลายอย่างว่า จริงๆ แล้วคนที่ประสบอุบัติเหตุส่วนใหญ่ไม่ได้ดื่มเหล้า เป็นต้น ซึ่งก็เป็นคำถามที่น่าสนใจ เพราะเรารณรงค์เกี่ยวกับการเลิกดื่มเหล้าไปเยอะ แต่จริงๆ แล้วมันไม่ใช่ต้นเหตุของปัญหาหรือเปล่า

“กระบวนการทำงานส่วนใหญ่มันจะเป็นงานสั้นๆ เริ่มทำกันเองภายในบริษัท มีข้อมูลมา แล้วคิดกันว่าควรจะแสดงผลแบบไหน แต่งานนี้ทำร่วมกับโปรแกรมเมอร์นอกอีกคนหนึ่ง ก็เขียนโปรแกรมขึ้นมาเร็วๆ แล้วแสดงผลเลย ถ้าเป็นงานที่มีลูกค้าจริงๆ ก็จะมีงานที่ทำร่วมกับ ThaiPublica แสดงผลเกี่ยวกับข้อมูลล็อตเตอรี่ในประเทศไทย ทำเหมือนเป็น data journalism ใช้ข้อมูลมาช่วยในการประกอบข่าวเนื้อหา”

ภาพแสดงข้อมูลเชิงสถิติของอุบัติเหตุที่เกิดขึ้นในช่วงปีใหม่ ประเทศไทย โดย Boonmee Lab

โปรเจกต์ Mayor’s Dashboard เมืองบอสตัน

ทำความเข้าใจใหม่ Data Visualization ไม่ใช่ภาพอินโฟกราฟิก

การจัดการข้อมูลให้เป็นภาพไม่ใช่เรื่องใหม่ ปัจจุบันมีการจัดทำ Data Visualization ขึ้น เพื่อประโยชน์ทางการจัดเก็บวิเคราะห์ข้อมูลทางธุรกิจ การแพทย์ การจัดการภัยพิบัติ หรือแม้แต่การแก้ปัญหาเมืองใหญ่อย่างบอสตัน ที่ขับเคลื่อนเมืองด้วยข้อมูลอย่างชาญฉลาด โดยนายกเทศมนตรีและคณะจะคอยตรวจดูสถานการณ์ต่างๆ ทุกวัน ผ่านแดชบอร์ดที่แสดงข้อมูลเชิงสถิติเกี่ยวกับเมืองทั้งหมดแบบอินเตอร์แอ็กทีฟ เช่น ข้อมูลประชากร ความปลอดภัยทางสาธารณะ การควบคุมไฟจราจร การจัดเก็บขยะ หรือแม้แต่รายงานจำนวนภาพกราฟฟิตี้ที่ถูกแจ้งลบ

ทางฝั่งสำนักข่าวระดับโลกนั้นตื่นตัวกับเรื่องนี้เช่นกัน อาทิ นิวยอร์กไทม์ส ได้เปิดแผนก R&D สำหรับค้นคว้าวิจัยและทำงานด้าน Data Visualization ในประเด็นข่าวต่างๆ โดยเฉพาะ ขณะที่ ยูเอสเอ ทูเดย์ ได้นำข้อมูลเชิงสถิติมาออกแบบเป็นแอนิเมชันและอินเตอร์แอ็กทีฟประกอบการนำเสนอข่าวอยู่บ่อยครั้ง

via GIPHY

สำนักข่าว ยูเอสเอ ทูเดย์ ได้ออกแบบระบบอินเตอร์แอ็กทีฟ
เพื่อนำเสนอข้อมูลเชิงสถิติเกี่ยวกับผู้ตกเป็นเหยื่อจากการสังหารหมู่ให้เข้าใจง่ายและเห็นภาพชัดขึ้น
ด้วย Data Visualization โดยแบ่งตามกลุ่มอายุ และอาวุธ/วิธีการสังหาร

แต่โจ้บอกกับเราว่าสิ่งที่คนทั่วไปเข้าใจผิดมากที่สุดเกี่ยวกับ Data Visualization ก็คืออินโฟกราฟิก

“จริงๆ คืออินโฟกราฟิกเหมือนเป็นส่วนหนึ่งของวิชวลไลเซชันครับ อินโฟกราฟิกเป็นภาพนิ่งซึ่งแสดงข้อมูลออกมา เหมือนกับเอาข้อความมาจัดให้สวยงาม มีภาพประกอบ ดูน่าอ่าน แต่ถ้าเป็นวิชวลไลเซชัน ภาพประกอบนั้นควรจะมีข้อมูลอยู่ข้างใน มันไม่ใช่แค่ทำภาพสวยๆ แต่เราอาจจะทำให้คนเห็นข้อมูลชัดเจนขึ้น

“อย่างที่สอง บางทีเราเอาข้อมูลมาพล็อตเป็นภาพ เราไม่ได้มีเป้าหมายชัดเจน ว่าพล็อตแล้วจะเห็นอะไรเสมอไป แต่เราพล็อตเพื่อเผื่อว่าจะมีใครเห็นอะไรบางอย่างในข้อมูล มันมีทั้งเป้าหมายปลายปิดและปลายเปิด

“สำหรับคนที่สนใจ ในไทยมันไม่ได้มีช่องทางง่ายๆ และงานด้านนี้ก็ต้องใช้ความรู้หลายอย่างประกอบกัน ง่ายๆ ก็คือต้องอ่านหนังสือเยอะๆ และอาจต้องลองหัดเขียนโปรแกรมง่ายๆ ผมว่าอันนี้ช่วยได้ อย่างน้อยเราจะได้รู้ว่าทำอะไรได้ ทำอะไรไม่ได้ ดีไซเนอร์ก็เหมือนกับสถาปนิก เราจะต้องรู้วิธีการก่อสร้างเล็กๆ น้อยๆ ว่าทำอย่างนี้ได้ ทำแบบนี้ไม่ได้ เราจะได้ออกแบบได้ถูก”

Data Science กับอนาคตในตลาดไทย

มาถึงคำถามสุดท้ายที่ว่า ถ้าเรียนจบด้านนี้มาแล้วจะมีงานรองรับในเมืองไทยบ้างไหม แล้วจะเกิดอะไรขึ้นกับธุรกิจที่มองข้ามความสำคัญของการจัดการข้อมูลไป

ต้า วิโรจน์ ตอบว่า “แพ้แน่นอน”

“ถ้าบอกว่ามีคู่แข่งในอุตสาหกรรมเริ่มใช้ข้อมูล แล้วเราไม่ใช้ ก็คือแพ้แน่นอนครับ เพราะเขาเข้าใจว่าผู้ใช้งานต้องการอะไรมากกว่าเรา เขาเห็นว่าผู้ใช้งานทำอะไร เขาสามารถต่อยอดผลิตภัณฑ์ กำหนดทิศทางธุรกิจด้วยข้อมูลมากขึ้น

“นักวิทยาศาสตร์ข้อมูลไม่ได้นั่งเทียนเอาว่ายูสเซอร์ต้องชอบอันนี้นะ หรือแค่ไปถามมา 3-4 คน ก็ assume เอาว่าทุกคนจะชอบสินค้านั้น เราสามารถทดสอบได้ ลองได้ ดูจากข้อมูลว่าเขาใช้จริง ไม่จริง คนที่ใช้ข้อมูลก็จะได้ประโยชน์ด้านนี้”

ทางด้าน โจ้ ภูริพันธุ์ มองว่าประเด็นนี้อาจจะไม่ก่อให้เกิดผลกระทบที่ชัดเจนโดยตรง แต่จะสูญเสียโอกาสทางธุรกิจมากกว่า

“ในไทยยังไม่มีหลักสูตรเกี่ยวกับวิชานี้หรือตั้งคณะสำหรับด้านนี้โดยตรง อาจจะด้วยปัญหาเชิงโครงสร้างของมหาวิทยาลัย แต่คนเริ่มตระหนักถึงความสำคัญกันมากขึ้น หลายๆ บริษัทก็พยายามจะจัดการข้อมูลภายในองค์กร

“ในระยะยาว เราอาจจะสูญเสียความสามารถทางการแข่งขัน ซึ่งก็เป็นเรื่องที่น่าสนใจ เพราะทุกวันนี้เรามีบริษัทต่างชาติเข้ามาเยอะ ไม่ว่าธุรกิจกลุ่มไหน ก็มีธุรกิจต่างชาติเข้ามาทั้งนั้น แล้วเขาค่อนข้างตื่นตัวเรื่องการใช้ข้อมูล

“แล้วถ้าเราไม่ทำ เราอาจจะสู้เขาไม่ได้”

ภาพประกอบ: Nisakorn Rittapai​​

อ้างอิง:

Tags: , , , , ,