หลังจากการอบรมในวันแรก ที่ ‘สฤณี อาชวานันทกุล’ นักวิจัยจากบริษัท ป่าสาละ จำกัด ฉายภาพให้เห็นถึงตัวอย่างงานสื่อชิ้นต่างๆ ที่ชี้ว่า Data’ เป็นเครื่องมือขับเคลื่อนสังคมได้ผ่านการนำเสนอข้อเท็จจริงด้วยข้อมูลข้อเท็จจริงที่ผ่านการวิเคราะห์และสร้างคุณค่าสู่สาธารณะ 

การบรรยายครั้งที่สองซึ่งจัดต่อเนื่องกันในวันที่ 23 กุมภาพันธ์ มีเนื้อหาที่พาผู้เข้าร่วมไปทำความรู้จัก ‘ข้อมูล’ ประเภทต่างๆ ทำข้อมูลเชิงตัวเลข และข้อมูลเชิงแผนที่ 

มิติของข้อมูลกับความอคติที่ต้องพึ่งระวัง 

การบรรยายช่วงเช้าของ ‘ผศ.จิตรทัศน์ ฝักเจริญผล’ จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ เริ่มต้นอย่างกระชับกระเฉง ด้วยการแจก ‘สายวัด’ ให้ทุกคนแบ่งทีมกันเก็บข้อมูล ทั้งขนาดฝ่าเท้า ขนาดข้อมือ ขนาดรอบศรีษะ ส่วนสูง และอาชีพ แล้วลองบันทึกข้อมูลเหล่านั้นใส่ตาราง พร้อมลองวาดเป็นกราฟขึ้นมา 

ผศ.จิตร์ทัศน์ โยนเพียงโจทย์กว้างๆ ส่วนเรื่องที่ว่า ใครจะเลือกบันทึกค่าเป็นหน่วยเมตริก หรือแบบอเมริกัน-อังกฤษ และจะตั้งค่าแกน x-y ในตารางแบบไหน ก็แล้วแต่การตัดสินใจของแต่ละทีม

“เวลามีข้อมูลมา ถ้าเราเก็บเองก็อาจจะโอเค แต่ถ้าเราไปเอาของคนอื่นมา ต้องวิเคราะห์คุณภาพข้อมูลที่เราจะนำมาใช้ คือ ดูความทันสมัย ดูว่าเกี่ยวข้องกับที่เราต้องการไหม ดูว่าคนเก็บเป็นใคร น่าเชื่อถือหรือเปล่า มีความแม่นยำไหม และสุดท้ายที่สำคัญมากคือ เก็บข้อมูลมาทำไม” ผศ.จิตร์ทัศน์กล่าว

ผศ.จิตร์ทัศน์กล่าวว่า ข้อมูลก็มีอคติได้ บางหน่วยงานเก็บข้อมูลมาเพื่อยืนยันว่าทำงานสำเร็จ ก็จะเลือกเก็บแต่ประเด็นที่สำเร็จอย่างเดียว แบบนี้ก็ถือว่ามีอคติในข้อมูลนั้นอยู่ 

“การที่เราไปค้นหาแต่ข้อมูลที่เราต้องการนำเสนอมา มันก็ยิ่งเพิ่มอคติให้กับข้อมูลไปอีก” 

จิตรทัศน์เตือนถึงการใช้ข้อมูล ที่หลายคนมักใช้ผิดพลาด เช่น การหาข้อมูลที่เป็นค่าเฉลี่ย ถือเป็นเรื่องที่ควรต้องระวังอย่างมาก แม้จะถูกต้องทางตัวเลข แต่อาจจะไม่ตรงกับที่เราต้องการได้ (ตัวอย่างเช่น หากจะบอกรายได้เฉลี่ยของคนทั้งประเทศ ข้อมูลค่าเฉลี่ยจะไม่ค่อยสะท้อนข้อมูลอะไร หากเป็นสังคมที่มีช่องว่างระหว่างคนรวยกับคนจนสูง) 

ด้วยเหตุนี้ การเลือกว่าจะอธิบายข้อมูลด้วยวิธีนำเสนอต่างๆ ก็จะให้ความหมายที่ต่างกัน เช่น กราฟเส้นช่วยบอกแนวโน้มของข้อมูล บางกรณี หากนำข้อมูลด้วยแผนภูมิแท่ง จะช่วยให้เราเห็นกลุ่มก้อนของข้อมูล และเห็นลักษณะการกระจายของข้อมูลด้วย

จากนั้น ผศ.จิตรทัศน์ก็ให้ทุกคนลองฝึกสำรวจแหล่งข้อมูลต่างๆ ที่พอจะเข้าถึงได้ แล้วลองวิเคราะห์ว่า จะเห็นความสัมพันธ์ของอะไร และนำไปตอบคำถามอะไรได้บ้าง โดยเน้นหาข้อมูลให้ได้เยอะที่สุด เพื่อสำรวจให้เราเห็นภาพรวมในมุมกว้าง ซึ่งเป็นกิจกรรมหนึ่งที่ช่วยให้แต่ละกลุ่มวางแผนได้ชัดเจนว่า ประเด็นที่เลือกมานั้นมีข้อมูลเพียงพอหรือไม่ ต้องเพิ่มเติมข้อมูลจากแหล่งไหนให้ประเด็นแหลมคมขึ้น หรือต้องเปลี่ยนเป็นประเด็นอื่นไปเลย

ข้อมูลทางภูมิศาสตร์ อีกวิธีการมองและวิเคราะห์ข้อมูล

“โลกในความเป็นจริงเราสามารถสกัดหลายอย่างมาใช้เป็นข้อมูลได้” 

กิจกรรมในช่วงบ่าย ‘พรรณิสา นิรัตติวงศกรณ์’ จาก สภาพัฒนาการเศรษฐกิจและสังคมแห่งชาติ พาทุกคนไปทำความรู้จัก ‘การใช้ข้อมูลที่อิงกับพิกัดแผนที่ทางภูมิศาสตร์ (Spatial Data)’ ด้วยการให้คำจำกัดความง่ายๆ ว่า มันคือข้อมูลทั่วไปที่มี ‘ละติจูด’ และ ‘ลองจิจูด’ เพิ่มขึ้นมา 

พรรณิสากล่าวว่า ทุกอย่างบนโลกนี้เราสามารถหยิบจับมาใช้เป็นข้อมูลเชิงพื้นที่ได้เกือบทั้งหมด ไม่ว่าจะเป็นข้อมูลเชิงกายภาพอย่างเช่น ด่านตรวจ, ตำแหน่งกล้อง CCTV, ถนน, ร้านอาหาร, สัมมะโนประชากร, นโยบาย หรือข้อมูลเชิงนามธรรมอย่างความเสี่ยงที่จะเกิดน้ำท่วม หรือแผนอพยพ ก็สามารถนำมาใช้ในแง่ข้อมูลเชิงพื้นที่ได้เช่นกัน พร้อมยกตัวอย่างการใช้ข้อมูลเชิงพื้นที่สำหรับเล่าเรื่องในรูปแบบต่างๆ 

ตัวอย่างที่น่าสนใจมาก คือเว็บไซต์ ‘Walkscore’ ที่เปิดโอกาสให้ประชาชนกรอกคะแนนว่าบริเวณย่านที่ตัวเองอาศัยอยู่มีอาชญากรรม ต้นไม้ และร้านค้าหรือเปล่า เพื่อช่วยในประกอบการตัดสินใจแก่ผู้ที่จะมาเช่าหรือซื้อบ้านบริเวณนั้น

นอกจากนี้ พรรณิสายังแนะนำเว็บไซต์ Kepler ที่รวบรวมฐานข้อมูลไว้มากมายทั่วโลก และเป็นเว็บไซต์ที่ Uber ใช้ในการทำงานด้วย ที่สำคัญคือ ไม่จำเป็นต้องเป็นผู้เชี่ยวชาญด้านภูมิศาสตร์ก็สามารถใช้งานได้สะดวก 

แปลงข้อมูลให้เป็นรูปเป็นร่าง 

พรรณิสาเปรียบกระบวนการใช้ข้อมูลเชิงพื้นที่เสมือนบ้านหลังหนึ่ง การเตรียมข้อมูลเป็นฐานของบ้าน และ ส่วนของการวิเคราะห์ข้อมูลก็เป็นเหมือนกำแพงสองฝั่งที่ต้องรู้ทั้งเรื่องภูมิศาสตร์กับสถิติควบคู่กันไป สำคัญที่สุดคือการเล่าเรื่อง ว่าเราจะนำเสนอข้อมูลของเราให้น่าสนใจได้อย่างไร ซึ่งเปรียบเหมือนหลังคาบ้าน 

แต่พรรณิสาย้ำว่า 80% ของข้อมูลมักอยู่ในรูปแบบที่เราไม่สามารถนำมาใช้งานได้เลย ซึ่งถือเป็นเรื่อง ‘ปกติ’ ในการทำงาน 

สำหรับการนำเสนอข้อมูลด้วยการใช้แผนที่นั้น พรรณิสาอธิบายว่า งานส่วนใหญ่ที่เห็นกัน มักจะแสดงข้อมูลโดยใช้สองตัวแปร โดยอาจเป็นสี ขนาด หรือจุด ขณะที่งานบางชิ้นก็ซับซ้อนขึ้นมา เช่น แผนที่ ‘Life in Los Angeles’ ในภาพเดียวแสดงข้อมูลถึง 4 ชุดด้วยกัน คือรายได้ อัตราการว่างงาน ความปลอดภัยในเมือง รวมถึงจำนวนของคนขาวและคนดำ โดยใช้ภาพการ์ตูนหน้าคนแสดงข้อมูลแต่ละชุด เช่น ถ้าอัตราการว่างงานเยอะเป็นหน้าคนสูบผอม ถ้ารายได้เยอะก็เป็นหน้ารูปยิ้ม ซึ่งแผนที่ชุดนี้แสดงให้เห็นว่า พื้นที่ไหนที่คนดำอยู่เยอะมักจะรายได้น้อย 

ทั้งนี้พรรณิสายังสอนให้ตั้งโจทย์และจับประเด็นให้ถูกทาง ด้วยการยกตัวอย่างการศึกษาในสหรัฐอเมริกาเรื่อง ‘การดื่มแอลกอฮอล์สามารถทําให้เกิดอุบัติเหตุบนท้องถนนจริงหรือไม่’ โดยเก็บข้อมููลจากปริมาณแอลกอฮอล์ที่บริโภคต่อคนต่อปี, ข้อมูลจํานวนผู้เสียชีวิตบนถนนต่อความยาวถนน (คน /100 ไมล์) และพื้นที่ห้ามขายแอลกอฮอล์ในแต่ละรัฐ โดยนำเสนอผลลัพธ์ด้วยการใช้แก้วเบียร์แสดงปริมาณการบริโภคแอลกอฮอลล์ต่อคนบนท้องถนน ควบคู่กับการบอกข้อมูลส่วนอื่น ด้วยการให้สีแทนค่า 

ผลของงานชิ้นนี้ที่พรรณิสาทำขึ้นมาด้วยตัวเองนั้น กลับให้ข้อค้นพบที่น่าแปลกใจ ปรากฏว่า พื้นที่ที่ไม่อนุญาตให้ขายแอลกอฮอลล์กลับมาคนประสบอุบัติเหตุจากเมาแล้วขับมากกว่า นั่นเป็นเพราะคนต้องเดินทางออกไปดื่มที่อื่น และเจออุบัติเหตุขณะเดินทางกลับ

ก่อนจะสิ้นสุดการบรรยาย ทุกคนได้ทดลองประมวลผลข้อมูล โดยใช้กรณีผู้ติดเชื้อโคโรนาไวรัสหรือ COVID-19 ทั่วโลกจาก github มาแสดงผลเป็น Data visualization ผ่านเว็บไซต์ kepler ซึ่งเป็นเครื่องมือฟรีที่ออกแบบมากให้เราสามารถเล่นสนุกกับข้อมูลได้เต็มที่ และเลือกได้ว่าต้องการให้แสดงผลออกมาในรูปแบบใด เพราะมีให้เลือกหลากหลายรูปแบบ ขึ้นอยู่กับว่าเราต้องการแสดงให้เห็นประเด็นใด 

วันที่สองของการอบรมจึงเป็นการแนะนำให้ผู้เข้าอบรมทุกคนที่อาจจะยังไม่เห็นภาพว่า ประเด็นที่ตัวเองเลือกนั้นต้องสานต่ออย่างไร รู้ว่าเดินไปเส้นทางไหนจึงจะได้ผลลัพธ์ที่ต้องการ เพื่อเตรียมพร้อมสู่การเรียนรู้ในวันถัดไป ที่จะต้องเรียนเรื่อง ‘สถิติ’ 

Fact Box

งานอบรม Data Journalism Workshop จัดขึ้นบนความร่วมมือของ The Momentum, คณะวารสารศาสตร์และสื่อสารมวลชน มหาวิทยาลัยธรรมศาสตร์, ป่าสาละ, สถาบันวิจัยเพื่อการพัฒนาประเทศไทย หรือ TDRI, พันช์อัป และดีแทค เพื่อพัฒนาทักษะการวิเคราะห์ข้อมูลและวิธีการเล่าเรื่องที่ทันสมัย โดยใช้นวัตกรรมใหม่ๆ มาส่งเสริมการทำเนื้อหาเชิงลึกของสื่อมวลชน

Tags: ,