เกมเมอร์ทั้งหลายที่กำลังเมามันกับกลศึกใน สตาร์คราฟต์ ภาค 2 (StarCraft II) โปรดรู้ไว้ เพื่อนร่วมทีมหรือศัตรูของคุณในเกมที่เล่นอยู่ขณะนี้อาจเป็น AI แฝงตัวมาลับคมปัญญาของมัน เราไม่ได้พูดเล่น นี่เป็นการเปิดเผยอย่างโจ่งแจ้งจากดีปมายด์ (DeepMind) ของกูเกิล และบลิซซาร์ด เอ็นเตอร์เทนเมนต์ (Blizzard Entertainment) บริษัทผู้สร้างเกมสตาร์คราฟต์

นักวิจัยในโครงการพัฒนา AI ของดีปมายด์ประกาศตั้งแต่ปลายปีก่อนว่าเลือกวิจัยเกม สตาร์คราฟต์ ภาค 2 เพื่อต่อยอดความฉลาดของ AI แต่ยังไม่ได้เปิดเผยกลวิธีในรายละเอียด และพา AlphaGo ผลงานชิ้นเอกของตน สร้างความฮือฮาไปทั่วโลก ด้วยการเอาชนะเคอ เจี๋ย (Ke Jie) ปรมาจารย์โกะชาวจีนไปได้เมื่อพฤษภาคมที่ผ่านมา

ทั้งดีปมายด์และบลิซซาร์ดเพิ่งเปิดตัวซอฟต์แวร์ตัวช่วย (tools) ที่จะเปิดทางให้นักวิจัยปัญญาประดิษฐ์ทั้งหลายใช้สร้างบอต (bots) เพื่อมาสู้ในมหาสงครามกู้จักรวาลของ สตาร์คราฟต์ กับเหล่ามวลมนุษยชาติ (ในเกม) โดยบอตพวกนี้จะคอยดูว่าคนเล่นเกมกันอย่างไร แล้วลอกเลียนแบบตามเก็บสะสมไว้เป็นประสบการณ์ เพื่อจะเอาชนะผู้เล่นมนุษย์ในท้ายที่สุด!

ซอฟต์แวร์ตัวช่วยดังกล่าว ในฝั่งของดีปมายด์เป็น machine learning API และ open source code ส่วนบลิซซาร์ดเป็น StarCraft II API บนลินุกซ์ที่ทำงานบนคลาวด์ โดยทั้งหมดทำงานได้ทั้งบน Windows และ macOS

เท่านั้นยังไม่พอ ดีปมายด์กับบลิซซาร์ดยังจะเปิดกรุข้อมูล (cache) ของการเล่นเกม สตาร์คราฟต์ ภาค 2 กว่า 65,000 เกมที่เป็นสุดยอด เพื่อเป็นอาหารสมองแก่บอตพวกนี้ และบอกว่าจะมีอีกกว่าครึ่งล้านเกมปล่อยออกมาให้ทุกเดือน บอตจะได้ใช้ซอฟต์แวร์ machine-learning ตามเทคนิคของดีปมายด์เอาชนะมนุษย์ได้ในท้ายที่สุด แม้จะไม่ใช่ในเร็วๆ นี้

อย่าเพิ่งมองดีปมายด์ในแง่ร้าย สำหรับคนที่ยังไม่วางใจ AI กูเกิลไม่ใช่ยักษ์ใหญ่เจ้าเดียวที่เอาจริงกับการพัฒนาบอตพวกนี้ด้วยเกม สตาร์คราฟต์ ล่าสุด เมื่อวันที่ 7 สิงหาคมที่ผ่านมา เฟซบุ๊กปล่อยข้อมูลการเล่น สตาร์คราฟต์ ฉบับดั้งเดิม 65,000 เกม (คนเล่นกับคน) ที่อยู่ในคลังของตนให้ทีมวิจัยใช้พัฒนาบอตแล้ว

นักวิจัยสติเฟื่องของดีปมายด์อย่างเดวิด เชอร์ชิล (David Churchill) ถึงขั้นเตรียมจัดการแข่งขัน AIIDE Starcraft AI Competition แถมบอกด้วยว่า ในสายตาของนักวิทยาศาสตร์อย่างเขา สนามรบใน สตาร์คราฟต์ เหมาะอย่างยิ่งที่จะเป็นสนามจำลองที่ใกล้เคียงการต่อสู้จริงให้ AI ได้เรียนรู้ และย้ำว่า “มันจะเป็นเวทีที่ใช้ทดลองเทคโนโลยีก่อนนำมาใช้กับชีวิตจริง“

จริงๆ แล้วนักวิจัยแอบสร้างบอตสำหรับเกม สตาร์คราฟต์ ฉบับดั้งเดิมมานานแล้ว โดยใช้ซอฟต์แวร์ปลั๊กอินแบบโอเพนซอร์ซที่ไม่เป็นทางการ (โค้ดเถื่อน) เดวิดบอกว่าบอตพวกนั้นยังอยู่ระดับ ชิลชิล เล่นไม่ค่อยเก่งหรอก ยังเหมือนพวกผู้เล่นระดับกลางๆ ต้องพึ่งพากลยุทธ์ที่กำหนดและเขียนโดยโปรแกรมเมอร์คนออกแบบ ไม่มีอิสระ ไม่ใช่ปัญญาประดิษฐ์ที่เรียนรู้ด้วยตัวเอง (machine learning) ด้วยซ้ำ เป็นเหมือนอวตารของโปรแกรมเมอร์เข้าไปอยู่ในเกมมากกว่า คนเขียนเป็นอย่างไร บอตก็เป็นอย่างนั้น — บอกว่า ‘โง่’ ไปเลย ง่ายกว่าไหมครับ

การเอาชนะสงครามใน สตาร์คราฟต์ เป็นเป้าหมายที่กูเกิลกับเฟซบุ๊กกำลังพยายามทำให้ได้ เพื่อเอาชนะข้อจำกัดของปัญญาประดิษฐ์ที่เป็นอยู่ในตอนนี้ สตาร์คราฟต์ เป็นเกมเชิงกลยุทธ์ที่ผู้เล่นต้องบัญชาการกองทัพเอเลียนในสงครามบนทางช้างเผือก สำหรับมนุษย์ มันเป็นเกมที่ดูแล้วไม่น่าจะยากไปกว่าหมากล้อมหรือหมากรุก แต่กลับเป็นเกมที่ท้าทายอย่างยิ่งสำหรับ AI

ในหมากล้อมและหมากรุก เราจะเห็นภาพรวมของการเดินหมากของฝ่ายตรงข้ามและสถานการณ์ทั้งหมด ทำให้เรียกได้ว่าเป็นเกมประเภทมีข้อมูลสมบูรณ์ (perfect information games) แต่ สตาร์คราฟต์ เป็นเกมที่ผู้เล่นแต่ละคนจะไม่ได้เห็นข้อมูลทั้งหมดของคู่ต่อสู้เหมือนกับหมากล้อมและหมากรุก ถือว่าเป็นเกมแบบมีข้อมูลไม่สมบูรณ์ (imperfect information games) เราไม่สามารถมองเห็นกองทหารและการก่อสร้างของฝ่ายตรงข้ามได้ทั้งหมด ซึ่งผลักดันให้เราต้องใช้เพียงข้อมูลที่มองเห็นร่วมกับการคิดคำนวณของเราเอง (mental model) แล้วคาดการณ์ว่าฝ่ายตรงข้ามจะวางแผนอย่างไร

สำหรับการเล่น สตาร์คราฟต์ แม้บอตจะมีความสามารถในการเรียนรู้มากกว่ามนุษย์อย่างมหาศาล แต่ก็ต้องพบกับทางเลือกที่น่าจะเป็นไปได้มากมายเหลือเกิน ถ้าในกระดานหมากล้อมมีทางเดินให้เลือกที่ความน่าจะเป็นซึ่งมีเลข 1 ตามด้วยเลข 0 ต่อท้าย 170 ตัว นักวิจัยบอกว่าความน่าจะเป็นของทางเลือกใน สตาร์คราฟต์ ต้องเติม 0 เพิ่มจากความน่าจะเป็นในเกมหมากล้อมอีกไม่ต่ำกว่า 100 ตัว เพื่อให้ครอบคลุมทางเลือกที่เป็นไปได้ในสนามของเกม สตาร์คราฟต์ ซึ่งมีมนุษย์เป็นผู้เล่น

โอริล วินยาลส์ (Oriol Vinyals) นักวิจัยของดีปมายด์อีกคน บอกว่าการเล่น สตาร์คราฟต์ ของบอตนั้นเป็นก้าวกระโดดที่สำคัญมากๆ มันทำให้เขาต้องปวดหัวกับการสร้างสรรค์นวัตกรรมให้ AI วางแผน จดจำข้อมูล และหาทางจัดการกับความไม่แน่นอนอันเป็นธรรมชาติของมนุษย์

การที่บอตจะเอาชนะเกม สตาร์คราฟต์ ผู้สร้างบอตจะต้องคิดค้นนวัตกรรมล้ำๆ อีกมากมาย เพียงแค่การใช้ตรรกะของการเรียนรู้ของจักรกล (machine-learning algorithms) ของดีปมายด์ที่บอกให้บอตเลียนแบบมนุษย์อย่างเดียวนั้นยังไม่เพียงพอ แต่จะต้องทำให้บอตคิดรูปแบบการเดินของตัวมันเองขึ้นมาให้ได้ เพื่อสร้างจุดแข็งของตัวมันเอง มาร์ติน รูอิแจกเกอร์ส (Martin Rooijackers) ผู้สร้าง LetaBot หนึ่งในบอตที่เล่น สตาร์คราฟต์ กล่าวว่าวิธีการที่บอตเล่น สตาร์คราฟต์ ย่อมแตกต่างไปจากวิธีการของผู้เล่นที่เป็นมนุษย์ ดังเช่นที่พี่น้องตระกูลไรต์ทำให้จักรกลบินได้ ก็ไม่ได้เป็นการลอกเลียนแบบการบินของนก

เดวิด เชอร์ชิล ย้ำว่าคงอีกสักห้าปีกระมัง กว่าที่บอตจะเอาชนะมนุษย์ในเกม สตาร์คราฟต์ ได้ แต่อย่าลืมว่าคำทำนายแบบนี้ก็เคยมีคนพูดมาแล้วเมื่อตอนที่เริ่มสร้าง AlphaGo เมื่อปี 2558 แต่ผ่านไปเพียงแค่ปีกว่าๆ มันก็เอาชนะเซียนหมากล้อมที่เป็นมนุษย์ได้อย่างราบคาบ
ดังนั้นจึงอย่าเพิ่งเชื่อ บยอน ฮยอน อู (Byun Hyun Woo) มือโปรของเกม สตาร์คราฟต์ ที่คุยโวว่า AI ไม่มีทางเอาชนะเกมเมอร์มนุษย์ได้ อย่างน้อยก็ในชั่วชีวิตของเขา

อ้างอิง:
https://www.wired.com/story/googles-ai-declares-galactic-war-on-starcraft-/
Blizzard and DeepMind turn StarCraft II into an AI research lab
https://www.theverge.com/2017/8/9/16117850/deepmind-blizzard-starcraft-ai-toolset-api

Tags: , , , , , , ,