Tekno / Tekno
Kamis, 28 Januari 2016 | 09:47 WIB
Ilustrasi permainan Go, sebuah permainan tradisional berusia ribuan tahun dari Cina (Shutterstock).

Mengalahkan Konfigurasi Atom

Sejak sistem Deep Blue ciptaan IBM mengalahkan grand master catur Gary Kasparov dalam laga bersejarah mereka pada 1997, para ilmuwan AI diam-diam terus mendesain robot yang bisa lebih cerdas dari manusia.

Pada 2014 lalu sistem Watson dari IBM berhasil mengalahkan Ken Jennings dalam permainan Jeopardy!. Pada 2015 kemarin sebuah komputer bernama Claudio berhasil menguras uang para penjudi kartu poker di sebuah kasino di Pittsburgh, Amerika Serikat.

Tetapi berbeda dari catur, Jeopardy!, atau poker, permainan Go adalah yang paling sukar dipelajari. Ini adalah permainan strategi yang diciptakan di Cina sekitar 2.500 tahun lalu. Permainan ini memiliki aturan sederhana, tetapi yang juga bisa membuat terlena.

Dalam permainan itu dua pemain menggunakan bidak-bidak berwarna putih dan hitam, mirip catur. Bedanya, dalam permainan ini tujuannya adalah untuk menguasai wilayah paling besar atau lebih dari 50 persen permukaan papan yang dibagi dalam kotak-kotak kecil.

Aturannya sederhana. Bidak-bidak putih, misalnya, harus terus saling berhubungan dalam sebuah garis agar tetap hidup. Jika terpisah atau berhasil dipisahkan oleh bidak hitam milik lawan, maka bidak itu mati.

Tetapi di balik aturan sederhana ini, terletak kerumitan luar biasa. Master dalam permainan ini bisa menghabiskan hidupnya untuk mempelajari rangkaian langkah, merancang strategi, mengembangkan kemampuan untuk menganalisis papan go, dan bisa mengetahui dengan cepat bidak mana yang masih hidup, mati, atau sudah "sekarat".

"Ini mungkin permainan yang paling rumit yang pernah diciptakan oleh manusia," kata Demis Hassabis, pakar ilmu komputer dari Google DeepMind.

Ia mengatakan bahwa Go memiliki konfigurasi yang lebih banyak ketimbang atom-atom dalam alam semesta.

Selanjutnya: Mesin Berinsting

Mesin Berinsting

Menghadapi kerumitan itu, jelas Hassabis, timnya lalu merancang AlphaGo untuk bisa beroperasi berdasarkan "intuisi dan perasaan".

"Dalam permainan Go, kami butuh mesin yang sangat rumit dan berinsting, kemampuan yang tadinya dikira hanya dimiliki oleh otak manusia, mesin yang memiliki pikiran tentang siapa yang sedang unggul dan langkah apa yang harus diambil," jelas David Silver, pakar komputer pada Google DeepMind, yang ikut mengembangkan AlphaGo.

AlphaGo pada dasarnya hanya "menonton" jutaan pertandingan Go antara manusia untuk mempelajari aturan dan strategi dasar permainan kuno. Sistem itu kemudian berlatih melawan dirinya sendiri untuk menciptakan strategi-strategi baru.

Dalam proses belajar itu AlphaGo menggunakan pendekatan yang disebut "deep learning" atau "deep neural networks" - jaringan yang memiliki jutaan koneksi mirip syaraf. Dalam jaringan ini analisis dan hitungan dilakukan pada beberapa lapis hierarki yang tersusun secara terorganisasi. Data akan dianalisis dari lapisan paling rendah hingga paling tinggi.

Ada dua perangkat jaringan dalam AlphaGo. Pertama adalah jaringan nilai (value network), yang bertugas melihat posisi bidak pada papan Go dan memutuskan siapa yang akan menang dan mengapa ia menang. Kedua adalah jaringan kebijakan (policy network), yang memutuskan langkah apa yang akan diambil.

Seiring waktu, jejaring kebijakan akan melatih jejaring nilai agar bisa melihat bagaimana sebuah permainan berjalan.

Tidak seperti metode-metode AI sebelumnya, yang berusaha mengkalkulasi keuntungan dari setiap langkah menggunakan brute force (dari proses trial and error berulang-ulang kali), program ini hanya akan memilih langkah yang menurutnya memberikan peluang menang paling besar - metode yang lazim digunakan oleh manusia.

"Sistem ini mencari (langkah) dengan memainkan permainan ini berulang-ulang kali dalam imajinasinya sendiri. Ini yang membuat pencarian AlphaGo lebih mirip manusia ketimbang mesin-mesin sebelumnya," jelas Silver.

Dalam proses pengembangannya AlphaGo terus dilatih dengan bermain menghadapi program-program komputer Go lainnya. Ia memenangkan 499 dari 500 laga yang digelar. Pada Oktober 2015 lalu, ia mengalahkan Hui. (Phys.org/Live Science)

Load More