Cuộc đại chiến giữa máy và người trong cờ vây (Phần II)

by , under Uncategorized

 

CUỘC ĐẠI CHIẾN GIỮA

NGƯỜI VÀ MÁY TRONG

CỜ VÂY (Phần II)

Sau Hai Nước Đi, AlphaGo và Lee Sedol

Đã Định Dạng Lại Tương Lai1

Tác giả: Cade Metz2, ngày 03.16.16

(Courtesy of WIRED)

Người dịch: Võ Thành Minh Tuệ & Nguyễn Xuân Xanh

Lời nói đầu người dịch. Bài này ghi lại không khí rung chuyển của cuộc đấu trí giữa máy AlphaGo và đại kiện tướng Lee Sedol tại Hàn Quốc, về ý nghĩa của sự thắng bại, tính thiên tài của máy mà con người không ngờ tới, và “cái chạm của Chúa” của con người mà máy cũng không ngờ tới. Cuộc hành trình mới không phải là máy chống lại người, mà là sự tổng hợp người và máy.

Lee Sedol 34t (Geordie Wood/WIRED)

SEOUL, HÀN QUỐC. Ở ván thứ hai, chiếc máy của Google đã đi một nước cờ mà không con người nào sẽ làm được. Và nó là một nước đẹp. Trong khi thế giới nhìn vào, nước đi đã chứng minh một cách vô cùng hoàn hảo tài nghệ hết sức mạnh mẽ và có tính bí ẩn nhiều hơn của trí tuệ nhân tạo hiện đại.

Nhưng trong ván thứ Tư, con người đã có một nước đi mà không máy nào chờ đợi. Và nó cũng thật đẹp. Thật sự, nó cũng đẹp ngang bằng với nước đi của máy Google – không hơn không kém. Nó chứng minh rằng, mặc dù bây giờ máy có năng lực tạo nên những khoảng khắc thiên tài, con người hầu như không mất đi năng lực tạo ra những khoảng khắc siêu việt riêng của chúng ta.

Tuần này chứng kiến hồi cuối của trận đấu lịch sử giữa Lee Sedol, một trong những người chơi cờ vây giỏi nhất thế giới, và AlphaGo, một hệ thống trí tuệ nhân tạo được thiết kế bởi một đội các nhà nghiên cứu ở DeepMind, một phòng thí nghiệm ở Luân đôn giờ thuộc về Google. Máy khẳng định chiến thắng trong chuỗi đấu năm ván, thắng bốn và thua một. Nó đánh dấu lần đầu tiên một chiếc máy đã đánh bại đối thủ rất giỏi của môn cờ cổ đại hết sức phức tạp này – một kỳ công mà cho đến gần đây, các chuyên gia đã không chờ đợi sẽ xảy ra trong mười năm tới.

Chiến thắng là rất đáng ghi nhớ bởi vì các công nghệ nằm ở não bộ của AlphaGo là tương lai. Chúng đang thay đổi Google và Facebook, Microsoft và Twitter, và đang sẵn sàng tái sáng tạo tất cả mọi thứ, từ robotics đến nghiên cứu khoa học. Điều này là đáng sợ cho một số người. Sự lo lắng nằm ở chỗ các cỗ máy trí tuệ nhân tạo sẽ lấy mất công ăn việc làm, và có thể thoát khỏi sự kiểm soát của chúng ta – và ở một mức độ nhất định, những lo lắng ấy là có cơ sở. Chúng ta sẽ không ngạc nhiên.

Nhưng có một cách suy nghĩ khác về tất cả chuyện đó – một cách suy nghĩ đưa chúng ta vượt khỏi hình tượng “con người chống lại máy móc”, được gợi ra bởi những bài học từ hai thế cờ tuyệt vời kia.

Nước cờ thứ 37

Với nước cờ thứ 37 trong ván thứ hai của trận đấu, AlphaGo đã gây một sự ngạc nhiên ở bên phía phải của tấm bảng 19 lần 19 làm bối rối ngay cả những tay cự phách cờ vây thế giới, bao gồm Lee Sedol. “Đó là một nước đi rất lạ”, một bình luận gia nói, bản thân ông là tay chơi cờ vây bậc đệ cửu đẳng, là hạng cao nhất. “Tôi nghĩ, đó là một nhầm lẫn”, một người khác nói. Lee Sedol, sau khi rời khỏi phòng thi đấu, cần đến gần mười lăm phút mới tìm đươc câu trả lời. Fan Hui – ba lần vô địch cờ vây châu Âu, người từng đánh với AlphaGo trong một trận đánh đóng cửa tháng Mười, thua năm ván và không thắng ván nào – đã phản ứng với với sự ngờ vực. Nhưng rồi, xuất phát từ kinh nghiệm của ông với AlphaGo – ông đã chơi đi chơi lại trong vòng năm tháng từ tháng 10 – Fan Hui đã nhận ra vẻ đẹp trong nước đi lạ thường này.

Demis Hassabis DeepMind

Demis Hassabis, 41t, người đồng sáng lập Cty AI DeepMind năm 2010. Ông học đánh cờ vua lúc 4 tuổi, trở thành kiện tướng (master) lúc 13 tuổi chỉ đứng sau đại kiện tướng Judit Polgár; học lập trình lúc 8 tuổi, và lập trình games lúc 11 tuổi. Năm 2014, Google mua lại DeepMind với giá £400 triệu.

Thực ra, nước đi đã xoay chiều cuộc chơi. AlphaGo tiếp tục thắng Ván thứ Hai, và ở cuộc họp báo sau khi thi đấu, Lee Sedol ở trong trạng thái bị sốc. “Hôm qua, tôi bị ngạc nhiên”, ông nói qua một thông dịch viên, ám chỉ sự thất bại của ông trong Ván thứ Nhất. “Nhưng hôm nay, tôi chết đứng. Nếu quí vị xem diễn tiến của ván cờ, tôi thú nhận, rõ ràng thất bại thuộc về phía tôi. Ngay từ phút đầu của ván thi đấu, không có một lúc nào tôi cảm thấy tôi là người dẫn đầu an toàn.”

Đó là một giây phút đau buồn. Nhưng cùng lúc, những người trong chúng ta từng quan sát trận đấu bên trong khách sạn Bốn Mùa của Seoul có thể cảm nhận cái đẹp của nước đi kia, đặc biệt sau khi đã nói chuyện với Fan Hui, người có hơi hám triết lý. “Đẹp quá”, ông ta cứ nói. “Đẹp quá”. Rồi sáng hôm sau, David Silver, nghiên cứu trưởng của nhóm AlphaGo, kể cho tôi biết chiếc máy đã nhìn nước đi thế nào. Và nó cũng đẹp.

Một trong Mười ngàn

Ban đầu, Silver và team của ông dạy AlphaGo chơi cờ cổ đại bằng cách sử dụng một mạng nơ-ron sâu (deep neural network) – một mạng của phần cứng và phần mềm nhái lại mạng các nơ-ron (tế bào thần kinh) trong não người. Công nghệ này đã làm nền tảng các dịch vụ trực tuyến cho những chỗ như Google và Facebook, và Twitter, giúp xác định gương mặt trong ảnh, nhận diện lệnh được nói vào điện thoại thông minh, thúc đẩy các cổ máy tìm, và nhiều hơn nữa. Nếu bạn nạp đủ ảnh của một con tôm hùm vào một mạng nơ-ron, nó có thể học nhận ra một con tôm hùm. Nếu bạn nạp cho nó đủ các cuộc đối thoại con người, nó có thể học thực hiện một cuộc đối thoại có thể xem là đàng hoàng. Và nếu bạn nạp 30 triệu bước đi từ những chuyên gia chơi cờ, nó có thể học chơi cờ vây.

Nhưng sau đó, team đi xa hơn. Sử dụng một công nghệ AI thứ hai, gọi là học tăng cường (reinforcement learning), họ thiết lập vô số ván cờ trong đó các phiên bản hơi khác nhau của AlphaGo được đấu với nhau. Và trong khi AlphaGo chơi với chính nó, hệ thống tìm ra những bước đi nào đem lại phần lớn lãnh thổ trên bảng cờ. “AlphaGo học khám phá các chiến lược mới cho nó, bằng cách chơi hàng triệu trận đánh giữa các mạng nơ-ron của nó, tự đấu với nhau, và từng bước cải thiện”, Silver nói khi giới thiệu AlphaGo đầu năm nay.

https://media.wired.com/photos/5926ece6f3e2356fd800ae76/master/w_2400,c_limit/GW20160134040.jpg

(Geordie Wood/WIRED)

Rồi một team khác thực hiện một bước khác. Họ góp nhặt các bước đi từ những trận đấu máy-với-máy này, và nạp chúng vào một mạng nơ-ron thứ hai. Mạng nơ-ron này huấn luyện hệ thống để kiểm tra các kết quả tiềm năng của mỗi bước đi, để nhìn về phía trước vào tương lai của ván cờ.

Như thế, AlphaGo học từ các bước đi của con người, và sau đó nó học từ các bước đi được làm ra khi nó tự chơi với chính nó. Nó hiểu con người chơi thế nào, nhưng cũng có thể nhìn xa hơn con người chơi thế nào ở một mức độ hoàn toàn khác của ván cờ. Đó là điều đã xảy ra với Nước cờ thứ 37. Như Silver kể cho tôi, AlphaGo đã tính toán rằng có cơ hội một-trong-mười-ngàn để con người đi nước cờ đó. Nhưng khi nó dựa trên tất cả những tri thức nó thu nhặt được bằng cách tự chơi với nó nhiều lần – và nhìn về phía trước trong tương lai của trận đấu – nó quyết định phải làm nước cờ đó. Và nước cờ đã trở thành thiên tài.

Nước đi thứ 78

Lee Sedol như thế đã thua ba ván đấu, và AlphaGo đã dành được giải một triệu đô la cho mình cho những ván cờ hay nhất trong năm ván. Không khí bên trong khách sạn Bốn Mùa chùng lại. “Tôi không biết nói gì, nhưng tôi nghĩ tôi trước nhất phải nói lên lời xin lỗi”, Lee Sedol nói. “Tôi đáng lẽ phải có kết quả tốt hơn, một kết cục tốt hơn, một cuộc chiến đấu tốt hơn trong những ván cờ đã đánh.”

Trong ván thứ 4, Lee Sedol có ý định lấy lại một phần niềm tự hào đó cho mình, và cho hàng vạn triệu người xem trận đấu vòng quanh địa cầu. Nhưng giữa đường ván cờ, triển vọng của người Hàn Quốc thấy không tốt lắm. “Lee Sedol cần phải làm điều gì đặc biệt”, một bình luận gia nói. “Nếu không, thì sẽ không đủ sức (để chiến thắng).” Nhưng sau khi xem nước đi tiếp theo kéo dài trong 30 phút, anh ta đã đi một nước đặc biệt. Đó là nước thứ 78, một cái “nêm” ở giữa bảng, và ngay tức khắc nó đã xoay chiều trận đấu.

Như chúng ta đã biết sau trận đấu, AlphaGo đã đi một chiến lược sai lầm với nước kế tiếp của nó, và chỉ vài phút sau, sau khi phân tích ván cờ, chiếc máy quyết định rằng cơ hội để thắng thình lình đã bị tuột dốc. Người bình luận và đệ cửu đẳng Michael Redmond đã gọi nước đi của Lee là sáng chói: “Nó làm tôi ngạc nhiên. Tôi chắc chắn rằng nó sẽ làm cho phần lớn các đối phương phải ngạc nhiên. Tôi nghĩ nó làm cho AlphaGo ngạc nhiên.”

Trong giới chơi cờ vây, nước đi được ví như “Cái chạm của Chúa” (God’s Touch). Thực sự nó được rất khen ngợi. Nhưng sự khen ngợi nhiều hơn đến từ AlphaGo.

https://media.wired.com/photos/59271fa4ac01987bf0138954/master/w_2400,c_limit/GW20160131779.jpg

Một phụ nữ Hàn Quốc công bố tin tức về trận đấu trên truyền hình

(Geordie Wood/WIRED)

Một trong Mười ngàn – Một lần nữa

Sáng hôm sau, khi Demis Hassabis đi xuống đại lộ chính ở Sejog Daero, thẳng xuống đường từ khách sạn Bốn Mùa, tôi thảo luận với anh về nước đi 78. Hassabis là người giám sát phòng thí nghiệm DeepMind, và là khuôn mặt quan trọng của AlphaGo trong thời gian thi đấu bảy ngày. Trong lúc chúng tôi đi, những người qua đường đối xử với anh như một nhân vật nổi tiếng – thực sự anh như thế, sau khi xuất hiện trong vô số tờ báo và rất nhiều buổi show tin thức truyền hình. Ở đây tại Hàn Quốc, nơi có hơn 8 triệu người chơi cờ vây3, Lee Sedol là một khuôn mặt quốc gia.

Hassabis kể cho tôi rằng AlphaGo không được chuẩn bị cho nước đi 78 của Lee Sedol bởi vì nó không nghĩ rằng một con người có thể đi một nước như thế. Từ những tháng rồi những tháng huấn luyện của nó, nó quyết định rằng có một xác suất một-trong-mười-ngàn cho điều đó xảy ra. Nói khác đi: Nó giống chính xác xác suất mong manh mà con người đã có thể đi nước đi 37 của AlphaGo trong ván thứ hai.

Sự đối xứng của hai bước đi này là đẹp hơn cả những thứ khác. Một-trong-mười-nghìnMột-trong-mười-nghìn. Đó là những gì chúng ta nên giữ lại từ bảy ngày thi đấu đầy sững sờ này. Hassabis và Silver cũng như các đồng nghiệp nghiên cứu của họ đã xây dựng một chiếc máy có khả năng một cái gì đó như siêu-nhân. Nhưng cùng lúc, nó có lỗ hổng. Nó không thể làm tất cả những gì con người có thể làm. Thực tế, nó không thể ngay cả tiến đến gần (chỗ hoàn thiện?). Nó không thể thực hiện một cuộc đàm thoại. Nó không thể chơi đố chữ. Nó không thể đậu một kỳ sát hạch khoa học cấp tám. Nó không thể lường “Cái chạm của Chúa”.

Nhưng hãy nghĩ điều gì sẽ xảy ra nếu bạn đặt hai sự việc này bên cạnh nhau: Con người và máy. Fan Hui sẽ kể cho chúng ta sau năm tháng đấu hết trận này sang trận khác với AlphaGo, ông ta nhìn trận đấu hoàn toàn khác. Thứ hạng thế giới của ông đã tăng vọt lên cao. Và rõ ràng, Lee Sedol cũng cảm nhận như thế. Hassibis nói rằng anh ta và tay chơi Hàn Quốc gặp nhau sau ván thứ Tư, và rằng Lee Sedol đã lập lại những lời của Fan Hui. Chỉ vài trận đấu với AlphaGo, như Lee kể cho Hassabis nghe, đã mở mắt anh ra.

Đây không phải là con người đối đầu với máy. Mà đó là con người máy. Nước đi 37 đã vượt xa những gì mà mỗi người trong chúng ta có thể đo lường được. Nhưng rồi nước đi 78 xuất hiện. Và chúng ta hỏi: Nếu Lee Sedol đã không chơi ba ván cờ kia với AlphaGo, anh ta sẽ có thể tìm thấy “Cái chạm của Chúa” hay không? Máy đánh bại anh ta, nhưng cũng giúp anh ta tìm thấy con đường của mình./.


Chú giải:

  1. Bản gốc: https://www.wired.com/2016/03/two-moves-alphago-lee-sedol-redefined-future/
  2. Cade Metz là cây bút lâu năm của WIRED bao gồm các đề tài về Google, Facebook, trí tuệ nhân tạo, bitcoin, data centers, chip máy tính, ngôn ngữ lập trình, và những lãnh vực mà thế giới đang thay đổi.
  3. Trên dân số khoảng hơn 51 triệu người, tức có một tỷ lệ hơn 15% người chơi cờ vây ở Hàn Quốc, tức cứ 10 người thì có đến 1.5 người chơi, một tỷ lệ rất cao! Nó biểu lộ tính trí thức của người Hàn Quốc.