Deploying the MCTS Program On Site via WASM

Dec 14, 2022

Refresh the page to load the board.

Info

因为懒，所以这个Reversi的规则是只要一方无子可下就游戏结束。

考完期末考试，还有两天空闲时间才出去旅游。正好前一篇博客写了个MCTS跑Reversi的程序，打算一鼓作气做成一个可以玩的成品。技术选型是WASM和d3.js，个人感觉是非常契合这个场景的。顺便记录一下遇到的一些坑。简陋的设计如下，主要三个部分，用户前端部分包括d3.js实现的棋盘，收到用户输入后调用javascript写的胶水代码API，进一步调用更底层的cpp的API，完成一次交互。

编译到WASM

WASM(WebAssembly), 可以在浏览器虚拟机上跑的汇编指令集，完美契合我想在浏览器上运行cpp program的需求。而且在用户端跑程序，不需要写API打接口，没有网络延时，不需要负载均衡，很爽。主要工作就是写javascript和cpp的API。

cpp通过Emscripten编译到wasm模块，可以直接用js在浏览器里面运行。但这个玩意儿是个游戏，涉及到用户输入和程序的交互，所以设计应该是把wasm作为一个library，所以需要设计js和wasm的API。Emscripten里面有很多cpp和JS的交互的文档。

Javascript

关于javascript的API设计，作为一个棋盘前端，渲染所需要的只有两个：当前棋盘和下一步用户可以走的格子。其实也可以前端维护一个棋盘，cpp维护一个棋盘，只和cpp互相传递最纯粹nextMove。但这意味着要把cpp的游戏逻辑那坨*山用javascript重写一遍，是万万做不得的。所以确定了javascript胶水代码的API是

runMcts(nextMove)(拿到用户的nextMove，运行MCTS，返回新的棋盘)
getActions(获取当前棋盘下用户可以走哪些位置)。

CPP

关于cpp的浇水代码的API设计，比较复杂，和cpp的MCTS实现有关系。简而言之就是在cpp文件中保存了一个棋盘数组，一个更新路径数组（每次获得nextMove就append），一个actions数组（保存下一步可以走的格子），还有这三个数组的分别长度各为一个变量。最重要的是写API把这些内部变量的地址暴露给javascript，javascript才能读取它们的值。

一些坑包括：

EMSCRIPTEN_KEEPALIVE保证没有被主程序调用的函数不会被emcc优化掉（或者在编译指令里显式导出）。
extern "C"保证不会产生name mangling。
Module.setValue()(见这里)的pointer是byte单位，不会通过type自动推算。
可以直接在cpp文件中设置断点的plugin，但是要把视频中的fdebug-compilation-dir换成 source-map-base。
所有ccall等等API都需要在DOMContentLoaded发生后才能正常运行。
不要用run作为函数名。🫠

调试的时候可以直接用emrun起本地服务。编译完的wasm试着在浏览器里跑了一下，感觉还是比本地慢不少的。

D3.js写个交互页面

游戏必然需要用户输入。好游戏必然不可能让用户用cli打坐标交互，所以要画一个棋盘。由于想直接在博客上跑这个游戏，会遇到很多奇怪的问题。博客用的是next.js，以SSR和SSG闻名。然而用模版简化了写常规博客的工作，必然会增加在博客上加一些奇怪东西的成本。

要在博客上画这个棋盘，构思是在博客的markdown内嵌入一个html节点，外部加载js往这个节点上append图形。因为之前用过d3.js，恰好符合这个库的使用场景。然而事情并没有那么简单:

markdown内嵌html？

markdown只是html的又一抽象罢了，最终还是要编译回html的。我们要做的事情就是在编译过程中保留所写的html节点，使得在最终serve的html中仍然留有这个节点。好在别人已经帮我们实现过了：rehype-raw。

怎么运行javascript？

两种思路：

把javascript用<script>标签在博客中引入，然后把脚本放在public文件夹下，作为static file。这样做的好处是用最原生的方式来opt out Nextjs，比较自由，所有改动都在静态文件中，不需要在模版的javascript中加很多奇怪的条件语句来适配特殊页面。
在javascript中作为常规函数import。这样的好处是可以利用React的自洽的功能，比如生命周期hooks，不用去hack。缺点就是比较丑陋，需要良好的software engineering来弥补。

我开始尝试第一种方法，发现第一次load page的时候，棋盘不会渲染，一定要刷新才行。检查了一下发现我测试的时候用到了DOMContentLoaded。在react中，不会全部重新刷新html，所以这个事件在浏览博客的时候，不管进入几个页面，都只会触发一次。然而棋盘渲染的逻辑一定要在DOM完全加载后才可以执行（不然root node都找不到）最后还是只能回到react的useEffect。

如果用第二种方法，遇到的问题是wasm文件的serving问题…emcc生成的glue code会在本地加载wasm，但如果把glue code和别的javascript一起打包的话，运行的路径就变了，react application在运行时找不到wasm。如果要完全推倒用react wasm的框架来写，又不是很高兴🙃，所以就这样摆烂吧。

D3？

d3.js是一个非常非常优雅的库。你只需要定义数据，就可以把轻松地把数据map到所有的svg图形。遇到的几个问题有：

用惯了react，以为数据绑定以后一定是会数据更新后就自动更新渲染。想多了，要手动清除svg节点再用新的数据重新渲染。
Selection.onAPI中不传递index了，只传递data，只好把index保存为data的一部分。
因为mcts的程序跑得比较慢，想实现一个在等待时间内降低透明度的feature，发现仍然需要手动重新渲染。好吧，累了。
玩了一玩，虽然为了运行速度已经把MCTS算法的search space减到最小了，仍然被程序🤡LAME🤡了N次。

Epilogue

Reversi这个游戏，在大一的计算机导论（VG101）中的一个lab就写过。当时用的还是MinGW+Clion+AB-tree，还只能够搜索三步，还需要手动调棋盘的参数。没想到五年后的冬天又写了一遍。