遊戲紀錄檔 - LanKuDot/MLGame GitHub Wiki
無論是在手動模式還是機器學習模式,只要在執行時指定 -r/--record
的 flag,MLGame 就會產生遊戲遊戲紀錄檔,並儲存在該遊戲的 log
資料夾中。遊戲紀錄檔會儲存遊戲提供的場景資訊與玩家或鍵盤的指令,可以用在訓練機器學習的模型。
遊戲紀錄檔
格式
遊戲紀錄由一個 dict 組成,裡面的鍵值有:
record_format_version
:這個紀錄檔的格式版本。在 MLGame Beta 8.0 中加入此欄位,值為 2。- 其餘為機器學習端的名字,不同的機器學習端的紀錄會存在不同的鍵值裡。其值亦為 dict,有兩個鍵值:
scene_info
:其值為一個 list,依序存放每個收到的場景資訊,即Game.get_player_scene_info()
每次回傳的 dict 中,屬於該機器學習端的場景資訊。command
:其值也是一個 list,存放的是玩家或是鍵盤傳出的指令,即MLPlay.update()
或是Game.get_keyboard_command()
回傳的 dict 中,屬於該機器學習端的指令。
紀錄檔格式例子:
{
"record_format_version": 2,
"ml_1P": {
"scene_info": [scene_info_0, scene_info_1, ..., scene_info_n],
"command": [command_0, command_1, .., None]
},
"ml_2P": {
"scene_info": [scene_info_0, scene_info_1, ..., scene_info_n],
"command": [command_0, command_1, .., None]
},
"ml_3P": {
"scene_info": [],
"command": []
}
}
第 n 個指令就是針對第 n 個場景資訊所產生的指令。而最後一個場景資訊所對應的指令一定為 None
,因為在遊戲結束後,不會有指令傳出。在動態玩家人數的遊戲中,沒有被啟動的機器學習端就不會被紀錄,就像上述例子中的 "ml_3P"
,會是一個空 list。
要注意的是,MLGame 是以傳出場景資訊後,將當下收到的指令儲存到紀錄中,所以當機器學習端有延遲時,所儲存的指令也會是有延遲的。另外如果機器學習端沒有傳任何指令,則對應的指令紀錄會是 None
。
檔名
在遊戲結束時,也就是 Game.update()
回傳 "RESET"
或 "QUIT"
時,MLGame 會用 pickle.dump()
將儲存的遊戲紀錄寫到檔案中。檔案會存在該遊戲資料夾的 log
資料夾裡,如果該資料夾不存在,MLGame 會自動建立。
而產生的檔名格式為 "<模式>_<遊戲參數>_<時間戳記>.pickle":
- 模式:手動模式為 "manual",機細學習模式為 "ml"
- 遊戲參數:依照輸入的參數產生,以底線間隔
- 時間戳記:格式為 "YYYY-MM-DD_HH-MM-SS"
例如以指令 python MLGame.py -r -m arkanoid EASY 1
啟動的遊戲,所產生的紀錄檔檔名為 "manual_EASY_1_2020-05-26_15-10-10.pickle"。
讀取紀錄檔
一樣使用 pickle
模組來讀取紀錄檔。
>>> import pickle
>>> with open("games/arkanoid/log/manual_EASY_1_2020-05-26_15-10-10.pickle", "rb") as f:
... p = pickle.load(f)
要注意的是開啟模式是 rb
,而不是 r
,這樣才可以被 pickle
讀取。再使用 pickle.load()
將存在紀錄檔裡的資訊讀出來。
>>> p.keys()
dict_keys(['record_format_version', 'ml'])
>>> p["record_format_version"]
2
>>> len(p["ml"]["scene_info"])
204
>>> p["ml"]["scene_info"][42]
{'frame': 42, 'status': 'GAME_ALIVE', 'ball': (93, 395), 'platform': (75, 400), 'bricks': [(35,
50), (60, 50), (85, 50), (110, 50), (135, 50)], 'hard_bricks': []}
>>> p["ml"]["command"][42]
'MOVE_LEFT'