2021 01 16 Klines 1 BATCH SIZE and NEPOCHS - WojciechMigda/TruRL GitHub Wiki
Parametry eksperymentu:
Episodes: 100
max_episode_steps: 200
Memory capacity: 100000
GAMMA: 0.70000
BATCH SIZE: 128
NEPOCHS(20)
KBinsDiscretizer({
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{10, 0.000000, 100.000000},
{10, 0.000000, 100.000000},
{10, 0.000000, 200.000000},})
Scaler({[-0.500000, 0.500000], [0, 10000]})
TsetliniClassifierBitwise({
"threshold": 10000,
"s": 8.000000,
"number_of_regressor_clauses": 3200,
"number_of_states": 127,
"boost_true_positive_feedback": 1,
"random_state": 1,
"n_jobs": 6,
"clause_output_tile_size": 16,
"weighted": true,
"box_muller": false,
"loss_fn": "MSE",
"loss_fn_C1": 0.000000,
"max_weight": 2147483647,
"verbose": false
})
Gym: <TimeLimit<WavyMarketEnv, gen_fn=07_klines (../../experiments/klines/Binance_BTCUSDT_1m_1597190400000-1598227200000.json) window_size=30 Actions=[<Actions.HOLD: 0>, <Actions.BUY100: 1>, <Actions.SELL100: 2>] Fees=0/0>>
Celem eksperymentu było sprawdzenie jak na jakość samouczenia wpłynie podwyższenie wartości parametrów BATCH SIZE oraz NEPOCHS, odpowiednio dla agenta oraz dla regresora.
Bazowy eksperyment to T=10k, Q=[-0.5, +0.5], s=8 z tego przeglądu.

Obserwacje:
- samo zwiększenie BATCH SIZE nie dało znaczących korzyści, poza tym że mediana jest sporo wyższa niż w wyjściowym eksperymencie,
- zwiększenie liczby epok polepszyło średni wynik, zarówno względem bazowego eksperymentu jak i jego wersji z s=4.0. Względem bazowego eksperymentu obniżył się rozrzut, który jest porównywalny z wersją s=4.0,
- eksperyment z liczbą epok 40 pobił też rekord jeśli chodzi o najsłabszy wynik, który w jego przypadku nie spadł poniżej 16.6,
Lokalizacja: /experiments/2021-01-16_klines_1m_BATCH_NEPOCHS
Użyte skrypty są wersjonowane w katalogu powyżej.