2021 01 10 Klines 1 trend - WojciechMigda/TruRL GitHub Wiki
Parametry eksperymentu:
Episodes: 100
max_episode_steps: 200
Memory capacity: 100000
GAMMA: 0.70000
NEPOCHS(20)
KBinsDiscretizer({
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{34, -0.020000, 0.020000},
{10, 0.000000, 100.000000},
{10, 0.000000, 100.000000},
{10, 0.000000, 200.000000},})
Scaler({[-5.000000, 5.000000], [0, 10000]})
TsetliniClassifierBitwise({
"threshold": 10000,
"s": 4.000000,
"number_of_regressor_clauses": 3200,
"number_of_states": 127,
"boost_true_positive_feedback": 1,
"random_state": 1,
"n_jobs": 6,
"clause_output_tile_size": 16,
"weighted": true,
"loss_fn": "MSE",
"loss_fn_C1": 0.000000,
"max_weight": 2147483647,
"verbose": false
})
Gym: <TimeLimit<WavyMarketEnv, gen_fn=07_klines Actions=[<Actions.HOLD: 0>, <Actions.BUY100: 1>, <Actions.SELL100: 2>]>>
Eksperyment został przeprowadzony aby zweryfikować jak będzie przebiegało samouczenie dla szeregu czasowego, który jest ciągłym podzbiorem szeregu używanego we wcześniejszych eksperymentach, ale który nie wykazuje pozytywnego trendu na całej długości przebiegu.
Oto jego parametry:
Binance_BTCUSDT_1m_1597278060000-1598227200000.json
15820 klines
Total span %: -0.05%
Total span logret: -0.00050
Min logret: -0.02709
Max logret: +0.02542
Mean logret: 0.00000382
Median logret: -0.00005668
STD (68.3%) logret: 0.00306
STDx2 (95.4%) logret: 0.00612
STDx3 (99.7%) logret: 0.00918
Wykonano 10 powtórzeń, po 100 epizodów, każdy epizod po 200 kroków.

Powyższy wykres pokazuje, że z alternatywnym szeregiem czasowym samouczenie nie dało słabszego wyniku w porównaniu z bazowym eksperymentem.
Lokalizacja: /experiments/2021-01-10_klines_1m_trend
Uzyte skrypty są wersjonowane w katalogu powyżej.