時系列処理 - MLShukai/PrimitiveAMI GitHub Wiki

概要

RWKVやRetNetのようなParallel/Recurrentの両方の処理ができるモデル向けに時系列処理を実装している
現在はSConvというmyxyが考案したモデルを使用(使ってみたかったので)

実行方法

python src/train.py task_name=time_series

で実行

訓練詳細

学習させるデータは時系列順序を保つ必要がある
DataCollectorはデータを有限長キューに格納し、学習時はキューから作成したDatasetをシーケンシャル(shuffle=False)に読み出している
学習データを使いまわす実装にした都合上訓練epoch毎に初期内部状態をランダムリセットしている、その際推論フェーズの内部状態は保存され次の推論フェーズ前に元に戻している