時系列処理 - MLShukai/PrimitiveAMI GitHub Wiki
概要
RWKVやRetNetのようなParallel/Recurrentの両方の処理ができるモデル向けに時系列処理を実装している
現在はSConvというmyxyが考案したモデルを使用(使ってみたかったので)
実行方法
python src/train.py task_name=time_series
で実行
訓練詳細
学習させるデータは時系列順序を保つ必要がある
DataCollectorはデータを有限長キューに格納し、学習時はキューから作成したDatasetをシーケンシャル(shuffle=False)に読み出している
学習データを使いまわす実装にした都合上訓練epoch毎に初期内部状態をランダムリセットしている、その際推論フェーズの内部状態は保存され次の推論フェーズ前に元に戻している