日本語事前学習は終了したものの

結局2080Tiの処理が一番早く完了した。max_seq_lengthを512から128に減らした影響がどのくらいあるか分からないが、あまりなければ今後もこのPCを主体で使うことになりそう。4-5日で完了するのであればそれなりに実験の回数を重ねることができそうだ。

そして現在は生成されたチェックポイントデータをPyTorch用のデータに変換するところで躓いている。なんかもっと使いやすいようなデータを生成して欲しい・・・。