2022-02-03から1日間の記事一覧

日本語をfastText - 2

結局、ここに従って新たなスクリプトをインストールし、テキストを抽出。 pip install --ignore-installed git+https://github.com/prokotg/wikiextractor python -m wikiextractor.WikiExtractor jawiki-20220201-pages-articles-multistream.xml.bz2 そし…