AWS Sagemaker/notebook のライフサイクル設定を行った

はじめに

個人で使うSagemakerのnotebookのインスタンスに ライフサイクル設定を行います。

以下の2つの設定の付与を行います。

  • jupyter拡張のtoc有効化(ノート内に目次を自動でつけてくれる)
  • matplotilbのグラフの日本語化 (いわゆる豆腐問題の解決)
続きを読む

wikipediaからサッカーに関する日本語コーパスを作成する

はじめに

個人ワークととしてWord2vecでいろいろ試してみたくて、
wikipediaからサッカーに関する記事を取得しコーパスを作成してみた。

今回のゴールとしては、レアルにとってメッシ(バルサ)は誰?をやってみたい。
もちろんあの方を期待している。

  • はじめに
  • データの用意
  • 記事の選択
  • word2vecの学習
  • 疑問?
  • 最後に
続きを読む