もふもふ技術部

IT技術系mofmofメディア

NER

spaCy + GiNZAの固有表現抽出(CRF)で、電話番号とFAX番号を識別出来るか試す

前回、spaCyとGiNZAを使って固有表現抽出するところまでやったので、今回は電話番号とFAX番号を固有表現抽出で識別出来るか試してみます。 spaCy + GiNZAを使って固有表現抽出とカスタムモデルの学習をしてみる 電話番号とFAX番号を分けて教師データにしてみ…

spaCy + GiNZAを使って固有表現抽出とカスタムモデルの学習をしてみる

自然言語処理をするときはよくRasa NLUを使っているのですが、内部的にはspaCyが使われている模様です。どちらもパイプラインでモジュールをつなげていって自然言語処理をシンプルにするフレームワークだと理解しているのですが、spaCy単独で使うとどういう…