4. Senの使用法
2005.09.28 株式会社四次元データ 宮澤了祐
4.1. 簡単なサンプル
この章ではSen単体での使用法を解説します。
すでにSenをインストールし、辞書を作成しているとします。
Senのインストールにはこちらを参考にしてください。
クラスパスにsen.jarおよびcommons-logging.jarを追加しておきます。
import java.io.IOException;
import net.java.sen.StringTagger;
import net.java.sen.Token;
public class SenSample {
public static void main(String[] args) throws IllegalArgumentException, IOException {
StringTagger tagger = StringTagger.getInstance();
String str = "今日は良い天気です。";
Token[] token = tagger.analyze(str);
for(int i=0; i<token.length; i++){
System.out.println(token[i].getBasicString()
+"("+token[i].getTermInfo()+")");
}
}
}
net.java.sen.StringTagerは、java.lang.Stringを使用した文字列を形態素解析するクラスです。 StringTaggerのanalyze(String)メソッドによって、形態素解析を行います。
net.java.sen.Tokenは形態素の情報を保持するクラスです。 TokenのgetBasicString()で、基本形を出力できます。また語句の詳しい説明はToken.getTermInfo()で表示出来ます。
Senを利用したプログラムを実行するには、Senのインストールされているフォルダを環境変数sen.homeに設定する必要があります。
System.setProperty("sen.home","c:/sen");
をプログラムの先頭に含めるか、またはプログラム実行時に-Dオプションで次の用に指定してください。
$ java -Dsen.home=c:/sen
次のように出力されれば、成功です。
今日(名詞,副詞可能,*,*,*,*,今日,キョウ,キョー) は(助詞,係助詞,*,*,*,*,は,ハ,ワ) 良い(形容詞,自立,*,*,形容詞・アウオ段,基本形,良い,ヨイ,ヨイ) 天気(名詞,一般,*,*,*,*,天気,テンキ,テンキ) です(助動詞,*,*,*,特殊・デス,未然形,です,デショ,デショ) 。(記号,句点,*,*,*,*,。,。,。)

