chasen for Ubuntu 9.04

音声読み上げをやる予定が失敗したので、学んだことを記録.

chasen を初めて知った。

input :

echo "イチローが200本安打達成" | chasen -i w

output :

イチロー	イチロー	イチロー	名詞-固有名詞-人名-名		
が	ガ	が	助詞-格助詞-一般		
2	ニ	2	名詞-数		
0	ゼロ	0	名詞-数		
0	ゼロ	0	名詞-数		
本	ホン	本	名詞-接尾-助数詞		
安打	アンダ	安打	名詞-一般		
達成	タッセイ	達成	名詞-サ変接続		
EOS

オプション:-i w をつけるとutf8も扱えるみたい。


読み上げは、/dev/dspがうまく行ってないみたい。
そもそもEUC環境必須と書いてあるのに、utf8でしようと思ったのが間違いかも。

日本語読み上げに挑戦 - よしだメモ