サポートシステムに文章解析を入れて、FAQを案内するシステムを開発していますと言っていましたが、 「だったら自由文で質問できるようにJSNおじさん作っちゃえばいいじゃん」 ということになりました。 社長に頼んで、MeCabを利用した名詞抜き出しまでは完成。 あとは、FAQとどのようにこの名詞を関連付けるかが問題です。 たとえば、 早速ですが質問です。 XOOPSのインストールをしているのですが、MySQLのユーザー名とパスワードがわからなくなってしまいました。再送願えますでしょうか? とした場合、 名詞としてMeCabに抜き出されるのは以下のとおりです。
  • 質問
  • XOOPS
  • インストール
  • MySQL
  • ユーザー
  • パスワード
  • 再送
この場合、要するにユーザー名とパスワードの再送の手続きをご案内すればいいのですが、ノイズとして XOOPS、MySQLが入ってきます。 スコアを工夫しないと、XOOPSのインストールマニュアルをご案内することになります。 これはどうやって工夫すればいいんだろう…。 ほかの品詞からも判定するほうがいいのかなぁ。 形態素分析を詳しく学ばないとダメですね…。 そういえば、はてなのAPIではてなキーワードを抜き出してくれるのがあったのですが、キーワードへのリンクを張らないといけないので一応却下しました。 もしくは、人工無能的に、もう特定のキーワードにマッチしたら文字列を返すというのも考えられます。 ただ、それは辞書の作成が死ぬほど大変です。 「ユーザー名とパスワード」がこの場合キーワードで登録されていればいいということになりますが、 「UserIDとPassword」かもしれないし、ログイン名とパスワードかもしれない。 ってそれは上も同じか。うわ。FAQのタグ付けを工夫しないとですね…。 ただね、とりあえずロリポおじさんは越えるように頑張ります。 「支払いについて教えてください」って入れても「わからないぽ」って言われるのはさすがにw