NECがブログやアンケートなどの文章から個人の意見を抽出する新技術を開発

複数の文を分析して関連から意見文らしさを学習し抽出

日本電気(NEC)は、ブログやアンケートなど、企業のブランドや商品などに対する評判情報を含む文章を分析する技術として、個人の主観や感情を表す「意見文」、特定の話題に関連した「トピック関連文」を文章全体の中から抽出する際の網羅性を向上する「文特性分布計算方式」を開発した、と4月14日に発表した。

文特性分布計算方式は、意見文やトピック関連文にあてはまるかを判定するため、話題の連続性に着目。前後の複数の文で“意見文らしさ”または“関連文らしさ”を計算する。これにより、単文で判定する従来方式に比べ、網羅性を示す指標の再現率を21%向上、対象となる文章中からより多くの意見文や関連文を抽出できるようになったという。

同方式では同じ話題が連続して書かれる傾向に着目し、複数の文の中に含まれる意見文を学習してルールを抽出して評価を行う。また、文章全体での意見文らしさ、関連文らしさの分布も算出して判定する。同社がこれまでに開発した技術と文特性分布計算方式を組み合わせることで、ブログ、電子掲示板などのCGM情報、アンケートデータ、コールセンターでの問合せの記録などから、より多くの意見や要望を把握するのに役立つという。

NEC
http://www.nec.co.jp/

この記事が役に立ったらシェア!
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

リードジェネレーション
リードは潜在顧客のことで、ある特定の商品、サービスに関心がありそうなユーザーもし ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]