「実は文章に自信がない」そんなWeb担当者を助ける文章校正ツール「文賢」が、AIで進化する!
Webサイトの担当者は、文章に触れる機会が多い。会社や商品の説明文だったり、プレスリリースだったり、キャンペーンの告知文だったりとさまざまな文章を作成していることだろう。
しかし専門的なトレーニングを受けているわけではなく、「実は文章に自信がない」という人も多いのではないだろうか。
そんな人のために、「文賢(ブンケン)」という校閲・推敲ツールがある。このツールが、AI技術を使って誤字脱字チェックを導入するという。
「AIが誤字脱字をチェックしてくれる」とは、どういうことだろうか? 同プロジェクトに共同で取り組むウェブライダー、SPJ、レッジの3社に詳しく話を聞いた。
言葉を軽んじるのではなく、どんなタイミングで、どんな言葉を伝えればいいのか。文賢が、そうしたことをもっと大事にするための手助けになればと思います。(ウェブライダー 松尾氏)
「間違った日本語」の検出は難しい……「それ、AIを使えばいいんじゃない?」
――まずは「文賢」について教えてください。
松尾茂起氏(以下、松尾)文賢は、ブラウザから利用できるクラウドのツールで、文章を校正したり推敲したりする手助けをしてくれます。文章を扱うすべての人に向けたツールで、具体的にはライター、編集者、社内報を作る広報の方などに利用していただいています。
――「AIが誤字脱字をチェックする」プロジェクトが進行中と伺いました。なぜAIを使おうと考えたのですか?
松尾文賢を開発するなかで、抱えていた課題があったんです。それは「日本語の誤字脱字を検出するのが難しい」ということ。間違っている文章を検出するためには、膨大な「間違った文章のデータ」が必要になるんですね。
ということをレッジさんと話していたら、「それ、AIで検出したらいいんじゃないですか? やりましょうよ」と言われたのが始まりです。それでレッジ、SPJ、ウェブライダーの3社でプロジェクトがスタートしました。
岡田孟典氏(以下、岡田)誤字脱字検出のプログラムとAI開発は、レッジが担当しています。
江口天氏(以下、江口)われわれは、主に自然言語処理の実装等に関するアドバイスを担当するということで加わりました。2017年の11月ごろですね。
日本語はとても複雑。でも、その壁を越えつつある
――自分で書いた文章の間違いって、自分で見つけるのは難しいんですよね。プロジェクトはどのくらい進んでいるのでしょうか。
松尾AIを使った誤字脱字チェック機能は4月18日の実装を予定しています。想像していたよりも「日本語という言語の壁が高い」ということがわかって、その壁をようやく越えつつあります。こうしたアプローチでの日本語の研究って、なかなか前例がないんですよね。
江口他言語、たとえば英語はホワイトスペースで単語が区切られるから、判別しやすいですよね。その場合は、単語辞書と突き合わせてスペルミスを発見するなど、ルールベースの手法が有効になります。
日本語は単語の数も結びつき方のパターンも多くて、とても複雑です。なので、ディープラーニング(LSTM)などによる単語の学習にもとづく、スペルミスの検知といった手段を使用する必要性があります。
村橋由美子氏(以下、村橋)使われている漢字の違いで意味が変わることもありますよね。漢字とひらがなの使い分けもありますし。表記は特定の書籍や文献を参考にされている方も多いと思いますが、漢字、あるいはひらがなを使ったから間違いというわけではない。
岡田ディープラーニングで誤字を見つける仕組みは「『次に来る正しい単語』を予測し続けて、予測にない単語がくるとそれが引っかかる」という形になっています。だからわざわざ間違った文章を大量に用意しなくても、正しい文章のデータを学習すればいいわけです。
――学習する文章のデータは、どのように集めているのですか?
松尾いわゆるオープンなデータを中心に学習させています。「うちの記事を学習に使っていいよ」と協力してくれるメディア企業さんもいて、メディアの記事を中心に正しい文章のパターンを大量に学習しているところです。
文賢で、社内&社外のコミュニケーションがスムーズに!
――Web担当者が文賢を使うと、どんないいことがありますか?
松尾リリースでも説明文でも、自分が書いた文章に自信が持てるようになります。文賢を利用いただいているのは、企業の方が多いんです。まさにWeb担当者の方とか、Webメディアの方とかですね。将来は、社内で「ブンケン通した?」「はい」みたいな会話がされるようになればいいなと考えています。
社内だけでなく、外部のライターさんとのコミュニケーションもスムーズになりますよ。文章に自信がないと、プロのライターさんに日本語の指摘をするのが怖いという人もいるかもしれません。ツールが指摘してくれれば、それを伝えるのは簡単です。
――なるほど。文章を発注する側の立場でも活用できそうですね。
松尾さらに、校正不足がきっかけで起きるトラブル、炎上の防止にもなります。経営者の方にも導入してほしいと考えていて、開発中のAIを使った誤字脱字チェック機能を実装したら、エンタープライズ版を用意する予定です。エンタープライズ版では、複数のユーザーで、より柔軟に文賢を使える機能の追加を考えています。
――利用料金はいくらなんでしょうか?
松尾今は個人用のプランだけなのですが、初期費用が10,800円で、月額利用料金が1,980円です(2018年4月時点)。ひと月にランチ2回ぶんと思えば高くないと思いますよ。
自分の文章に自信をもって、きちんと言葉と向き合うためのツール
――校正機能のパワーアップ、私も楽しみです! Web担読者にひとことずつお願いできますか。
松尾文賢は「楽をするためのツール」ではありません。自分の文章に自信を持って、文章についてきちんと向き合うためのツールです。だから「自動で文章を書いてくれる」とか、そういう方向には向かいません。
言葉って癒やしにもなるし、凶器にもなりますよね。企業SNSも当たり前の今、言葉を軽んじるのではなく、どんなタイミングで、どんな言葉を伝えればいいのか。そうしたことをもっと大事にできるようになる手助けになればと思います。
村橋最初は文賢を1人で作っていたのですが、今はいい仲間が増えて、いろいろなことができるようになりました。松尾も言いましたが、文賢はあくまで「文章を書く人」を補助して、支えるツールです。なので、文章を書く場面で気軽に文賢が使えるよう、APIを提供することも予定しています。そうすればCMSなどでも使っていただけるようになるので。
江口今回はライティングツールのお手伝いをしていますが、われわれは、自然言語処理を核にした地に足の着いたAIソリューションを提供しています。今は「AI」という言葉が乱用されて、誤解があるように感じているんです。AIも当然できることとできないこと、向いていることとそうでないことがあるんですね。AIは人間を超越した知性ではなく、人間の判断を助長し、セカンドオピニオンとして正しく使用されるべきもの。そういった意味では「マシーンインテリジェンス」と呼ばれる方がより適切かと思っています。
岡田このプロジェクトでは、メディア企業の方から「ぜひ協力させてほしい」と言ってもらえることが多いです。具体的にどうしていくかは未定ですが、輪をコミュニティのように広げていき、そういった熱いパワーを、文章作成を支援するという形で世の中に還元していけたらと考えています。
――今日はありがとうございました!
文賢(ブンケン)
https://rider-store.jp/bun-kenウェブライダー
https://web-rider.jp/Ledge.ai
https://ledge.ai/
ソーシャルもやってます!