コメント投稿

ストップワード

ストップワードは、自然言語(日頃人間が使っている言語)をコンピュータで処理するにあたって、一般的である等の理由で、処理対象外とする単語のこと。

一般的に、全文検索を行うシステムでは、「at」「of」などの前置詞や、「a」「an」「the」などの冠詞、「I」「He」「She」などの代名詞のほか、さまざまな単語をストップワードとして扱う。

例:データベースシステムMySQLの全文検索における標準のストップワード
http://dev.mysql.com/doc/refman/5.1/ja/fulltext-stopwords.html

Googleなどの検索エンジンでも、従来、一般的な単語である「the」「a」「for」などをストップワードとして扱い、検索の対象外にしてきた。しかし現在では、コンテクストの理解を深めるものとして、対象外とはしていないと考えられる。

024
024
-->
メルマガの登録はこちら Web担当者に役立つ情報をサクッとゲット!

人気記事トップ10(過去7日間)

今日の用語

フィーチャーフォン
高機能ケータイ電話を指す呼び方。 主に海外で、電話の機能だけをもったケータ ...→用語集へ

インフォメーション

RSSフィード


Web担を応援して支えてくださっている企業さま [各サービス/製品の紹介はこちらから]

[GOLD SPONSOR]
株式会社日本レジストリサービスオープンテキスト株式会社株式会社ブレインパッド株式会社サイバーエージェント株式会社フレームワークスソフトウェア
[SPONSOR]
株式会社キノトロープ株式会社アイレップユーザーグラム富士通株式会社Sitecore株式会社ミツエーリンクス株式会社電通デジタル