Research - Web工学研究室 - 東京電機大学

Web上の情報を活用する為のスパム対策

迷惑メール、掲示板荒らし、スパムブログ(Splog)など、情報閲覧を阻害する、あらゆるスパムがインターネット上に溢れ、閲覧者にとって本当に求めている情報が埋もれてしまっています。私たちは検索結果からスパム情報をフィルタリングし、有害であったり求めていない情報を結果表示から排除する為、より効率的で高度な手法を考案し、実装するための研究を行っています。これはコンピュータが情報の中身を見て人間に近い判断をする事により、より高度でユーザーに優しい情報提供のレベルを保つ事を目的としています。「スプログチェッカー」は、人間のスパム判定情報をコンピュータに学習させるためのツールです。一度、コンピュータが判定情報を学習してしまえば、ユーザーが検索した未知のページを自動的にスパムかどうか判定してくれます。

Wikipedia言語間リンクの解析

ウェブ上には様々な言語で書かれた有益な情報が溢れていますが、日本語に絞るとわずか5%しか活用できません。また個別の情報は充実していても、その関係性が見えない事も多いのです。当研究室ではWikipediaがもつ膨大な情報を利用し、異なる側面から情報を見える化する事で新たな発見を感じられるようなシステムを研究しています。「言語間ビジュアライザ」は、日本語キーワードを検索すると、多言語で自動的に関係性を図示し、世の中の動き、関心動向、文化圏の違いなど閲覧者の気づきや発見を促進します。また「ウェブよくみる」では、画像検索やGoogle翻訳など複数の検索システムを縦横断した結果を一覧表示します。私たちの研究はまさにマッシュアップ。秀でた技術は利用し、それを集約したりまとめたり、機能を追加する事によって、より役立つ新たなものを生み出そうとしています。

図書館とWebの統合的利用

図書館は信頼性が高く、情報保管サイクルも比較的長くとられます。反面、知りたい情報に辿り着くには、分類体系などリファレンスの高度なテクニックを必要とする事もあります。 Webは、即時性が高く、間口が広い反面、信頼性の確認が難しく、情報の深度が浅いなど、一長一短の特徴を持っています。そこでそれらの特徴の中間的な位置づけを持つ、Wikipediaを道しるべとして利用し、求める結果へ、そしてさらに深い情報へとガイドするシステムの研究を行っています。本研究は企業に成果を利用頂いて、国立国会図書館にも使われています。

SNSからの情報抽出と可視化

Twitterでは実際にどんなことがつぶやかれているのか、ある特定の場所にいる人はどんなことをつぶやいているのかなど、Twitterについては、まだまだわからないことがいろいろあります。大量のTwitterのツイートを解析して、有用な情報を抽出して活用するための研究を行います。
たとえば、コミケ期間中につぶやかれたツイートを収集し、コミケ会場に実際に行っている人のツイートかどうかを判定し、ツイートからブース位置も推定します。その結果をもとに可視化を行ったり、ツイートの統計情報をグラフ化して提示します。

研究室の探索支援システム

人が様々な選択肢の中から1つを選ぶというのは難しいものです。情報メディア学科の各研究室も共に専門的な分野を扱っている為、学生の進路決定が難しい側面があります。本研究では、現在知っているキーワードとして教員名や講義名などを入力した結果として、関係性を図示することにより、漠然とした希望を絞り込んだり膨らませたりしながらナビゲートします。また、1つの分野に固執し視界が狭くなってる学生に対しても、広い視野を提示し、可能性を広げるという側面も持っています。今持てる情報から連想を繰り返し、情報と嗜好を拡張していく本手法は、研究室選定に限らずあらゆる場面での利用が期待できます。

Web検索語候補推薦の拡張

現在、Web上の情報を検索する手段の大多数を占めるのが文字列ベースの検索です。ユーザは探したい情報に関連しそうな検索語を用いてGoogleやYahoo!などの検索エンジンから検索を行います。このとき、より多くのユーザが用いている検索語や旬な検索語を知ることができれば目的の情報に素早くたどり着くことができるかもしれません。そのため、現在の検索エンジンにはGoogleサジェストやYahoo!関連検索ワードなどの検索語候補推薦システムが用意されています。これらのシステムを用いることでユーザは入力した文字列に続く語や関連する語を知ることができますが、入力する語の異表記やゆれに対応することができません。例えば、東京電機大学と電機大は意味的には同義ですが、検索語候補推薦システムはこれらが同義であるという知識を持たないため、別々の候補を提示します。本研究ではこうした入力文字列の異表記やゆれに対応する検索語候補推薦システムの拡張を行っています。

雰囲気を考慮した献立作成支援システムの開発

料理レシピサイトと呼ばれるサイトが支持を集めています。料理レシピサイトの中には、単品の料理だけでなく、料理を献立単位でまとめて紹介しているものあります。ユーザが一食分の献立を考える為にこれらのサイトを利用する際、作りたい料理や「中華風」などの献立の雰囲気をもとに献立を組み立てていきます。単品料理が紹介されているサイトの場合、献立内の料理の組み合わせをユーザ自身が考える必要があり、労力がかかるほか、適切な組み合わせが得られるとは限りません。また献立単位で紹介されているサイトであっても、ユーザの嗜好にあった献立を見つけることができるとは限らず、献立に好みではない料理が含まれている場合にも、その料理の入れ替えなどの融通は利かない場合がほとんどです。そこで本研究では作りたい料理や献立の雰囲気は決まっているが、献立全体を決められないユーザの献立作成を支援することを目的とし、献立全体の雰囲気や作りたい料理を起点とした料理推薦システムを開発しています。