Web上の情報を活用する為のスパム対策

迷惑メール、掲示板荒らし、スパムブログ(Splog)など、情報閲覧を阻害する、あらゆるスパムがインターネット上に溢れ、閲覧者にとって本当に求めている情報が埋もれてしまっています。 私たちは検索結果からスパム情報をフィルタリングし、有害であったり求めていない情報を結果表示から排除する為、より効率的で高度な手法を考案し、実装するための研究を行っています。 これはコンピュータが情報の中身を見て人間に近い判断をする事により、より高度でユーザーに優しい情報提供のレベルを保つ事を目的としています。 「スプログチェッカー」は、人間のスパム判定情報をコンピュータに学習させるためのツールです。 一度、コンピュータが判定情報を学習してしまえば、ユーザーが検索した未知のページを自動的にスパムかどうか判定してくれます。

Wikipedia言語間リンクの解析

ウェブ上には様々な言語で書かれた有益な情報が溢れていますが、日本語に絞るとわずか5%しか活用できません。 また個別の情報は充実していても、その関係性が見えない事も多いのです。 当研究室ではWikipediaがもつ膨大な情報を利用し、異なる側面から情報を見える化する事で新たな発見を感じられるようなシステムを研究しています。 「言語間ビジュアライザ」は、日本語キーワードを検索すると、多言語で自動的に関係性を図示し、世の中の動き、関心動向、文化圏の違いなど閲覧者の気づきや発見を促進します。 また「ウェブよくみる」では、画像検索やGoogle翻訳など複数の検索システムを縦横断した結果を一覧表示します。 私たちの研究はまさにマッシュアップ。秀でた技術は利用し、それを集約したりまとめたり、機能を追加する事によって、より役立つ新たなものを生み出そうとしています。

図書館とWebの統合的利用

図書館は信頼性が高く、情報保管サイクルも比較的長くとられます。 反面、知りたい情報に辿り着くには、分類体系などリファレンスの高度なテクニックを必要とする事もあります。 Webは、即時性が高く、間口が広い反面、信頼性の確認が難しく、情報の深度が浅いなど、一長一短の特徴を持っています。 そこでそれらの特徴の中間的な位置づけを持つ、Wikipediaを道しるべとして利用し、求める結果へ、そしてさらに深い情報へとガイドするシステムの研究を行っています。 本研究は企業に成果を利用頂いて、国立国会図書館にも使われています。

株価と新聞記事の関連の解析

毎日株価は変動し、多くの投資家がその動向を見守っています。 そして株の売買には情報の傾向と予測が不可欠です。 そこで、株価と新聞記事の関係性に着目し、記事にどのようなキーワードが頻出した場合、株価はどのような動きをするのか、その傾向を分析します。 その結果を判定手法としてシステムに組み込む事により、閲覧者が知りたい銘柄の株価動向に関連する情報をピックアップし、グラフなどの視覚化や、関連情報の提示など、有益な形で情報を提供できると考えます。 今後はリアルタイム性や、株価の上下を予測表示するなど、ユーザーの株の売買における指標となるようなシステムに発展させていきたいと考えています。

研究室の探索支援システム

人が様々な選択肢の中から1つを選ぶというのは難しいものです。 情報メディア学科の各研究室も共に専門的な分野を扱っている為、学生の進路決定が難しい側面があります。 本研究では、現在知っているキーワードとして教員名や講義名などを入力した結果として、関係性を図示することにより、漠然とした希望を絞り込んだり膨らませたりしながらナビゲートします。 また、1つの分野に固執し視界が狭くなってる学生に対しても、広い視野を提示し、可能性を広げるという側面も持っています。 今持てる情報から連想を繰り返し、情報と嗜好を拡張していく本手法は、研究室選定に限らずあらゆる場面での利用が期待できます。

Web検索語候補推薦の拡張

現在、Web上の情報を検索する手段の大多数を占めるのが文字列ベースの検索です。 ユーザは探したい情報に関連しそうな検索語を用いてGoogleやYahoo!などの検索エンジンから検索を行います。 このとき、より多くのユーザが用いている検索語や旬な検索語を知ることができれば目的の情報に素早くたどり着くことができるかもしれません。 そのため、現在の検索エンジンにはGoogleサジェストやYahoo!関連検索ワードなどの検索語候補推薦システムが用意されています。 これらのシステムを用いることでユーザは入力した文字列に続く語や関連する語を知ることができますが、入力する語の異表記やゆれに対応することができません。 例えば、東京電機大学と電機大は意味的には同義ですが、検索語候補推薦システムはこれらが同義であるという知識を持たないため、別々の候補を提示します。 本研究ではこうした入力文字列の異表記やゆれに対応する検索語候補推薦システムの拡張を行っています。

雰囲気を考慮した献立作成支援システムの開発

料理レシピサイトと呼ばれるサイトが支持を集めています。 料理レシピサイトの中には、単品の料理だけでなく、料理を献立単位でまとめて紹介しているものあります。 ユーザが一食分の献立を考える為にこれらのサイトを利用する際、作りたい料理や「中華風」などの献立の雰囲気をもとに献立を組み立てていきます。 単品料理が紹介されているサイトの場合、献立内の料理の組み合わせをユーザ自身が考える必要があり、労力がかかるほか、適切な組み合わせが得られるとは限りません。 また献立単位で紹介されているサイトであっても、ユーザの嗜好にあった献立を見つけることができるとは限らず、献立に好みではない料理が含まれている場合にも、その料理の入れ替えなどの融通は利かない場合がほとんどです。 そこで本研究では作りたい料理や献立の雰囲気は決まっているが、献立全体を決められないユーザの献立作成を支援することを目的とし、献立全体の雰囲気や作りたい料理を起点とした料理推薦システムを開発しています。

Twitterを用いた議論抽出とSocial-MRCへの応用(仮題)

Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.