Site Navi

#information retrieval

  • HOME
  • people
  • #information retrieval
  • Tomohiro Manabe, Keishi Tajima,

    Subtopic Ranking Based on Hierarchical Headings

    Proc. of 12th International Conference on Web Information Systems and Technologies,
    Vol.2, pp. 121-130, SciTePress, April 2016 (SciTePress Digital Library)

    Tomohiro Manabe, Keishi Tajima,

    Heading-Aware Proximity Measure and Its Application to Web Search

    DBSJ JournalVol.14, Article No.2,
    pp.1-6, March 2016

    research announcement
    真鍋知博君がAIRS 2015で発表

    2015年12月3日
    真鍋知博君がAIRS 2015で発表

    真鍋知博君が情報検索に関する国際会議の一つであるAsian Information Retrieval Societies Conference (AIRS 2015) で研究発表をしました.論文のタイトルは “Heading-Aware Snippet Generation for Web Search” というもので,Web検索エンジンが検索結果ページにおいて各解の下に表示するする要約(スニペット)を生成する際に,単純に検索キーワードの周辺を抜き出すのではなく,その解ページの論理的階層構造を考慮することで,より効果的なスニペットを生成するという技術に関するものです. 今回の会場はオーストラリアの Brisbane にある Queensland University of Technology でした.ポスター発表の際に使用されていた壁一面の巨大なスクリーンが印象的でした. また,オーストラリアというとコアラやカンガルーというイメージで,Brisbane にも有名なコアラ保護区があるのですが,大学構内にはトキのような鳥が歩いていました.

    Tomohiro Manabe, Keishi Tajima,

    Extracting Logical Hierarchical Structure of HTML Documents Based on Headings

    Proc. of VLDBVol.8, No.12,
    pp.1606-1617, August 2015

    research announcement
    真鍋知博君がVLDB 2015で発表

    2015年9月3日
    真鍋知博君がVLDB 2015で発表

    真鍋知博君が,データベース技術の分野で最も権威のある国際会議の一つであり,今年で41回目となるInternational Conference on Very Large Data Bases (VLDB 2015)で研究発表をしました.研究発表のタイトルは “Extracting Logical Hierarchical Structure of HTML Documents Based on Headings” で,Webページ内の文書の論理的階層構造を自動的に抽出する技術に関するものです.そう聞くと,<h1>, <h2>, … などのタグを抽出すればよいだけなのではないかと思われるかもしれませんが,現在のWebでは,それでは非常に低い再現率でしか論理階層構造を抽出できず,さらには,精度も決して十分ではありません.本研究では,人間の読者はページの視覚的情報を用いて階層構造を理解しているという仮定のもと,視覚的情報を用いて文書の論理的階想像を抽出する手法を提案しています. 今回のVLDBは,多数のトップレベルの研究発表もさることながら,2014年度のチューリング賞を受賞したMichael Stonebraker教授の受賞記念講演が目玉になっていました.講演の様子は下記のYouTubeで見ることができます. 今回の会場は火山で有名なハワイ島のHilton Hotelでした.このホテル,敷地内にビーチやいくつものプールがありイルカまでいる巨大なホテルです.あまりに大きいので,ホテル内を移動するための路面電車が走っていました. 海や火山の自然も素晴らしいところだったのですが,Michal Stonebraker教授は飛行機が嫌いでUC BarkleyからMITに移籍する際にも自転車でアメリカを横断して引っ越したそうで,ハワイについても「世界中のどこからも遠い場所」と愚痴を言っていました.

    Hikaru Takemura, Keishi Tajima,

    Tweet Classification Based on Their Lifetime Duration

    Proc. of 21st ACM International Conference on Information and Knowledge Management,
    pp. 2367-2370, ACM Press, October 2012 (ACM DL)

    Masahiro Inoue, Keishi Tajima,

    Noise Robust Detection of the Emergence and Spread of Topics on the Web

    Proc. of 2nd Temporal Web Analytics Workshop (in conj. with WWW Conf.),
    pp. 9-16, ACM Press, April 2012 (ACM DL)

    research announcement

    2011年5月17日
    真鍋知博君が電子情報通信学会DEIM 2011で優秀論文賞

    真鍋知博君と教員の田島敬史の共著論文が電子情報通信学会第3回データ工学と情報マネジメントに関するフォーラム (DEIM 2011) で優秀論文賞を受賞しました(発表322件中,最優秀2件,優秀2件). 論文タイトルは「Webページ中のノード間の論理的関係の発見」で,Webページ中の各ブロックの間の論理的関係を自動推定する技術に関するものです.

    徳田 隆志, 田島 敬史,

    「XMLタグの文書構造上の役割に関する自動分類」

    日本データベース学会論文誌Vol. 8, No. 1,
    pp. 53-58, June 2009