Site Navi

2019年10月16日 掲載

廖子揚君が Web Intelligence に関する国際会議IEEE/WIC/ACM Web Intelligence で研究成果を発表

Web Intelligence に関する国際会議である IEEE/WIC/ACM Web Intelligence 2019 で廖子揚君が研究成果を発表しました.

廖君の論文は “Disjunctive Sets of Phrase Queries for Diverse Query Suggestion” というタイトルで,Web 検索などの文書検索において,検索が複数の意味に解釈でき,自分の意図はそのうちのマイナーなものである時に,検索結果はメジャーな方の意図に関する文書ばかりになってしまうという場合の問題を解決しようという研究についてのものです.

例えば,ある人が余ったリンゴで肥料を作れないかと考え「リンゴ 肥料」という検索を行ったとします.しかし,この検索は「リンゴのための肥料」という意味に解釈でき,かつ,その方が「リンゴから肥料を作る」というトピックよりはるかに一般的なトピックであるため,検索結果の上位200件は全て「リンゴのための肥料」に関するものになってしまいます.

そのような場合,われわれがよく行うのは「リンゴから肥料」「リンゴで肥料を」などの自分の意図に合う文書にのみ出てくることが期待されるフレーズを色々と考えて,これらを使ったフレーズ検索(Googleなどで,複数の語からなる検索フレーズを二重引用符で囲み,そのフレーズ全体が正確にマッチする文書だけを検索する方法)を一つずつ試してみることです.しかし,そのようなフレーズは数多くあり,手動で一つずつ試していくのはたいへん手間がかかります.

そこで,今回提案する手法では,ユーザが「リンゴ 肥料」という検索を行って検索結果が自分の意図とは異なるものばかりであった場合に,「フレーズ生成」機能を実行してもらいます.すると,システムは「リンゴ」と「肥料」をつなぐフレーズを大量にWebから取得し,かつ,それらをクラスタリングして複数のグループに分け,それらをユーザに呈示します.例えば,

  • 「リンゴに肥料」「リンゴへの肥料」など,リンゴへ肥料をあげる話に関するフレーズからなるグループと
  • 「リンゴから肥料」「リンゴを肥料に」など,リンゴから肥料を作る話に関するフレーズからなるグループ

ができたとします.これらを呈示されたユーザが後者を選んだ場合,システムが自動的にこのグループに含まれる全てのフレーズを順に使って検索を行い,それらの結果全てを一つのランキングにして表示します.これにより,ユーザがフレーズを数多く考えて一つずつ試していく作業を自動化することができます.

今回の開催地はテッサロニキというギリシャ第二の都市です.テッサロニキの「ニキ」は,Nikeというブランド名の語源であるギリシャの勝利の女神「ニケ」と同じ言葉だそうです.

上の写真は,下の写真に写っている古い塔の屋上から撮ったもので,この塔がこの街のシンボルになっているようです.

このテッサロニキ,野良猫と大きな野良犬がたくさんいます.大きな野良犬は,イスタンブールやチリのサンティアゴなどにもいますが,こんなに野良猫が多い場所は日本(特に京大総合研究7号館周辺)以外では初めて見ました.

 
 
 

テッサロキには世界遺産の遺跡も多くありますが,遺跡の中にも野良猫がいっぱいいます.

 

 

こちらは犬.

 

 

 

レストランの前にもいますが誰も気にしません.周囲のレストランをうろうろ回っていたので,誰かの飼い犬ということはなさそうです.

ところで,下の写真はテッサロニキのスーパーで売っていたチョコレートです.このパッケージに書かれた花の絵を見て何味だと思いますか?桜味?正解はこちら.ギリシャの人はこの絵を見て「ああ,〇〇チョコレートね」と思うのでしょうか.

 

こちらは,同じスーパーで売られていた謎の米.イタリア製のようです.

 

やはり同じスーパーに売っていた見ざる,聞かざる,言わざる.同じモールにあったピザ屋のロゴも見ざる,聞かざる,言わざるでした.

 

海辺の町なので,やはり海産物が多く食べられます.