情報処理2010年1月号

ブログからの地域イベント情報抽出

方法
  1. 地名をクエリとして検索し、ブログエントリを抽出。NGワードを含むスパムコメントは除去
  2. IDFにより重みづけした文書ベクトルを生成。コサイン類似度を用いた凝集型買いそうクラスタリングを行う。分類された各クラスタからC-value法により話題の代表語を抽出。
  3. 生起時刻の近い文書が同一クラスタを形成しやすいように再度クラスタリング
  4. 直近の期間に含まれる文書数の、全文書数に対する割合によって「ホットな話題」を判断。同じ期間に別の地域で同一の話題クラスタが形成されるようであれば地域性の低い話題と判断して除外。
結果
  • 土地ベースでのイベント発見率は8割弱
  • ブログを読むことでユーザがイベントを認識できる率は7割弱
  • 抽出キーワードのみでユーザがイベントを認識できる率は4割弱
今後の展開
  • 新たな情報ソース
  • 情報の提示手段
    • ARとか

他、気になった記事とか

  • 常時ユーザ認証
    • 視線誘導によるなりすまし検知
    • 画面に常時ユーザ自身の顔写真を表示しておき、しかもちょっとづつ落書きし続けるというなんともぶっ飛んでて面白い手法
    • 興味のある顔にはどうしても目がいってしまうという人の性質を利用したもの
      • なりすました人間にとって「ユーザ自身の顔」というのは赤の他人でしかないから興味を引かない
  • メディアとしての香り
    • 香り演出に、ズームイン・ズームアウトの演出を加えて「香りの空間距離」を演出するという、これまたぶっ飛んだ研究。
    • キヤノンの研究者がやっているというのも面白い。香料の散布にインクジェットを使うとか。
  • 無線ネットワーク技術を用いた災害時救命救急支援
    • iPod Touch を用いた救急医療。患者にタッチすることでその患者の電子タグIDを取得し、生体情報等を取得するなど。