開学40周年記念事業

文字サイズ
検索

学部・大学院

ホーム > 学部・大学院 > 教員紹介 > 情報・知能工学系 > 吉田 光男(よしだ みつお)

吉田 光男(よしだ みつお)

所属 情報・知能工学系
兼務
職名 助教
専門分野 ウェブ工学, 計算社会科学, 自然言語処理, 情報検索
学位 博士(工学) (筑波大学)
所属学会 情報処理学会, 人工知能学会, 言語処理学会, 日本データベース学会
E-mail yoshida@cs
※アドレスの末尾に「.tut.ac.jp」を補完してください
研究室web http://www.cs.tut.ac.jp/~yoshida/
研究者情報リンク 研究者情報

研究紹介

ウェブ(インターネット)が誕生してから15年以上が経過し,私たちには欠かせないサービスになりました。ウェブ上には誰かが書いた文書,誰かが撮影した写真・動画,誰かが話した音声など,様々な情報が溢れています。その中でも主に文書(テキスト)および利用者間の関係性(ソーシャルグラフ)に着目し,有益な情報を抽出する研究に取り組んでいます。最近は,ソーシャルメディアのビッグデータを活用し,実社会との関連性を分析しています。民間企業との共同研究も積極的に実施しており,特に新規事業のための研究開発に携わるケースが多いです(自身も起業経験があり,会社代表を兼業しています)

テーマ1:オルトメトリクス: 社会的注目度を反映する研究評価

概要
Ceek.jp Altmetrics (altmetrics.ceek.jp)

ソーシャルメディアによる言及をもとにした,新たな学術文献評価指標の開発に取り組んでいます。この一環として,どのような学術情報が社会的に注目を集めているかを分析するシステムを公開しています(Ceek.jp Altmetrics)。

従来の学術文献評価指標は論文による被引用数をもとにしており,評価者が研究者に限られ,また,計測可能になるまでに長い時間が必要でした。学術文献の読者(活用者)が研究者に限られなくなった今日,研究者以外の注目度も加味した評価指標が望まれています。さらに,科学技術に関する競争が激しくなってきており,科学技術に関する最新の状況を常に把握することで,社会的な動向予測の精度を高めていく必要があります。

日本の学協会誌に掲載された論文1,080,840本を対象に調査したところ,ソーシャルメディアからの言及のある論文は約1~2%でした。分野別では,理工系よりも人文社会系の論文の方がソーシャルメディアで言及される傾向がありました。従来の研究評価指標は理工系に有利であるとの指摘もあり,ソーシャルメディアのデータを利用することで,このような有利不利を補正していきます。

主な業績

吉田光男. 集合知による新たな研究評価. Biophilia. vol.6, no.3, pp.31-37, 2017.
佐藤翔, 吉田光男. レファレンス協同データベースの登録事例から垣間見る日本のレファレンスサービス. カレントアウェアネス. no.332, pp.8-12, 2017.
佐藤翔, 吉田光男. 日本の学協会誌掲載論文のオルトメトリクス付与状況. 情報知識学会誌. vol.27, no.1, pp.23-42, 2017.
吉田光男. ソーシャル言及数で論文に新たな評価軸. 日経ビッグデータ. 2016年6月号(no.28), pp.29, 2016.
佐藤翔, 吉田光男. オルトメトリクスは論文評価を変えるか -ソーシャルメディアで算出する新たな指標-. 月刊「化学」. 2016年2月号(vol.71, no.2), pp.23-28, 2016.(無償公開版
吉田光男. 計量書誌学の新たな挑戦 -国産オルトメトリクス計測サービスの開発-. 情報の科学と技術. vol.64, no.12, pp.501-507, 2014.

キーワード

オルトメトリクス, ソーシャルメディア, 計量書誌学, 図書館情報学

テーマ2:ソーシャルメディアの分析

概要
ユーザ間の地理的距離の分布

ウェブ上のデータ,特にソーシャルメディアのデータをもとに,実社会の情報を再現することを目指しています。実社会の観測は,アンケート調査をはじめとするフィールドワークや,観察対象環境に応じたセンサーを設置するなど,膨大なコストがかかります。最近では,ウェブ上の情報から有益な情報を獲得する試みがなされているものの,インターネット上のユーザには偏りが存在することが指摘されているなど,実社会との関係性は必ずしも明らかではありません。本研究では,ソーシャルメディアのデータにどのような特性があるかを調べ,実社会との関係性を明らかにしていきます。

実社会の友人は近隣(同地域,同組織)に多数存在することに着目し,ウェブ上での友人関係においても,どのような関係データを生成すれば地理的な近傍に友人が存在するかを明らかにしました。さらに,どのようなメカニズムでウェブ上の流行が発生するのかを明らかにするため,ソーシャルメディアで流行情報を言及するユーザはどこでその情報を入手し,どのように拡散しているのかを分析しています。

主な業績

廣中詩織, 吉田光男, 岡部正幸, 梅村恭司. 日本における居住地推定に利用するためのフォロー関係の調査. 人工知能学会論文誌. vol.32, no.1, pp.WII-M_1-11, 2017.
Yuka Kamiko, Mitsuo Yoshida, Hirotada Ohashi, Fujio Toriumi. Uncovering Information Flow Among Users by Time-Series Retweet Data: who is a friend of whom on Twitter?. Proceedings of the 2016 IEEE International Conference on Big Data (Big Data). pp.2500-2504, 2016. (AMiner)
吉田光男, 荒瀬由紀. トレンドキーワードに関するウェブリソースの横断的分析. 情報処理学会論文誌:データベース. vol.9, no.1, pp.20-30, 2016.(無償公開版
吉田光男, 荒瀬由紀, 角田孝昭, 山本幹雄. 検索頻度推定のためのWikipediaページビューデータの分析. 第29回人工知能学会全国大会 (JSAI2015). 2015.
Yuto Yamaguchi, Mitsuo Yoshida, Christos Faloutsos, Hiroyuki Kitagawa. Patterns in Interactive Tagging Networks. Proceedings of the Ninth International AAAI Conference on Web and Social Media (ICWSM-15). pp.513-522, 2015.
Yuto Yamaguchi, Mitsuo Yoshida, Christos Faloutsos, Hiroyuki Kitagawa. Why Do You Follow Him? Multilinear Analysis on Twitter. Proceedings of the 24th International Conference on World Wide Web (WWW '15 Companion). pp.137-138, 2015.

キーワード

ビッグデータ, 計算社会科学, ネットワーク分析, 人工知能

テーマ3:ソーシャルメディアの活用

概要
位置情報付きツイートの分布

ソーシャルメディア(Twitter)が日常的に利用されるようになり,そこには様々な情報が投稿されています。世界中の位置情報付きツイートとリツイートをほぼ全て収集するシステムを構築し,これらのデータの活用を検討しています。

ソーシャルメディアにおける高度なデータマイニングには,どの場所(地域)から投稿されたのかという情報が欠かせません。しかし位置情報が付与された投稿は少なく,投稿内容から投稿位置を推定する必要があります。高精度な推定のために,単語の地理的局所性に着目し,ツイート中のノイズとなる単語を除去するためのフィルタリング手法を提案しました。また,このような位置情報を利用し,観光地や交通路を自動的に抽出する手法も提案しました。

一見,ソーシャルメディアと関係なさそうな課題においても,ソーシャルメディアのデータが有効に機能する場合もあります。例えば,商品名など,急に検索されるようになった検索クエリには,検索エンジンにおいて適切な情報を提示するのが難しいという問題があります。このような検索クエリのカテゴリを推定することができれば,そのクエリに応じた広義な情報を提示できます。急に検索されるようになった検索クエリは,集中的な検索時期以前にソーシャルメディアで言及されることに着目し,このような検索クエリをタイムリーに分類する手法を提案しました。

主な業績

Yuki Kondo, Masatsugu Hangyo, Mitsuo Yoshida, Kyoji Umemura. Home Location Estimation Using Weather Observation Data. The 2017 International Conference On Advanced Informatics: Concepts, Theory And Application (ICAICTA2017). 2017. (arXiv.org)
谷直樹, 風間一洋, 榊剛史, 吉田光男, 斉藤和巳. ジオタグ付きツイートを用いた交通路の抽出法. 情報処理学会論文誌:データベース. vol.10, no.2, pp.31-41, 2017.
Takashi Nicholas Maeda, Mitsuo Yoshida, Fujio Toriumi, Hirotada Ohashi. Decision Tree Analysis of Tourists' Preferences Regarding Tourist Attractions Using Geotag Data from Social Media. Proceedings of the Second International Conference on IoT in Urban Space (Urb-IoT '16). pp.61-64, 2016.
森國泰平, 吉田光男, 岡部正幸, 梅村恭司. ツイート投稿位置推定のための単語フィルタリング手法. 情報処理学会論文誌:データベース. vol.8, no.4, pp.16-26, 2015.(無償公開版
吉田光男, 荒瀬由紀. ラベル伝搬によるトレンドクエリのカテゴリ推定. 人工知能学会論文誌, vol.30, no.1, pp.161-171, 2015.
Mitsuo Yoshida, Yuki Arase. Exploiting Twitter for Spiking Query Classification. Information Retrieval Technology (Lecture Notes in Computer Science). vol.7675, pp.138-149, 2012.(無償公開版

キーワード

ウェブマイニング, データマイニング, 自然言語処理, 情報検索

担当授業科目名(科目コード)

情報・知能工学基礎実験
情報・知能工学実験

その他(受賞、学会役員等)

【受賞】
2017年1月 第3回コミュニケーションクオリティ基礎講座ワークショップ 最優秀研究賞(山口太一, 角田孝昭, 吉田光男, 津川翔, 山本幹雄)
2016年12月 第9回Webインテリジェンスとインタラクション研究会 ステージ発表賞(前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠)
2016年9月 第9回Webとデータベースに関するフォーラム 論文賞runners-up(吉田光男, 荒瀬由紀)
2016年6月 人工知能学会 研究会優秀賞(前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠)
2015年11月 第7回Webインテリジェンスとインタラクション研究会 萌芽研究賞(風間一洋, 谷直樹, 榊剛史, 吉田光男)
2015年11月 第7回Webインテリジェンスとインタラクション研究会 学生奨励賞(前田高志ニコラス, 吉田光男, 鳥海不二夫, 大橋弘忠)
2010年12月 第3回楽天研究開発シンポジウム 最優秀データチャレンジ賞(角田孝昭, 澤田健都, 吉田光男)
2009年11月 楽天研究開発シンポジウム2009 優秀論文賞(吉田光男, 乾孝司, 山本幹雄)
2009年3月 第1回データ工学と情報マネジメントに関するフォーラム 優秀インタラクティブ賞(吉田光男, 山本幹雄)

【メディア掲載】
求められるのは、 ユーザーの疑問や悩みを解決するコンテンツ. 『宣伝会議 2014年12月号』2014年11月01日, pp.38-39, 2014.
検索システム、実力PR(JAPAN ITの異才たち). 『日経産業新聞』2010年05月18日, 6面, 2010.
ネット次世代の原石たち. 『日経クリック』2007年02月08日(日経ベストPC+デジタル, vol.12, no.4), p.21, 2007.

【学会委員】
人工知能学会 代議員
電子情報通信学会 言語理解とコミュニケーション研究会 幹事補佐
Webインテリジェンスとインタラクション研究会 専門委員


ページトップへ