Koji Matsuda / 松田 耕史

理化学研究所 革新知能統合研究センター 自然言語理解チーム テクニカルスタッフ

東北大学 大学院 情報科学研究科 乾・鈴木研究室 博士課程

研究内容

自然言語処理の研究をしています。現在は地理空間上の実体を指し示す言語表現に焦点を当て、実体に結びつけることで、 テキスト情報を時間・空間上で整理することを目標にしています。

キーワード : 固有表現、エンティティリンキング、地理情報、災害対応、情報俯瞰、ソーシャルメディア、空間統計

エンティティメンションに対する意味解析

エンティティリンキング

テキスト上の表現が指す地理空間上の実体の識別

テキスト情報の時間・空間上での俯瞰

Publications

Google Scholarのプロフィールもご覧ください.

Journal papers

  1. 鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎. データ指向型アプローチによるクローズドブック質問応答. 自然言語処理. 28巻1号, March 2021. (forthcoming)
  2. Diana Galvan-Sosa, Koji Matsuda, Naoaki Okazaki and Kentaro Inui. An Empirical Exploration of the Challenges in Temporal Relation Extraction from Clinical Text. Journal of Natural Language Processing, Vol.27 No.2, June 2020. (DOI: 10.5715/jnlp.27.383)
  3. Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki and Kentaro Inui. A Joint Neural Model for Fine-Grained Named Entity Classification of Wikipedia Articles. IEICE Transactions on Information and Systems, Vol. E101-D, No.1, pp.73-81, January 2018. (DOI: 10.1587/transinf.2017SWP0005)
  4. Shuangshuang Zhou, Naoaki Okazaki, Koji Matsuda, Ran Tian and Kentaro Inui. Supervised Approaches for Japanese Wikification. Journal of Information Processing Vol. 25 pp.341-350, April 2017. (DOI: 10.2197/ipsjjip.25.341)
  5. Koji Matsuda, Akira Sasaki, Naoaki Okazaki and Kentato Inui. Geographical Entity Annotated Corpus of Japanese Microblogs. Journal of Information Processing Vol. 25, pp.121-130, January 2017. (DOI: 10.2197/ipsjjip.25.121)

International Conferences/Workshops

  1. Diana Galvan-Sosa, Jun Suzuki, Kyosuke Nishida, Koji Matsuda and Kentaro Inui. Seeing the world through text: Evaluating image descriptions for commonsense reasoning in machine reading comprehension. The Second Workshop on Beyond Vision and LANguage: inTEgrating Real-world kNowledge (LANTERN 2020). December 2020. (forthcoming)
  2. Diana Galvan, Naoaki Okazaki, Koji Matsuda and Kentaro Inui. Investigating the Challenges of Temporal Relation Extraction from Clinical Text. In Proceedings of the Ninth International Workshop on Health Text Mining and Information Analysis (LOUHI 2018), pp.55-64, October 2018.
  3. Koji Matsuda, Mizuki Sango, Naoaki Okazaki and Kentaro Inui. Monitoring Geographical Entities with Temporal Awareness in Tweets. 12 pages. 18th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing 2017). April 2017.
  4. Yusuke Hara, Koji Matsuda, Masao Kuwahara, Naoaki Okazaki and Kentaro Inui. Traffic State Estimation and Cause and Effect Understanding by Probe Data and Social Media Data. In Proceedings of the 21st International Conference of Hong Kong Society for Transportation Studies, Smart Transportation, December 2016.
  5. Shuangshuang Zhou, Koji Matsuda, Ran Tian, Naoaki Okazaki and Kentaro Inui. A Pipeline Japanese Entity Linking System with Embedding Features. 10 pages. The 30th Pacific Asia Conference on Language, Information and Computation (PACLIC 30). Oct 2016.
  6. Masatoshi Suzuki, Koji Matsuda, Satoshi Sekine, Naoaki Okazaki and Kentaro Inui, Neural Joint Learning for Classifying Wikipedia Articles into Fine-grained Named Entity Types. 10 pages. The 30th Pacific Asia Conference on Language, Information and Computation (PACLIC 30). Oct 2016.
  7. Masatoshi Suzuki, Koji Matuda, Satoshi Sekine, Naoaki Okazaki, and Kentaro Inui, Multi-label Classification of Wikipedia Articles into Fine-grained Named Entity Types. 4 pages. 2016 IEEE/WIC/ACM International Conference on Web Intelligence (WI'16). Oct 2016.
  8. Davaajav Jargalsaikhan, Naoaki Okazaki, Koji Matsuda and Kentaro Inui. Building a Corpus for Japanese Wikification with Fine-Grained Entity Classes. ACL 2016 Student Research Workshop. pp 138–144. Aug 2016.
  9. Koji Matsuda, Akira Sasaki, Naoaki Okazaki and Kentaro Inui. Annotating Geographical Entities on Microblog Text. The 9th Linguistic Annotation Workshop (LAW IX 2015). June 2015.

Domestic Conferences/Workshops

  1. Diana Galvan-Sosa, 西田京介, 松田耕史, 鈴木潤, 乾健太郎. テキストを通して世界を見る:機械読解における常識的推論のための画像説明文の評価. 言語処理学会第26回全国大会. March 2020. 優秀賞(396発表中の8件) 受賞
  2. 鈴木正敏, 鈴木潤, 松田耕史, 西田京介, 鈴木潤, 井之上直也. JAQKET: クイズを題材にした日本語QAデータセットの構築. 言語処理学会第26回全国大会. March 2020. データセット / AI王〜クイズAI日本一決定戦〜 参加者大募集中!
  3. 鈴木正敏, 松田耕史, 大内啓樹, 鈴木潤, 乾健太郎. クイズ解答タスクにおける大規模ラベルなしコーパスの利用: 言語モデルとデータ拡張. 情報処理学会 第241回自然言語処理研究会, 9 pages, August 2019. 優秀研究賞(28発表中の3件) 受賞
  4. 松田耕史, 鈴木正敏, 乾健太郎. Wikidata からの遠距離教師あり学習に基づく大規模関係知識獲得. 言語処理学会第25回年次大会(NLP2019). March 2019. 最優秀ポスター賞 (53発表中の1件) 受賞
  5. 佐藤拓海, 大内啓樹, 松田耕史, 鈴木正敏, 鈴木潤, 乾健太郎. 強化学習によるプログラム生成のためのプログラム系列分析. 言語処理学会第25回年次大会(NLP2019). March 2019.
  6. 阿部香央莉, 佐藤志貴, 佐藤拓海, 藤井諒, 松田耕史, 鈴木正敏, 山口健史, 赤間怜奈, 大内啓樹, 鈴木潤, 乾健太郎. Zunkobot: 複数の知識モジュールを統合した雑談対話システム. 対話システムライブコンペティション. 第9回対話システムシンポジウム. November 2018. 優秀賞 受賞
  7. 関根聡,安藤まや,小林暁雄,松田耕史,鈴木正敏,乾健太郎. 「拡張固有表表現+Wikipedia」データ(2015年11月版Wikipedia 分類作業完成版). 言語処理学会第24回年次大会(NLP2018). March 2018.
  8. 伊藤拓海, 山口健史, 田然, 松田耕史, 岡崎直観, 乾健太郎. 自治体FAQの比較マイニング. 言語処理学会第24回年次大会(NLP2018). March 2018.
  9. 鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎. 読解による解答可能性を付与した質問応答データセットの構築.言語処理学会第24回年次大会(NLP2018). March 2018. 筆頭著者の鈴木さんが若手奨励賞を受賞
  10. 鈴木正敏, 松田耕史, 岡崎直観, 乾健太郎. Wikipedia を知識源に用いた文書検索と読解によるクイズ解答システム. NLP若手の会 (YANS) 第12回シンポジウム, September 2017.
  11. 中村拓, 田然, 松田耕史, 乾健太郎. 分散表現から感情極性は予測できるか?. NLP若手の会 (YANS) 第12回シンポジウム, September 2017.
  12. 鶴田崇仁, 松田耕史, 乾健太郎. 大規模Web小説コーパスにおける発話と発話文脈の関係分析. NLP若手の会 (YANS) 第12回シンポジウム, September 2017.
  13. 白井穂乃, 田然, 松田耕史, 乾健太郎. コノテーションに基づいた名詞の感情極性の予測. NLP若手の会 (YANS) 第12回シンポジウム, September 2017.
  14. 松田耕史, 岡崎直観, 乾健太郎. クラウドソーシングを系に組み込んだテキストからの関係知識抽出. NLP若手の会 (YANS) 第12回シンポジウム, September 2017.
  15. 松田耕史, 岡崎直観, 乾健太郎. 日本語 wikificationツールキット: jawikify. 言語処理学会第23回年次大会(NLP2017), March 2017.
  16. 栗原理聡, 水本智也, 松田耕史. 地理情報に対する実体験に焦点を当てた意見抽出に向けて 第11回NLP若手の会 シンポジウム, September 2016.
  17. 鶴田崇仁, 松田耕史, 岡崎直観, 乾健太郎. seq2seqモデルに基づく略語の自動生成 第11回NLP若手の会 シンポジウム, September 2016.
  18. 珊瑚 彩主紀, 松田耕史, 岡崎直観, 乾健太郎. ツイート中の地理情報に対する時間的極性の自動推定. 4 pages, 人工知能学会全国大会(第30回), June 2016.
  19. 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎. Wikipedia記事に対する拡張固有表現ラベルの多重付与. pp.797-800, 言語処理学会第22回年次大会, March 2016.
  20. Davaajav Jargalsaikhan, 岡崎直観, 松田耕史, 乾健太郎. 日本語Wikificationコーパスの構築に向けて. pp.793-796, 言語処理学会第22回年次大会, March 2016.
  21. 関根聡, 安藤まや, 松田耕史, 鈴木正敏, 乾健太郎. 「拡張固有表表現+Wikipedia」データ. pp.41-44, 言語処理学会第22回年次大会, March 2016.
  22. 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎. Wikipediaエントリの拡張固有表現階層への自動分類. 第10回NLP若手の会 シンポジウム, September 2015.
  23. 栗原 理聡, 佐々木 彬, 松田 耕史, 岡崎 直観, 乾 健太郎. Twitterを利用した地域毎の要望抽出. 人工知能学会全国大会, June 2015
  24. 原 祐輔, 松田 耕史, 川崎 洋輔, 三谷 卓摩, 桑原 雅夫. ProbeとTweetを用いたマルチリソースによる潜在交通状態推定. 第51回土木計画学研究発表会(春大会)June 2015.
  25. 松田 耕史, 佐々木 彬, 岡崎 直観, 乾 健太郎. 場所参照表現タグ付きコーパスの構築と評価. 情報処理学会研究報告 自然言語処理(NL), 2015-NL-220(12), pp.1-10, January 2015.
  26. 松田 耕史, 高村 大也, 奥村 学. 知識ベースに基づいた語義曖昧性解消における教師データの活用. 人工知能学会全国大会論文集 26, 1-4, 2012
  27. 松田 耕史, 山本悠二, 酒井浩之, 増山 繁. Weblog内のリンクに対する感情推定の試み ~ Webコミュニティ発見法改善の基礎として ~ . 言語理解とコミュニケーション研究会(NLC). NLC2005-116. pp.13-18

Casual Talks

  1. 論文紹介 : Entity Linking meets Word Sense Disambiguation: a Unified Approach(TACL 2014). 第6回最先端NLP勉強会. 2014. Slides(slideshare)
  2. 論文紹介 : Align, Disambiguate and Walk: A Unified Approach for Measuring Semantic Similarity(ACL 2013). 第5回最先端NLP勉強会. 2013.Slides(slideshare)
  3. いまさら聞けない “モデル” の話 . DSIRNLP#5 Slides(slideshare)
  4. 論文紹介 : Vanishing Component Analysis(ICML 2013). すずかけ論文読み会#4. 2013. Slides(slideshare)
  5. 論文紹介 : Vanishing Component Analysis(ICML 2013). ICML2013読み会. 2013.Slides(slideshare)
  6. 論文紹介 : Practical recommendations for gradient-based training of deep architectures. すずかけ論文読み会#6. 2013.

公開データセット

  1. JAQKET:クイズを題材にした日本語QAデータセット
  2. 解答可能性付き読解データセット(鈴木正敏さんとの共同研究)
  3. 日本語 Temporal Awareness コーパス (珊瑚彩主紀さんとの共同研究)
  4. 日本語 Wikification コーパス (Jargalsaikhan Davaajavさんとの共同研究)
  5. 日本語 Wikipedia エンティティベクトル (鈴木正敏さんとの共同研究)
  6. 場所参照表現タグ付きコーパス (佐々木彬さんとの共同研究)

Contact

〒980-8579
宮城県仙台市青葉区荒巻字青葉6-6-05
東北大学工学研究科 電子情報システム・応物系1号館6階
乾・鈴木研究室
Communication Science Laboratory
6-6-05 Aramaki Aza Aoba, Aobaku, Sendai, Miyagi 980-8579, Japan

Mail: matsuda at ecei.tohoku.ac.jp
Twitter: @conditional