研究内容
自然言語処理の研究をしています.計算機上の知識表現(記号的なもの,分散的なもの問わず),知識の自動獲得,よいスキーマデザイン,Factual Knowledge,質問応答システムなどに興味を持っています.
以前は地理空間上の実体を指し示す言語表現を実体に結びつけることで,テキスト情報を時間・空間上で整理する研究もしていました.
キーワード : 固有表現,エンティティリンキング,知識表現,知識獲得,質問応答システム
エンティティメンションに対する意味解析

エンティティリンキング

テキスト上の表現が指す地理空間上の実体の識別

テキスト情報の時間・空間上での俯瞰

Publications
Google Scholarのプロフィールもご覧ください.
Journal papers
- Koji Matsuda, Akira Sasaki, Naoaki Okazaki and Kentato Inui. Geographical Entity Annotated Corpus of Japanese Microblogs. Journal of Information Processing Vol. 25, pp.121-130, January 2017. (DOI: 10.2197/ipsjjip.25.121)
International Conferences/Workshops
- Koji Matsuda, Mizuki Sango, Naoaki Okazaki and Kentaro Inui. Monitoring Geographical Entities with Temporal Awareness in Tweets. 12 pages. 18th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing 2017). April 2017.
- Koji Matsuda, Akira Sasaki, Naoaki Okazaki and Kentaro Inui. Annotating Geographical Entities on Microblog Text. The 9th Linguistic Annotation Workshop (LAW IX 2015). June 2015.
Domestic Conferences/Workshops
- 松田耕史, 鈴木正敏, 乾健太郎. Wikidata からの遠距離教師あり学習に基づく大規模関係知識獲得. 言語処理学会第25回年次大会(NLP2019). March 2019. 最優秀ポスター賞 (53発表中の1件) 受賞
- 松田耕史, 岡崎直観, 乾健太郎. クラウドソーシングを系に組み込んだテキストからの関係知識抽出. NLP若手の会 (YANS) 第12回シンポジウム, September 2017.
- 松田耕史, 岡崎直観, 乾健太郎. 日本語 wikificationツールキット: jawikify. 言語処理学会第23回年次大会(NLP2017), March 2017.
- 松田 耕史, 佐々木 彬, 岡崎 直観, 乾 健太郎. 場所参照表現タグ付きコーパスの構築と評価. 情報処理学会研究報告 自然言語処理(NL), 2015-NL-220(12), pp.1-10, January 2015.
- 松田 耕史, 高村 大也, 奥村 学. 知識ベースに基づいた語義曖昧性解消における教師データの活用. 人工知能学会全国大会論文集 26, 1-4, 2012
- 松田 耕史, 山本悠二, 酒井浩之, 増山 繁. Weblog内のリンクに対する感情推定の試み ~ Webコミュニティ発見法改善の基礎として ~ . 言語理解とコミュニケーション研究会(NLC). NLC2005-116. pp.13-18
Casual Talks
- 松田耕史. 論文紹介 : Neural Relation Extraction for Knowledge Base Enrichment (ACL2019) . 第10回最先端NLP勉強会. 2019. Slides (speakerdeck)
- 松田耕史. 論文紹介 : Training Classifiers with Natural Language Explanations (ACL2018) . 第9回最先端NLP勉強会. 2018. Slides (speakerdeck)
- 松田耕史. 論文紹介 : Reading Wikipedia to Answer Open-Domain Questions (ACL2017) & & Heterogeneous Supervision for Relation Extraction: A Representation Learning Approach (EMNLP 2017). 第9回最先端NLP勉強会. 2017 Slides (slideshare)
- 松田耕史. KB + Text => Great KB な論文を多読してみた. 乾・岡崎研勉強会. 2017. Slides (slideshare)
- 松田耕史. 「今日から使い切る」ための GNU Parallelによる並列処理入門. 乾・岡崎研勉強会. 2017. Slides (slideshare) (>15000 views)
- 松田耕史. 論文紹介 : Large-Scale Information Extraction from Textual Definitions (TACL 2015). 第8回最先端NLP勉強会. 2016. Slides (slideshare)
- 松田耕史. 知識を紡ぐための言語処理と,そのための言語資源. NEologd Casual Talks. April 2016. Slides (slideshare)
- 松田耕史. 論文紹介 : Compositional Semantic Parsing on Semi-Structured Tables (ACL 2015). 第7回最先端NLP勉強会. 2015. Slides
- 松田耕史. 論文紹介 : Entity Linking meets Word Sense Disambiguation: a Unified Approach(TACL 2014). 第6回最先端NLP勉強会. 2014. Slides(slideshare)
- 松田耕史. いまさら聞けない “モデル” の話 . DSIRNLP#5. 2014. Slides (slideshare) Video (youtube) 西川賞(?)受賞
- 松田耕史. 論文紹介 : Align, Disambiguate and Walk: A Unified Approach for Measuring Semantic Similarity(ACL 2013). 第5回最先端NLP勉強会. 2013.Slides(slideshare)
- 松田耕史. 論文紹介 : Joint Modeling of a Matrix with Associated Text via Latent Binary Features (NIPS 2012). すずかけ論文読み会. Augsut 2013. Slides (slideshare)
- 松田耕史. 論文紹介 : Vanishing Component Analysis(ICML 2013). すずかけ論文読み会#4. 2013. Slides(slideshare) (>20000 views)
- 松田耕史. 論文紹介 : Vanishing Component Analysis(ICML 2013). ICML2013読み会. 2013.Slides(slideshare)
- 松田耕史. 論文紹介 : Practical recommendations for gradient-based training of deep architectures. すずかけ論文読み会#6. 2013.Slides (slideshare) (>40000 views) (内容は古いので気をつけてください)
- 松田耕史. 論文紹介 : A Machine Learning Framework for Programming by Example (ICML 2013). すずかけ論文読み会. June 2013. Slides (slideshare)
- 松田耕史. 論文紹介 : Information-Theoretic Metric Learning (ICML 2007). すずかけ論文読み会. April 2013. Slides (slideshare) (>15000 views)
- 松田耕史. 論文紹介 : Unified Expectation Maximization (NAACL 2012). すずかけ論文読み会. March 2013. Slides (slideshare)
- 松田耕史. 気軽にはじめる Web アプリケーションプログラミング. 第38回 情報科学若手の会. 2005. 開催記録
その他・招待講演/パネル参加など
- 鈴木 潤, 松田耕史, 鈴木正敏, 加藤拓真, 宮脇峻平, 西田京介. ライブコンペティション:「AI王~クイズAI日本一決定戦~」. 自然言語処理 2021 年 9 月(学会記事). (招待有り)
- 松田耕史. エンティティリンキング技術に基づいた地理情報と言語情報の融合解析. 情報処理学会第79回全国大会 特別企画 「情報力」で街を変える 〜ビッグデータ利活用技術開発とその社会実装〜. March 2017. (研究概要紹介とパネルディスカッション登壇) archive
- 松田耕史. 統計的手法による Web 検索補助システム Seezle の開発. 平成15年度未踏開発ソフトウェア創造事業. 成果報告書. 2003. archive
公開データセット
- JAQKET:クイズを題材にした日本語QAデータセット
- 解答可能性付き読解データセット(鈴木正敏さんとの共同研究)
- 日本語 Temporal Awareness コーパス (珊瑚彩主紀さんとの共同研究)
- 日本語 Wikification コーパス (Jargalsaikhan Davaajavさんとの共同研究)
- 日本語 Wikipedia エンティティベクトル (鈴木正敏さんとの共同研究)
- 場所参照表現タグ付きコーパス (佐々木彬さんとの共同研究)
Awards
- 委員特別賞. 言語処理学会第28回全国大会(NLP2022). March 2022.
- 委員特別賞. 言語処理学会第27回全国大会(NLP2021). March 2021.
- 優秀賞. 言語処理学会第26回全国大会(NLP2020). March 2020. (396発表中の8件)
- 優秀研究賞. 情報処理学会 第241回自然言語処理研究会. August 2019. (28発表中の3件)
- 第45回リバネス研究費 日本の研究.com賞 採択. 2019.
- 最優秀ポスター賞. 言語処理学会第25回年次大会(NLP2019). March 2019. (53発表中の1件)
- 優秀賞. 第9回対話システムシンポジウム. November 2018.
- 宮城工業高等専門学校 学術賞(学長表彰). March 2003.
- 未踏ソフトウェア創造事業 採択 (当時史上最年少採択). 2002. 開発概要
Academic Activities
- Reviewer: 情報処理学会ジャーナル(2007, 2018, 2020), 電子情報通信学会和文論文誌D(2016), AAAI(2017) IJCAI(2016), IEEE Access (2019, 2021)
- 実行委員:
- AI王 〜クイズAI日本一決定戦〜 (2020)
- 森羅 SHINRA Wikipedia 構造化プロジェクト (2018, 2019, 2020-ML, 2020-JP)
Other Interests
- Hiking: I love Mt. Adatara and Mt. Hayachine.
- Listening to music: sleepy.ab, syrup16g, Sigur Rós, Fishmans, サニーデイ・サービス, cero, toe, ゆらゆら帝国, Yogee New Waves, 青葉市子, the band apart etc...
- Driving: Peugeot 308 (first generation). In past, I owned Peugeot 306.
- Apple Products: I’m using MacBook Pro and iPhone.
- Reading:
- Contemporary one: Toshiyuki Horie, Paul Auster.
- Legendary one: TBA.
- Learning philosophy: Now I am into David Benatar's theory of meaning (or meaninglessness) of life. Especially, I'm attracted to the theory of asymmetry between pain and pleasure. (Note: I don't entirely agree with that theory, but it is very intersting.)
Contact
〒980-8579 宮城県仙台市青葉区荒巻字青葉6-6-05 東北大学工学研究科 電子情報システム・応物系1号館6階 乾研究室
Communication Science Laboratory 6-6-05 Aramaki Aza Aoba, Aobaku, Sendai, Miyagi 980-8579, Japan
Mail: matsuda at ecei.tohoku.ac.jp
Twitter: @conditional