【概要】
数量表現が含意現象に関わってくる事例をRTEコーパスから抽出し、問題を分類したもの


history :
2012.3 言語処理学会用にデータを分析。言語処理学会で発表（「数量表現を伴う文における含意関係認識の課題分析」）
2013.2 国際学会用にデータを再分類（前の分類が色々雑だったので）
2013.3 データ公開


【対象コーパス】
RITE1のMC,BCのtest,devセット
http://artigas.lti.cs.cmu.edu/rite/Main_Page

京都大学 Textual Entailment 評価データ
http://nlp.ist.i.kyoto-u.ac.jp/index.php?Textual%20Entailment%20%E8%A9%95%E4%BE%A1%E3%83%87%E3%83%BC%E3%82%BF


【中身】
rte_analysis.xlsx : 問題を分析したもの。以下の3シートを含みます。


1. RITE+京大コーパスの事例をそのまま抽出したもの。
t1,t2のどちらかに数量表現を含むもの、または数量的な推論が関係してくると考えられるものに「1」をアノテートしています。
※将来的には時間表現についても分析を行う予定のため、時間表現に対するアノテートとして「2」もアノテートされています（ただし、完全にアノテートし終わっていません）
※RITEのexam, QAについても抽出してありますが、分析対象には結局していません


2. 1から数量表現を含む文（「1」をアノテートされたもの）を抽出したもの
これについて簡単な分析を行い、数量表現を含むものの、含意現象には関係ないものに「n」をアノテートしています
（例：「二人は無理心中した」「二人は死んだ」　無理心中と死んだの関係が問題になる事例であり、二人という数量表現は含意現象に関係がない）


3. 2から「n」以外のものを抽出し、分析をしたもの
