wiki:解析結果xml

日本語サブタスク(BC,MC,大学入試)において提供される,データの自動解析結果のサンプルです.

t1として「川端康成は「雪国」などの作品でノーベル文学賞を受賞した。」,t2として「川端康成「雪国」の著者である。」という文を,MeCabとCabochaによって解析した結果が,以下のXMLとして得られます.ドライランデータおよびフォーマルランデータのXMLフォーマットに加えて,Senteceタグで囲まれた部分が解析結果です.

<?xml version='1.0' encoding='UTF-8' standalone='no' ?>
<!DOCTYPE dataset PUBLIC "-//Tohoku University//DTD statistics for sentence in RTE//EN" "http://www.cl.ecei.tohoku.ac.jp/rite2/dtd/dataset.dtd">
<dataset type='bc'>
  <pair id='1' label='Y'>
    <t1>
      川端康成は「雪国」などの作品でノーベル文学賞を受賞した。
      <Sentence id="sample_t1" role="text" text="川端康成は「雪国」などの作品でノーベル文学賞を受賞した。">
        <Annotation tool="MeCab" ver="0.994"/>
        <Annotation tool="CaboCha" ver="0.64"/>
        <Annotation tool="UniDic" ver="1.3.12"/>
        <Chunk head="c4" id="c0" score="2.473067" type="D">
          <Token aConType="*" aModType="*" aType="0,2" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="カワバタ" goshu="固" iConType="*" iForm="*" iType="*" id="0" kana="カワバタ" kanaBase="カワバタ" lForm="カワバタ" lemma="カワバタ" ne="B-PERSON" orig="川端" orth="川端" orthBase="川端" pos1="名詞" pos2="固有名詞" pos3="人名" pos4="姓" pron="カワバタ" pronBase="カワバタ" surf="川端"/>
          <Token aConType="*" aModType="*" aType="2" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ヤスナリ" goshu="固" iConType="*" iForm="*" iType="*" id="1" kana="ヤスナリ" kanaBase="ヤスナリ" lForm="ヤスナリ" lemma="ヤスナリ" ne="I-PERSON" orig="康成" orth="康成" orthBase="康成" pos1="名詞" pos2="固有名詞" pos3="人名" pos4="名" pron="ヤスナリ" pronBase="ヤスナリ" surf="康成"/>
          <Token aConType="動詞%F2@0,名詞%F1,形容詞%F2@-1" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ハ" goshu="和" iConType="*" iForm="*" iType="*" id="2" kana="ハ" kanaBase="ハ" lForm="ハ" lemma="は" ne="O" orig="は" orth="は" orthBase="は" pos1="助詞" pos2="係助詞" pos3="*" pos4="*" pron="ワ" pronBase="ワ" surf="は"/>
        </Chunk>
        <Chunk head="c2" id="c1" score="1.368909" type="D">
          <Token aConType="*" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="" goshu="記号" iConType="*" iForm="*" iType="*" id="3" kana="" kanaBase="" lForm="" lemma="「" ne="O" orig="「" orth="「" orthBase="「" pos1="補助記号" pos2="括弧開" pos3="*" pos4="*" pron="" pronBase="" surf="「"/>
          <Token aConType="C1" aModType="*" aType="2" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ユキグニ" goshu="和" iConType="*" iForm="*" iType="*" id="4" kana="ユキグニ" kanaBase="ユキグニ" lForm="ユキグニ" lemma="雪国" ne="O" orig="雪国" orth="雪国" orthBase="雪国" pos1="名詞" pos2="普通名詞" pos3="一般" pos4="*" pron="ユキグニ" pronBase="ユキグニ" surf="雪国"/>
          <Token aConType="*" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="" goshu="記号" iConType="*" iForm="*" iType="*" id="5" kana="" kanaBase="" lForm="" lemma="」" ne="O" orig="」" orth="」" orthBase="」" pos1="補助記号" pos2="括弧閉" pos3="*" pos4="*" pron="" pronBase="" surf="」"/>
          <Token aConType="名詞%F2@1,形容詞%F2@-1,動詞%F2@0" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ナド" goshu="和" iConType="*" iForm="*" iType="*" id="6" kana="ナド" kanaBase="ナド" lForm="ナド" lemma="など" ne="O" orig="など" orth="など" orthBase="など" pos1="助詞" pos2="副助詞" pos3="*" pos4="*" pron="ナド" pronBase="ナド" surf="など"/>
          <Token aConType="名詞%F1" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ノ" goshu="和" iConType="*" iForm="*" iType="*" id="7" kana="ノ" kanaBase="ノ" lForm="ノ" lemma="の" ne="O" orig="の" orth="の" orthBase="の" pos1="助詞" pos2="格助詞" pos3="*" pos4="*" pron="ノ" pronBase="ノ" surf="の"/>
        </Chunk>
        <Chunk head="c4" id="c2" score="4.614373" type="D">
          <Token aConType="C2" aModType="*" aType="0" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="サクヒン" goshu="漢" iConType="*" iForm="*" iType="*" id="8" kana="サクヒン" kanaBase="サクヒン" lForm="サクヒン" lemma="作品" ne="O" orig="作品" orth="作品" orthBase="作品" pos1="名詞" pos2="普通名詞" pos3="一般" pos4="*" pron="サクヒン" pronBase="サクヒン" surf="作品"/>
          <Token aConType="動詞%F2@0,名詞%F1" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="デ" goshu="和" iConType="*" iForm="*" iType="*" id="9" kana="デ" kanaBase="デ" lForm="デ" lemma="で" ne="O" orig="で" orth="で" orthBase="で" pos1="助詞" pos2="格助詞" pos3="*" pos4="*" pron="デ" pronBase="デ" surf="で"/>
        </Chunk>
        <Chunk head="c4" id="c3" score="0.000000" type="D">
          <Token aConType="*" aModType="*" aType="1" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ノーベル" goshu="固" iConType="*" iForm="*" iType="*" id="10" kana="ノーベル" kanaBase="ノーベル" lForm="ノーベル" lemma="ノーベル" ne="B-ARTIFACT" orig="ノーベル" orth="ノーベル" orthBase="ノーベ ル" pos1="名詞" pos2="固有名詞" pos3="人名" pos4="一般" pron="ノーベル" pronBase="ノーベル" surf="ノーベル"/>
          <Token aConType="C1" aModType="*" aType="1" cForm="*" cType="*" fConType="*" fForm="基本形" fType="ク促" formBase="ブンガク" goshu="漢" iConType="*" iForm="*" iType="*" id="11" kana="ブンガク" kanaBase="ブンガク" lForm="ブンガク" lemma="文学" ne="I-ARTIFACT" orig="文学" orth="文学" orthBase="文学" pos1="名詞" pos2="普通名詞" pos3="一般" pos4="*" pron="ブンガク" pronBase="ブンガク" surf="文学"/>
          <Token aConType="C3" aModType="*" aType="1" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ショウ" goshu="漢" iConType="*" iForm="*" iType="*" id="12" kana="ショウ" kanaBase="ショウ" lForm="ショウ" lemma="賞" ne="I-ARTIFACT" orig="賞" orth="賞" orthBase="賞" pos1="名詞" pos2="普通名詞" pos3="一般" pos4="*" pron="ショー" pronBase="ショー" surf="賞"/>
          <Token aConType="動詞%F2@0,名詞%F1,形容詞%F2@-1" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ヲ" goshu="和" iConType="*" iForm="*" iType="*" id="13" kana="ヲ" kanaBase="ヲ" lForm="ヲ" lemma="を" ne="O" orig="を" orth="を" orthBase="を" pos1="助詞" pos2="格助詞" pos3="*" pos4="*" pron="オ" pronBase="オ" surf="を"/>
        </Chunk>
        <Chunk head="c-1" id="c4" score="0.000000" type="D">
          <Token aConType="C2" aModType="*" aType="0" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ジュショウ" goshu="漢" iConType="*" iForm="*" iType="*" id="14" kana="ジュショウ" kanaBase="ジュショウ" lForm="ジュショウ" lemma="受賞" ne="O" orig="受賞" orth="受賞" orthBase="受賞" pos1="名詞" pos2="普 通名詞" pos3="サ変可能" pos4="*" pron="ジュショー" pronBase="ジュショー" surf="受賞"/>
          <Token aConType="C5" aModType="*" aType="0" cForm="連用形-一般" cType="サ行変格" fConType="*" fForm="*" fType="*" formBase="スル" goshu="和" iConType="*" iForm="*" iType="*" id="15" kana="シ" kanaBase="スル" lForm="スル" lemma="為る" ne="O" orig="する" orth="し" orthBase="する" pos1="動詞" pos2="非自立可能" pos3="*" pos4="*" pron="シ" pronBase="スル" surf="し"/>
          <Token aConType="動詞%F2@1,形容詞%F4@-2" aModType="*" aType="*" cForm="終止形-一般" cType="助動詞-タ" fConType="*" fForm="*" fType="*" formBase="タ" goshu="和" iConType="*" iForm="*" iType="*" id="16" kana="タ" kanaBase="タ" lForm="タ" lemma="た" ne="O" orig="た" orth="た" orthBase="た" pos1="助動詞" pos2="*" pos3="*" pos4="*" pron="タ" pronBase="タ" surf="た"/>
          <Token aConType="*" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="" goshu="記号" iConType="*" iForm="*" iType="*" id="17" kana="" kanaBase="" lForm="" lemma="。" ne="O" orig="。" orth="。" orthBase="。" pos1="補助記号" pos2="句点" pos3="*" pos4="*" pron="" pronBase="" surf="。"/>
        </Chunk>
      </Sentence>
    </t1>
    <t2>
      川端康成「雪国」の著者である。
      <Sentence id="sample_t2" role="hypothesis" text="川端康成「雪国」の著者である。">
        <Annotation tool="MeCab" ver="0.994"/>
        <Annotation tool="CaboCha" ver="0.64"/>
        <Annotation tool="UniDic" ver="1.3.12"/>
        <Chunk head="c1" id="c0" score="1.141424" type="D">
          <Token aConType="*" aModType="*" aType="0,2" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="カワバタ" goshu="固" iConType="*" iForm="*" iType="*" id="0" kana="カワバタ" kanaBase="カワバタ" lForm="カワバタ" lemma="カワバタ" ne="B-PERSON" orig="川端" orth="川端" orthBase="川端" pos1="名詞" pos2="固有名詞" pos3="人名" pos4="姓" pron="カワバタ" pronBase="カワバタ" surf="川端"/>
          <Token aConType="*" aModType="*" aType="2" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ヤスナリ" goshu="固" iConType="*" iForm="*" iType="*" id="1" kana="ヤスナリ" kanaBase="ヤスナリ" lForm="ヤスナリ" lemma="ヤスナリ" ne="I-PERSON" orig="康成" orth="康成" orthBase="康成" pos1="名詞" pos2="固有名詞" pos3="人名" pos4="名" pron="ヤスナリ" pronBase="ヤスナリ" surf="康成"/>
        </Chunk>
        <Chunk head="c2" id="c1" score="0.000000" type="D">
          <Token aConType="*" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="" goshu="記号" iConType="*" iForm="*" iType="*" id="2" kana="" kanaBase="" lForm="" lemma="「" ne="O" orig="「" orth="「" orthBase="「" pos1="補助記号" pos2="括弧開" pos3="*" pos4="*" pron="" pronBase="" surf="「"/>
          <Token aConType="C1" aModType="*" aType="2" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ユキグニ" goshu="和" iConType="*" iForm="*" iType="*" id="3" kana="ユキグニ" kanaBase="ユキグニ" lForm="ユキグニ" lemma="雪国" ne="O" orig="雪国" orth="雪国" orthBase="雪国" pos1="名詞" pos2="普通名詞" pos3="一般" pos4="*" pron="ユキグニ" pronBase="ユキグニ" surf="雪国"/>
          <Token aConType="*" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="" goshu="記号" iConType="*" iForm="*" iType="*" id="4" kana="" kanaBase="" lForm="" lemma="」" ne="O" orig="」" orth="」" orthBase="」" pos1="補助記号" pos2="括弧閉" pos3="*" pos4="*" pron="" pronBase="" surf="」"/>
          <Token aConType="名詞%F1" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="ノ" goshu="和" iConType="*" iForm="*" iType="*" id="5" kana="ノ" kanaBase="ノ" lForm="ノ" lemma="の" ne="O" orig="の" orth="の" orthBase="の" pos1="助詞" pos2="格助詞" pos3="*" pos4="*" pron="ノ" pronBase="ノ" surf="の"/>
        </Chunk>
        <Chunk head="c-1" id="c2" score="0.000000" type="D">
          <Token aConType="C3" aModType="*" aType="1" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="チョシャ" goshu="漢" iConType="*" iForm="*" iType="*" id="6" kana="チョシャ" kanaBase="チョシャ" lForm="チョシャ" lemma="著者" ne="O" orig="著者" orth="著者" orthBase="著者" pos1="名詞" pos2="普通名詞" pos3="一般" pos4="*" pron="チョシャ" pronBase="チョシャ" surf="著者"/>
          <Token aConType="名詞%F1" aModType="*" aType="*" cForm="連用形-一般" cType="助動詞-ダ" fConType="*" fForm="*" fType="*" formBase="ダ" goshu="和" iConType="*" iForm="*" iType="*" id="7" kana="デ" kanaBase="ダ" lForm="ダ" lemma="だ" ne="O" orig="だ" orth="で" orthBase="だ" pos1="助動詞" pos2="*" pos3="*" pos4="*" pron="デ" pronBase="ダ" surf="で"/>
          <Token aConType="C3" aModType="*" aType="1" cForm="終止形-一般" cType="五段-ラ行-一般" fConType="*" fForm="*" fType="*" formBase="アル" goshu="和" iConType="*" iForm="*" iType="*" id="8" kana="アル" kanaBase="アル" lForm="アル" lemma="有る" ne="O" orig="ある" orth="ある" orthBase="ある" pos1="動詞" pos2="非自 立可能" pos3="*" pos4="*" pron="アル" pronBase="アル" surf="ある"/>
          <Token aConType="*" aModType="*" aType="*" cForm="*" cType="*" fConType="*" fForm="*" fType="*" formBase="" goshu="記号" iConType="*" iForm="*" iType="*" id="9" kana="" kanaBase="" lForm="" lemma="。" ne="O" orig="。" orth="。" orthBase="。" pos1="補助記号" pos2="句点" pos3="*" pos4="*" pron="" pronBase="" surf="。"/>
        </Chunk>
      </Sentence>
    </t2>
  </pair>
</dataset>