-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathstats.xml
111 lines (111 loc) · 11.4 KB
/
stats.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
<?xml version="1.0" encoding="UTF-8"?>
<treebank>
<!-- tokens means "surface tokens", e.g. Spanish "vámonos" counts as one token
words means "syntactic words", e.g. Spanish "vámonos" is split to two words, "vamos" and "nos"
fused is the number of tokens that are split to two or more syntactic words
The words and fused elements can be omitted if no token is split to smaller syntactic words. -->
<size>
<total><sentences>357</sentences><tokens>6665</tokens><words>6665</words><fused>0</fused></total>
<train><sentences>0</sentences><tokens>0</tokens><words>0</words><fused>0</fused></train>
<dev><sentences>0</sentences><tokens>0</tokens><words>0</words><fused>0</fused></dev>
<test><sentences>357</sentences><tokens>6665</tokens><words>6665</words><fused>0</fused></test>
</size>
<lemmas unique="1635" /><!-- का, ।, में, COMMA, बा, से, -, आ, कि, जा, रह, त, भोजपुरी, ना, हो -->
<forms unique="1680" /><!-- के, ।, ,, में, से, -, कि, बा, आ, का, त, भोजपुरी, ना, ई, एह -->
<fusions unique="0" /><!-- -->
<!-- Statistics of universal POS tags. The comments show the most frequent lemmas. -->
<tags unique="16">
<tag name="ADJ">249</tag><!-- पूरा, सांस्कृतिक, तथाकथित, प, छोट, बड, खास, चुपचाप, जरूरी, तरह -->
<tag name="ADP">989</tag><!-- का, में, से, को, पर, के, कर, खातिर, वाला, ले -->
<tag name="ADV">31</tag><!-- हिन्दी, गद्य, जइसे, जल्दी, ललित, सभ्य, आजुओ, आनंद, आसानी, जइसा -->
<tag name="AUX">355</tag><!-- बा, जा, रह, सक, गइल, दे, हो, कर, लग, ले -->
<tag name="CCONJ">151</tag><!-- आ, बाकिर, अउर, फगुआ, भा, राउर, आउर, आखिर, खम्भा, खैर -->
<tag name="DET">353</tag><!-- ई, एह, कवनो, ओह, कुछ, अइसन, ओकर, जवन, जवना, आजु -->
<tag name="INTJ">5</tag><!-- गहर, अजी, अरे, दोसर -->
<tag name="NOUN">1854</tag><!-- लोग, बिआह, रंग, जी, देश, जब, भाषा, आजु, आदमी, स -->
<tag name="NUM">149</tag><!-- एगो, एक, लोग, गो, दू, कुछ, दोसर, 5, अनकस, कलिग -->
<tag name="PART">192</tag><!-- त, ना, नइखा, बहु, भर, बस, स, अतना, खाली, गमगमावे -->
<tag name="PRON">335</tag><!-- ओकरा, अपना, हम, ऊ, हमर, हमार, आपन, हमनी, काहे, केहूँ -->
<tag name="PROPN">421</tag><!-- भोजपुरी, प्रियंका, सिंह, राय, जी, पाती, डॉ., डा॰, तिवारी, दिल्ली -->
<tag name="PUNCT">695</tag><!-- ।, COMMA, -, ,, “, ’, ”, ?, ‘, – -->
<tag name="SCONJ">118</tag><!-- कि, त, निकलि, बाकि, लपकि, आँखि, काहे, काहेंकि, कोच्चि, तकल -->
<tag name="VERB">767</tag><!-- हो, कर, बा, दे, भइल, आ, कह, चाह, कहल, जा -->
<tag name="X">1</tag><!-- स्टाइल -->
</tags>
<!-- Statistics of features and values. The comments show the most frequent word forms. -->
<feats unique="39">
<feat name="AdpType" value="Post" upos="ADJ,ADP,DET,NOUN,PART,PROPN,VERB">991</feat><!-- के, में, से, का, पर, वाला, बाद, तबे, अतने, ओके -->
<feat name="AdvType" value="Deg" upos="PART">2</feat><!-- उहाँसे, सबसे -->
<feat name="Aspect" value="Imp" upos="AUX,NOUN,PROPN,VERB">15</feat><!-- चुनौती, जाला, पाती, सकता, जानतानी, फूलल, महती, रहत, रहित, रहे -->
<feat name="Aspect" value="Perf" upos="ADJ,ADP,ADV,AUX,DET,NOUN,NUM,PART,PRON,SCONJ,VERB">341</feat><!-- ओकरा, रहे, चाहीं, बा, जाई, रहीं, होखे, होई, एकरा, पहिले -->
<feat name="Case" value="Acc" upos="ADJ,ADP,ADV,AUX,DET,INTJ,NOUN,NUM,PART,PRON,PROPN,VERB">1349</feat><!-- के, भोजपुरी, जी, आजु, जवना, लोगन, बात, साहित्य, तरह, सभ -->
<feat name="Case" value="Acc,Dat" upos="ADJ,DET,PRON,PROPN">29</feat><!-- कइसे, लेखको, एहमें, अइसे, ओहमें, हइसे, ऑडियो, ओकरा, कादो, काहें -->
<feat name="Case" value="Acc,Erg" upos="PRON">6</feat><!-- ओतने, माने, आपने, हम -->
<feat name="Case" value="Acc,Gen" upos="DET,PRON">8</feat><!-- हमरा, इनका, ओकर, जेकरा, हमनीके, हमार -->
<feat name="Case" value="Nom" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,NOUN,NUM,PART,PRON,PROPN,VERB">2651</feat><!-- के, बा, का, त, ई, भोजपुरी, लोग, एगो, गइल, कवनो -->
<feat name="Echo" value="Rdp" upos="NUM,PRON">15</feat><!-- केहूँ, कहाँ, उहाँ, एकहूँ, एक, हमहूँ -->
<feat name="Foreign" value="Yes" upos="AUX,NOUN,VERB,X">7</feat><!-- भइल, गइल, स्टाइल -->
<feat name="Gender" value="Fem" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,NOUN,NUM,PART,PRON,PROPN,VERB">884</feat><!-- भोजपुरी, ई, गइल, बा, हमरा, चाहीं, जी, जाई, जवना, बात -->
<feat name="Gender" value="Masc" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,INTJ,NOUN,NUM,PART,PRON,PROPN,SCONJ,VERB">3073</feat><!-- के, का, त, लोग, बा, एगो, रहे, अपना, कवनो, रहल -->
<feat name="Mood" value="Ind" upos="AUX,VERB">24</feat><!-- बा, रहे, बाटे, बाड़न, करी, जाई, पाई, रहन, रहीं, लागल -->
<feat name="Mood" value="Sub" upos="AUX,NOUN,PRON,VERB">45</feat><!-- करे, कहले, धीरे, पहिले, सके, काहे, होले, आइलें, करेले, कहेलें -->
<feat name="Number" value="Plur" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,NOUN,NUM,PART,PRON,PROPN,SCONJ,VERB">481</feat><!-- के, लोग, ओकरा, हम, चाहीं, होखे, नइखे, होई, पहिले, आम -->
<feat name="Number" value="Sing" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,INTJ,NOUN,NUM,PART,PRON,PROPN,VERB">3795</feat><!-- के, बा, का, भोजपुरी, त, ई, एगो, रहे, गइल, कवनो -->
<feat name="NumType" value="Card" upos="ADJ,DET,NOUN,NUM,PROPN,VERB">113</feat><!-- एह, एक, ओह, बिआह, ह, अनकस, बरीस, 12, 120, 2011 -->
<feat name="NumType" value="Ord" upos="PART">1</feat><!-- वां -->
<feat name="Person" value="1" upos="DET,PRON,VERB">50</feat><!-- हम, आम, हमरा, एहमें, एकदम, ओहमें, कलम, तमाम, बनाम, हमनी -->
<feat name="Person" value="2" upos="AUX,PRON,VERB">10</feat><!-- ओतने, माने, आइलें, आपने, कहेलें, पढ़सु, पवलें, लगीहें -->
<feat name="Person" value="3" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,NOUN,NUM,PART,PRON,PROPN,VERB">3307</feat><!-- बा, भोजपुरी, त, ई, लोग, एगो, कवनो, गइल, रहे, जी -->
<feat name="Polarity" value="Neg" upos="PART">8</feat><!-- ना, नइखे -->
<feat name="Polite" value="Form" upos="ADP,AUX,NOUN,PRON,VERB">144</feat><!-- रहे, के, रहीं, कतहीं, बतवले, आईं, ओके, जाले, दिहले, साथे -->
<feat name="Poss" value="Yes" upos="DET,PRON">8</feat><!-- हमरा, इनका, ओकर, जेकरा, हमनीके, हमार -->
<feat name="PronType" value="Dem" upos="DET,PART,VERB">9</feat><!-- एह, ओह, जवन, भरोसे, भलही, यह -->
<feat name="PronType" value="Ind" upos="CCONJ,DET,NUM">35</feat><!-- कुछ, हर, कतना, कई, कम, ढेर, आ, जादा -->
<feat name="PronType" value="Int" upos="DET,NOUN,PRON">5</feat><!-- काहें, कब, का, बहिन -->
<feat name="PronType" value="Neg" upos="PART">8</feat><!-- ना, नइखे -->
<feat name="PronType" value="Prs" upos="ADJ,AUX,DET,NOUN,NUM,PART,PRON,PROPN,VERB">221</feat><!-- अपना, हम, जब, केहूँ, अब, बिना, उहाँ, तब, कइसे, सब -->
<feat name="Tense" value="Fut" upos="AUX,VERB">7</feat><!-- करी, जाई, पाई, लागल, लागी, लागे, होई -->
<feat name="Tense" value="Past" upos="AUX">6</feat><!-- रहे, रहन, रहीं -->
<feat name="Tense" value="Pres" upos="AUX">11</feat><!-- बा, बाटे, बाड़न, हटे, हऽ -->
<feat name="VerbForm" value="Conv" upos="PRON,VERB">4</feat><!-- एकर, करके -->
<feat name="VerbForm" value="Fin" upos="AUX,NOUN,PRON,VERB">69</feat><!-- करे, कहले, बा, धीरे, रहे, पहिले, सके, काहे, बाटे, बाड़न -->
<feat name="VerbForm" value="Inf" upos="ADP,AUX,DET,VERB">18</feat><!-- कहना, किडनी, जवना, कवना, जनले, जाए, पढ़नी, पढ़े, पूछनी, बनवावे -->
<feat name="VerbForm" value="Part" upos="ADJ,ADP,ADV,AUX,DET,NOUN,NUM,PART,PRON,PROPN,SCONJ,VERB">357</feat><!-- ओकरा, रहे, चाहीं, बा, जाई, रहीं, होखे, होई, एकरा, पहिले -->
<feat name="Voice" value="Act" upos="ADP,AUX,CCONJ,DET,NOUN,PART,PRON,VERB">333</feat><!-- हो, बा, चाहीं, जाई, होखे, करे, पहिले, फगुआ, कहले, कतहीं -->
<feat name="Voice" value="Pass" upos="VERB">4</feat><!-- क, रङा, सुनतानी, सुनतारे -->
</feats>
<!-- Statistics of universal dependency relations. -->
<deps unique="31">
<dep name="acl">105</dep>
<dep name="advcl">82</dep>
<dep name="advmod">29</dep>
<dep name="amod">202</dep>
<dep name="appos">1</dep>
<dep name="aux">302</dep>
<dep name="aux:pass">11</dep>
<dep name="case">907</dep>
<dep name="cc">30</dep>
<dep name="ccomp">58</dep>
<dep name="clf">3</dep>
<dep name="compound">1610</dep>
<dep name="conj">115</dep>
<dep name="cop">9</dep>
<dep name="csubj">10</dep>
<dep name="dep">21</dep>
<dep name="det">174</dep>
<dep name="discourse">8</dep>
<dep name="fixed">10</dep>
<dep name="flat">1</dep>
<dep name="iobj">17</dep>
<dep name="list">10</dep>
<dep name="mark">123</dep>
<dep name="nmod">907</dep>
<dep name="nsubj">273</dep>
<dep name="nummod">54</dep>
<dep name="obj">122</dep>
<dep name="obl">352</dep>
<dep name="punct">695</dep>
<dep name="root">357</dep>
<dep name="xcomp">67</dep>
</deps>
</treebank>