Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Wrong sentence in 4287 #80

Open
wellington36 opened this issue Apr 30, 2021 · 3 comments
Open

Wrong sentence in 4287 #80

wellington36 opened this issue Apr 30, 2021 · 3 comments

Comments

@wellington36
Copy link
Contributor

wellington36 commented Apr 30, 2021

Segunda sentença do https://github.com/cpdoc/dhbb-nlp/blob/master/udp-mini/4287.conllu segmentada errada (trocou "\n" por espaço):

> sent_id = 2
> text = Em 1902 diplomou-se em ciências jurídicas e sociais pela Faculdade Livre de Direito da Bahia, tendo sido nomeado em 1903 promotor público de Mata de São João (BA) e, posteriormente, da comarca de Alagoinhas (BA), Auditor de guerra do 1º Distrito Militar em abril de 1904 e do 4º Distrito Militar em dezembro de 1905, foi designado em julho de 1911 para o mesmo cargo na 5ª Região Militar (RM) em Curitiba.
@arademaker
Copy link
Contributor

Eu não entendi... mas não precisa copiar o conteúdo do conllu, basta apontar.

@wellington36
Copy link
Contributor Author

Apontar o problema? (Acho que entendi)

@wellington36
Copy link
Contributor Author

Segunda sentença do https://github.com/cpdoc/dhbb-nlp/blob/master/udp-mini/4287.conllu segmentada errada (trocou "\n" por espaço):

> sent_id = 2
> text = Em 1902 diplomou-se em ciências jurídicas e sociais pela Faculdade Livre de Direito da Bahia, tendo sido nomeado em 1903 promotor público de Mata de São João (BA) e, posteriormente, da comarca de Alagoinhas (BA), Auditor de guerra do 1º Distrito Militar em abril de 1904 e do 4º Distrito Militar em dezembro de 1905, foi designado em julho de 1911 para o mesmo cargo na 5ª Região Militar (RM) em Curitiba.

A questão aqui era que essa sentença na verdade são as linhas 2 e 3 em https://github.com/cpdoc/dhbb-nlp/blob/master/sents/4287.sent, ou seja, houve uma inconsistencia entre o artivo sents e o udp-mini.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants