Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Расхождения в разметке синтаксиса #13

Closed
AlexeySorokin opened this issue Feb 13, 2020 · 2 comments
Closed

Comments

@AlexeySorokin
Copy link

По аналогии с #12 и опираясь на #11, хотелось бы узнать ответы на следующие вопросы:

  1. Какой алгоритм определения синтаксической вершины символов пунктуации (их много, поэтому ошибка здесь кардинально повлияет на качество системы).
  2. Есть ли систематические отличия от СинТагРуса в разметке синтаксиса.
@olesar
Copy link
Collaborator

olesar commented Feb 13, 2020

Есть ли систематические отличия от СинТагРуса в разметке синтаксиса.

Как известно (см. описание данных и предыдущие issues здесь), UD-SynTagRus является автоматически сконвертированной версией ETAP3 -> UD, которая во многом не соответствует текущему стандарту UDv2 и не валидна для скрипта UD.
Мы сегодня выкладываем версию, в которой многие расхождения сняты см. #8 .
Большое спасибо всем, кто сообщил конкретные замечания. К сожалению, ряд несоответствий остается, прежде всего там, где невозможно построить простых правил.
Дальнейшее обсуждение предлагаю вести в ветке #8

@AlexeySorokin @TatianaShavrina @Shnurre

@olesar
Copy link
Collaborator

olesar commented Feb 13, 2020

Какой алгоритм определения синтаксической вершины символов пунктуации (их много, поэтому ошибка здесь кардинально повлияет на качество системы).

Не совсем понятен вопрос, алгоритм определения в UD (см. punct или алгоритм работы конвертора?
Если последнее, то в оригинальном СинТагРус-е знаки пунктуации не являются узлами дерева, автор конвертора предложил алгоритм их расстановки для UD 1.4, это описано в ее работах. В UD 2 правила расстановки поменялись, что-то конвертор учитывает, что-то нет. Запрет непроективности знаков препинания делает эти правила довольно нетривиальными.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants