-
Notifications
You must be signed in to change notification settings - Fork 6
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Ошибки в разметке синтаксиса: #11
Comments
@AlexeySorokin, да, ошибка, спасибо за замечание. Нашла еще один такой же случай, в новом коммите он поправлен. |
Ещё ошибки (расхождения с Синтагрусом):
см. СинТагРус
здесь в разметке групп нет практически ничего общего
в СинТагРусе
|
@olesar Проблема в том, что список неточностей был составлен на примере отличий между автоматической системой и разметкой в выборке, что приводит к мысли, что учиться на тренировочных данных нельзя, поскольку в сложных случаях они не точнее, чем система, обученной на СинТагРусе, и к тому же неконсистентны. |
Дерево в UD-SynTagRus пришло из СинТагРус-ИППИ без принципиальных изменений proof, полагаю, авторы руководствовались определенными критериями, разработанным под задачи машинного перевода или отвечающие принципам модели Смысл-Текст.
|
Обобщая, конструкции малого синтаксиса являются узким горлышком, здесь всегда можно ожидать расхождений. Инвентаризация таких конструкций и их интерпретация - отдельная правильная задача, хорошо, если соревнование даст почву для этого. |
скрипт валидации оценивает теги первого уровня, иными словами, obl=obl:agent, это не должно создать проблем (но может дать поле для эксперимента с обучением на тегах первого уровня, в других вопросах). |
Хорошего решения для "конструкций с лозунгами/названиями" в рамках UD2.5 пока не придумано, применение тега orphan дает ошибку скрипта UD (два nsubj в одном предложении), см. дискуссию в репозитории universaldependencies. |
Известная проблема, поправлено в S-v2 |
конвертор реагирует на точку запятой как маркер паратаксиса. Согласна с @AlexeySorokin , наличие анафорической связи здесь говорит в пользу conj. Увы, ручной просмотр всех таких деревьев в миллионном корпусе - дело немыслимое. |
Является ли ошибкой (по-моему, да), и много ли ошибок вроде
См., например SynTagRus:
The text was updated successfully, but these errors were encountered: