Skip to content

v1.0.4, 2019-12-10

Compare
Choose a tag to compare
@malakhovks malakhovks released this 10 Dec 12:11
· 264 commits to master since this release

🔴 Виправлення помилок

  • Виправлено помилку при нумерації речень в allterms.xml. Нумерація речень в allterms.xml починається з 0.
    Для індексації речень з використанням spaCy (в цій бібліотеці відсутня індексація речень) за основу використано приклад:
    for sent_i, sent in enumerate(doc.sents):
        for token in sent:
            print(sent_i, token.i, token.text)
  • Розширення файлу при збереженні таблиці #table-main в формат Office Open XML Workbook виправлено на xlsx.
  • Дублюючий символ крапка . при обробці тексту з PDF файлів. В функцию def text_normalization_default(raw_text) додано можливість видалення дублюючого символу крапка . (а саме заміна на один символ крапка .) при нормалізації тексту.

👍 Покращення

  • Змінено елемент <title> головної сторінки index.html (додано мовний код EN додатку ken згідно стандарту представлення назв мов ISO 639-1):
    <title>Конспект (EN) - v1.0.4</title>