Add this suggestion to a batch that can be applied as a single commit.
This suggestion is invalid because no changes were made to the code.
Suggestions cannot be applied while the pull request is closed.
Suggestions cannot be applied while viewing a subset of changes.
Only one suggestion per line can be applied in a batch.
Add this suggestion to a batch that can be applied as a single commit.
Applying suggestions on deleted lines is not supported.
You must change the existing code in this line in order to create a valid suggestion.
Outdated suggestions cannot be applied.
This suggestion has been applied or marked resolved.
Suggestions cannot be applied from pending reviews.
Suggestions cannot be applied on multi-line comments.
Suggestions cannot be applied while the pull request is queued to merge.
Suggestion cannot be applied right now. Please check back later.
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
387 deploy whisper #388
387 deploy whisper #388
Changes from 7 commits
a539494
d4a47ec
5358360
23c579a
f9d5b9d
142111c
3bc3398
9e34833
6884eab
4301952
0a46c88
a5af166
15c8182
edd5157
57aeccd
6620f9c
7895f4d
81763d7
2b2af94
7444699
1fb986b
d84fc9e
7330454
7ccda4c
2525f08
0adc439
d9c2a9f
f6f707e
0a53514
9a92766
95624bb
17c68ac
1dacb4d
5728e9c
4bd9c00
48fb3f9
07ee0f6
2f4cabf
9740468
496c079
034351a
3384b42
234fad6
45b70dd
7e0a4dd
5dd6866
1a901b0
6af5a48
d84ae55
25f5068
5be8e9c
90684a6
4e91e9f
c82a185
0dbb056
fbec381
a67df4f
cf032d2
File filter
Filter by extension
Conversations
Jump to
There are no files selected for viewing
This file was deleted.
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
сделайте язык параметром (чтобы на будущее можно было его менять )
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Не будет ли проблем с размером файла, если кто-то наговорит на пару часов? (условная 413
client request body or request entity is too large
)There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Не совсем понимаю, как это можно проверить в коде, и нужно ли?
Я немного переписал эту часть кода — добавил закрытие файла после прочтения, теперь посылаю не дескриптор, а буфер, в который файл был считан
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Тут скорее вопрос (на исследование/проверку) - какого максимального размера аудио можно отправить в asr?
И можно ли защититься от ошибок со слишком большими файлами (разбивать их на более мелкие / др) - в vosk, например, данные отправлялись кусками по сокету, поэтому теоретически происходила обработка аудио любого размера
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Пока что удалось установить, что верхний предел у Whisper всё же существует
Аудио загружались в tiny модель с характеристиками, указанными по дефолту в docker compose
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Вынесите свои исследования в https://github.com/OSLL/web_speech_trainer/wiki
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Добавьте версии для библиотек requests и librosa
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Как вы предполагаете автоматизированный запуск подобного теста?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Соглашусь, такой код для тестирования не подойдёт. Хотелось бы узнать, стоит ли вообще писать тест для Whisper, и если да, то что именно нужно протестировать?
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Добавьте тестирование своего класса WhisperAudioRecognizer (пусть даже он частично будет общаться с whisper-контейнером, и это будет уже не совсем unit-тестирование)
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Возникли трудности с написанием тестов, дело в том, что на данный момент tiny модель "Добрый день, все хорошо. Я сижу дома" распознаёт так, как показано на фото. Первая строка результат распознавания после применений denoiser, перегона в wav, а на второй строке результат распознавания необработанной записи
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Давайте пока оставим тесты в том виде в котором есть (с печатью распознанных слов)
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
А по поводу wav и denoiser - посмотрите, насколько они нужны при работе с whisper (создал задачу - #401 ) - wav нужен был для vosk, возможно, сейчас от него можно избавиться?