Whisper FastAPI Microservice

Этот микросервис реализован с использованием FastAPI и OpenAI Whisper для автоматической транскрипции аудиофайлов. Микросервис принимает аудиофайл через HTTP POST-запрос, выполняет его транскрипцию и возвращает результат в формате JSON.

Требования

Для запуска микросервиса требуются:

Python 3.9+
Установленный FFmpeg для декодирования аудио
Установленный Docker (для запуска в контейнере)

Установка и запуск локально

1. Клонирование репозитория

git clone <repository_url>
cd Whisper_Fastapi_Service

2. Создание и активация виртуального окружения

python3 -m venv venv
source venv/bin/activate  # для Linux/MacOS
# или
venv\Scripts\activate  # для Windows

3. Установка зависимостей

pip install -r app/requirements.txt

4. Запуск приложения

uvicorn app.main:app --reload --host 127.0.0.1 --port 8000

5. Убедитесь, что сервис доступен по адресу

    http://127.0.0.1:8000

Запуск с помощью Docker

1. Построение Docker-образа

docker build -t my_microservice .

2. Запуск Docker-контейнера

docker run -d -p 80:80 my_microservice

3. Доступ к сервису

После запуска микросервис будет доступен по адресу:

http://localhost:80

Использование

Эндпоинт для загрузки аудио и выбора модели Whisper

`POST /transcribe/`

Этот эндпоинт принимает аудиофайл и название модели Whisper для транскрипции.

URL: /transcribe/
Метод: POST
Формат данных: multipart/form-data
Параметры:
- file: аудиофайл (обязательный)
- whisper_model: название модели Whisper для использования (обязательный). Доступные модели: tiny, base, small, medium, large, turbo.

Пример запроса

curl -X POST "http://127.0.0.1:8000/transcribe/" \
    -F "file=@/path/to/audiofile.ogg" \
    -F "whisper_model=base"

Пример ответа

{
  "transcription": "This is the transcribed text from the audio file."
}

📝 API documentation

SWAGGER-UI - /docs/
REDOC - /redoc/

Поддерживаемые форматы аудио

Микросервис поддерживает следующие форматы аудиофайлов:

audio/mpeg (MP3)
audio/wav (WAV)
audio/x-wav (WAV)
audio/flac (FLAC)
audio/ogg (OGG)

Убедитесь, что файл имеет один из поддерживаемых форматов перед отправкой запроса.

Информация о моделях Whisper

Модели Whisper различаются по размеру, количеству параметров, поддерживаемым языкам, требуемой видеопамяти (VRAM) и скорости обработки. Выберите модель в зависимости от ваших требований к точности и времени обработки:

Model	Parameters	English-only model	Multilingual model	Required VRAM	Relative speed
tiny	39 M	`tiny.en`	`tiny`	~1 GB	~10x
base	74 M	`base.en`	`base`	~1 GB	~7x
small	244 M	`small.en`	`small`	~2 GB	~4x
medium	769 M	`medium.en`	`medium`	~5 GB	~2x
large	1550 M	N/A	`large`	~10 GB	1x
turbo	809 M	N/A	`turbo`	~6 GB	~8x

Relative speed: Относительная скорость обработки модели. Модели с большей относительной скоростью (10x, 7x) обрабатывают аудио быстрее, чем более точные модели, такие как large (1x).
Required VRAM: Требуемый объём видеопамяти для использования модели. Большие модели, такие как large, требуют до 10 ГБ видеопамяти.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Docs		Docs
app		app
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
docker-test.py		docker-test.py
local_test.py		local_test.py
models_tests.txt		models_tests.txt
speech.ogg		speech.ogg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Whisper FastAPI Microservice

Оглавление

Требования

Установка и запуск локально

1. Клонирование репозитория

2. Создание и активация виртуального окружения

3. Установка зависимостей

4. Запуск приложения

5. Убедитесь, что сервис доступен по адресу

Запуск с помощью Docker

1. Построение Docker-образа

2. Запуск Docker-контейнера

3. Доступ к сервису

Использование

Эндпоинт для загрузки аудио и выбора модели Whisper

`POST /transcribe/`

Пример запроса

Пример ответа

📝 API documentation

Поддерживаемые форматы аудио

Информация о моделях Whisper

Планы развития микросервиса

About

Releases

Packages

Languages

NewalexOA/Whisper_Fastapi_Service

Folders and files

Latest commit

History

Repository files navigation

Whisper FastAPI Microservice

Оглавление

Требования

Установка и запуск локально

1. Клонирование репозитория

2. Создание и активация виртуального окружения

3. Установка зависимостей

4. Запуск приложения

5. Убедитесь, что сервис доступен по адресу

Запуск с помощью Docker

1. Построение Docker-образа

2. Запуск Docker-контейнера

3. Доступ к сервису

Использование

Эндпоинт для загрузки аудио и выбора модели Whisper

POST /transcribe/

Пример запроса

Пример ответа

📝 API documentation

Поддерживаемые форматы аудио

Информация о моделях Whisper

Планы развития микросервиса

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

`POST /transcribe/`

Packages