Awesome Serverless GPU

List of where to run code on GPUs for AI, inference, predictions that are serverless.
Serverless is defined as pay-as-you-go, scale-to-zero, minimal infrastructure configuration.

Serverless GPU is a reletively new and fast evolving field. New services are appearing and disappearing frequently.
I will do my best to keep the list updated, and soon include benchmarks.

Common weaknessses of serverless GPU at the moment is very long cold starts, and configuration that are less easy to use than the more mature field of serverless on CPUs.

Inference

Bring your own model

True serverless inference

Inferless.com
Replicate.com
Runpod.io
Modelz.ai
Banana.dev (Shutting down March 31st 2024)
Beam.cloud
Mystic.ai
Modal.com
Baseten.co
Covalent.xyz

Predefined models

True serverless with a limited set of models

Not serverless inference

Needs dedicated server, but works with your own model

Dev on GPUs

Flexible on-demand GPU providers

Predefined models over API

Speech to text

Text to speech

Image generation

Workflow platforms

Leap

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Awesome Serverless GPU

Inference

Bring your own model

Predefined models

Not serverless inference

Dev on GPUs

Predefined models over API

Speech to text

Text to speech

Image generation

Workflow platforms

AI Agents for Websites

About

Releases

Packages

viktorfa/awesome-serverless-gpu

Folders and files

Latest commit

History

Repository files navigation

Awesome Serverless GPU

Inference

Bring your own model

Predefined models

Not serverless inference

Dev on GPUs

Predefined models over API

Speech to text

Text to speech

Image generation

Workflow platforms

AI Agents for Websites

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages