ShangmingCai

Follow

shangmingc ShangmingCai

Follow

Currently working at Alibaba Cloud Apsara Lab. Research Interests: Efficient LLM serving system.

41 followers · 8 following

Alibaba Cloud

Achievements

Achievements

Pinned Loading

vllm-project/vllm vllm-project/vllm Public

A high-throughput and memory-efficient inference and serving engine for LLMs

Python 45.8k 7.1k
kvcache-ai/Mooncake kvcache-ai/Mooncake Public

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++ 3.1k 220
sgl-project/sglang sgl-project/sglang Public

SGLang is a fast serving framework for large language models and vision language models.

Python 13.6k 1.6k