FAQ

Answers to frequently asked questions about Upbox.

What frameworks are supported?

PyTorch, TensorFlow, JAX, scikit-learn, XGBoost, ONNX, and HuggingFace Transformers. Custom runtimes supported via Docker.

Most deployments complete in under 10 seconds. Large models (10GB+) may take up to 60 seconds for initial deployment.

Pay per inference request plus compute time. Scale-to-zero means you pay nothing when idle. Volume discounts available for enterprise.

Yes - 100,000 free inference requests per month, forever. No credit card required to start.

Sub-50ms P95 latency globally via our edge network. For latency-critical apps, always-on mode guarantees sub-10ms.

Absolutely. Models are deployed in isolated containers. VPC deployment available for additional security.

No hard limit. We've deployed models up to 175B parameters. Large models automatically use model parallelism across GPUs.

Upbox focuses on deployment. For training, use your preferred platform and deploy the resulting model to Upbox.

Was this page helpful?