SAFOZi

GPU as a service

Les serveurs les plus performants en Afrique

● GPU CLOUD — ALL SYSTEMS ONLINE ● CLOUD GPU — TOUS SYSTÈMES OPÉRATIONNELS

GPU + Models + Storage + Metrics GPU + Modèles + Stockage + Métriques

Bare-metal NVIDIA GPUs, one-click hosted models, persistent storage, and real-time metrics — everything to run AI at scale. GPUs NVIDIA bare-metal, modèles hébergés en un clic, stockage persistant et métriques en temps réel — tout pour faire tourner l\'IA à grande échelle.

H100 · A100 · L40SAvailable GPUsGPUs disponibles
<60sProvisioningProvisionnement
99.99%Uptime SLASLA Uptime
GPU CATALOGCATALOGUE GPU

Bare-Metal GPUsGPUs Bare-Metal

NVIDIA H100 SXM5
Phare · Entraînement LLM · HPC
80GB HBM3VRAM
3.35 TB/sBANDWIDTH
700WTDP
400Gb/sInfiniBand
$3.2900 / hour/ heure
Disponible (EU-CENTRAL-1)
NVIDIA A100 PCIe
Performance · Entraînement · Inférence
80GB HBM2eVRAM
2.0 TB/sBANDWIDTH
400WTDP
NVLinkMulti-GPU
$1.4300 / hour/ heure
Disponible (EU-CENTRAL-1)
NVIDIA L40S
Polyvalent · Rendu · Inférence
48GB GDDR6VRAM
864 GB/sBANDWIDTH
350WTDP
8 vCPUCalcul
$0.9200 / hour/ heure
Disponible (UK-1)
RTX PRO 6000 Blackwell
Polyvalent · Dev · Génération d'images
96GB GDDR7VRAM
1.8 TB/sBANDWIDTH
300WTDP
DynamicProvisionnement
$0.6600 / hour/ heure
Limité (US-WEST-1)
APPSAPPLICATIONS

Pre-Configured ApplicationsApplications Pré-Configurées

????
Jupyter + PyTorch
développement · ~5 min
Environnement Python complet avec PyTorch, CUDA et JupyterLab
Deploy:Déployer: ~5 min Min VRAM:Min VRAM: 4GB
????
VS Code Server
développement · ~3 min
IDE VS Code complet dans votre navigateur avec accès GPU
Deploy:Déployer: ~3 min Min VRAM:Min VRAM: 4GB
????
Langflow
développement · ~5 min
Framework visuel pour créer des applications LLM
Deploy:Déployer: ~5 min Min VRAM:Min VRAM: 4GB
????
MLflow
développement · ~3 min
Suivi d'expériences ML et registre de modèles
Deploy:Déployer: ~3 min Min VRAM:Min VRAM: 4GB
V1
????
vLLM V1 + TinyLlama
inférence · ~5 min
vLLM V1 en un clic avec TinyLlama 1.1B — prêt pour l'inférence immédiate
Deploy:Déployer: ~5 min Min VRAM:Min VRAM: 4GB
FAST
vLLM Inference Server
inférence · ~8 min
Inférence LLM haute performance avec moteur V1 et API compatible OpenAI
Deploy:Déployer: ~8 min Min VRAM:Min VRAM: 16GB
????
Text Generation WebUI
inférence · ~12 min
Interface web riche pour exécuter des LLMs (oobabooga)
Deploy:Déployer: ~12 min Min VRAM:Min VRAM: 8GB
NOUVEAU
????
Open WebUI
inférence · ~3 min
Interface type ChatGPT pour LLMs locaux (compatible Ollama)
Deploy:Déployer: ~3 min Min VRAM:Min VRAM: 4GB
????
Hugging Face TGI
inférence · ~10 min
Inférence de génération de texte prête pour la production par Hugging Face
Deploy:Déployer: ~10 min Min VRAM:Min VRAM: 16GB
????
Triton Inference Server
inférence · ~8 min
Serveur d'inférence de production NVIDIA pour tout framework ML
Deploy:Déployer: ~8 min Min VRAM:Min VRAM: 8GB
????
LocalAI
inférence · ~5 min
Remplacement OpenAI API pour l'inférence locale
Deploy:Déployer: ~5 min Min VRAM:Min VRAM: 4GB
CRÉATIF
????
ComfyUI
créatif · ~10 min
Interface Stable Diffusion basée nœuds pour la génération d'images
Deploy:Déployer: ~10 min Min VRAM:Min VRAM: 8GB
????️
Automatic1111 WebUI
créatif · ~15 min
L'interface web Stable Diffusion la plus populaire
Deploy:Déployer: ~15 min Min VRAM:Min VRAM: 8GB
FACILE
????
Fooocus
créatif · ~10 min
Stable Diffusion simplifié avec une UX à la Midjourney
Deploy:Déployer: ~10 min Min VRAM:Min VRAM: 8GB
NOUVEAU
????
CogVideoX
créatif · ~15 min
Génération vidéo IA à l'état de l'art
Deploy:Déployer: ~15 min Min VRAM:Min VRAM: 24GB
????
Axolotl Fine-tuning
entraînement · ~8 min
Affinez les LLMs avec LoRA, QLoRA et fine-tuning complet
Deploy:Déployer: ~8 min Min VRAM:Min VRAM: 24GB
????
Kohya_ss GUI
entraînement · ~12 min
LoRA et fine-tuning pour les modèles Stable Diffusion
Deploy:Déployer: ~12 min Min VRAM:Min VRAM: 12GB
PLATFORMPLATEFORME

Everything You NeedTout ce qu'il vous faut

????

Stockage Persistant

Volumes NVMe haute vitesse qui survivent aux redémarrages. Montage sur plusieurs GPUs simultanément.

  • Stockage bloc NVMe
  • Jusqu'à 10 To par volume
  • Réplication multi-régions
  • Instantané et restauration
  • Stockage objet compatible S3
  • 0,08 $ / Go / mois
????

Modèles Hébergés

Déployez et servez des modèles open source via une API d'inférence gérée — sans gestion GPU.

  • API REST compatible OpenAI
  • Llama 3, Mistral, Qwen, Phi
  • Stable Diffusion / FLUX
  • Whisper, CLIP, Embeddings
  • Mise à l'échelle automatique
  • Facturation à la token
????

Métriques & Monitoring

Télémétrie GPU en temps réel, suivi des coûts et analyses d'utilisation pour chaque instance.

  • Utilisation GPU et VRAM
  • Température et consommation
  • E/S réseau par instance
  • Tableau de bord prévisionnel
  • Export compatible Prometheus
  • Alertes et détection d'anomalies
PRICINGTARIFICATION

Simple, Transparent PricingTarification Simple et Transparente

Débutant

Développeur

Pay-As-You-Go / À l'usage
Sans minimum — à partir de $0,66/h
  • Tous types GPU (spot et à la demande)
  • 50 Go de stockage gratuit
  • Toutes les apps du marketplace
  • Tableau de bord métriques de base
  • Support communautaire
  • REST API + Python SDK
Pro

Croissance

$4,999
/ mois · 64 GPUs inclus
  • Capacité GPU réservée
  • Jusqu'à 512 GPUs par cluster
  • 1 To de stockage persistant
  • Modèles hébergés (illimités)
  • Métriques avancées + alertes
  • Support prioritaire (SLA 4h)
Entreprise

Sur mesure

Contact Us / Nous contacter
Infrastructure dédiée
  • Options datacenter privé
  • Clusters GPU illimités
  • SLA personnalisé (NOC 1h)
  • Conformité SOC2 / HIPAA
  • Responsable de compte dédié
  • Facturation et contrats personnalisés
11
Select GPUSélect. GPU
22
ConfigureConfigurer
33
DeployDéployer
Choose GPUChoisir GPU
NVIDIA H100 SXM5 — 80GB HBM3 — $3.29/hr/h
NVIDIA A100 PCIe — 80GB HBM2e — $1.43/hr/h
NVIDIA L40S — 48GB GDDR6 — $0.92/hr/h
RTX PRO 6000 Blackwell — 96GB GDDR7 — $0.66/hr/h