Skip to main content
%50 indirim tüm planlarda, sınırlı süreyle. Başlangıç fiyatı $2.48/mo

Ollama VPS Barındırma Hizmeti

Açık kaynak
LLM'leri kendi VPS'nizde çalıştırın.

En yeni AMD EPYC ve saf NVMe ile Ollama'ye hazır VPS.
Bağımsız 2008'den beri. Lama, Mistral, Qwen, DeepSeek, Gemma, hepsi kendi IP'niz altında.

4.7· Trustpilot'ta 747 yorum

Başlangıç fiyatı $2.48/mo · %50 indirim · Kredi kartı gerekmez

~ ssh root@ollama-lon-001bağlandı
root@ollama-lon-001:~# ollama pull llama3
manifest alınıyor... model indiriliyor 5.0 GB ✔
root@ollama-lon-001:~# ollama run llama3 "VPS nedir?"
VPS ya da Virtual Private Server, kendi işletim sistemi ve
ayrılmış kaynakları olan, bulutta barındırılan
sanallaştırılmış bir bilişim ortamıdır...
root@ollama-lon-001:~# _

Ollama VPS'a Genel Bakış

Cloudzy sunucu Ollama-ready VPS'ler 13 bölge Kuzey Amerika, Avrupa, Orta Doğu ve Asya'da, başlangıç fiyatı ayda 2,48 $. Planlar şuradan başlar 512 MB to 64 GB DDR5, hepsi açık NVMe depolama ile 40 Gbps uplink'ler. Ollama tek tıkla kurulur; Llama 3, Mistral, Llama 3, Mistral, Qwen, DeepSeek, Gemma modellerini çalıştırın ve bir OpenAI uyumlu APISunucular sağlanmakta 60 saniye. Cloudzy bağımsız olarak şu tarihten beri faaliyet gösteriyor: 2008 ve puanı 4.7 / 5 by 747+ yorumcu Trustpilot'ta.

Başlangıç fiyatı
2,48 $ / ay
Hazırlama
60 saniye
Bölgeler
Dünya genelinde 13
Uptime SLA
99.95%
Para iadesi
14 gün
Kuruluş
2008

Geliştiriciler neden Cloudzy'yi seçiyor

Bir LLM ana bilgisayarı tercihi.

Müşterilerin bizi gerçekten kıyasladığı dört şey, doğru yapılmış.

Çıkarım için optimize edilmiş

AMD EPYC, yalnızca NVMe depolama, DDR5 bellek, 40 Gbps uplink. Model ağırlıkları NVMe'den saniyeler içinde yüklenir; ilk yanıtı yavaşlatan disk darbesi olmaz.

Risksiz deneme

Her planda 14 günlük para iade garantisi. Soru sorulmadan. Kurulum ücreti yok. Panelden istediğin zaman iptal et.

%99,95 uptime SLA

13 bölgede otomatik izleme. Son 30 günlük SLA, status.cloudzy.com adresinde herkese açık olarak takip ediliyor, PR arkasına saklanma yok.

7/24 insan desteği

Canlı sohbet ve destek talebi yanıtları genelde 5 dakikadan kısa. Senaryo okuyan değil, mühendisler. Ortalama çözüm 1 saatin altında.

Modelinizi seçin

Açık ağırlıklı modeller.
Tek pull ile hazır.

Güvenli tercih için Llama 3, genel sohbet için Mistral, çok dilli kullanım için Qwen, kod için DeepSeek, küçük CPU işleri için Gemma. İstediğinizi karıştırın, hepsi aynı NVMe üzerinde.

Her planda özel GGUF yükleme desteği
Llama 3
8B / 70B / 405B
Mistral
7B / Mixtral 8x7B
Qwen
0,5B – 72B Alibaba
DeepSeek
Coder / Chat / R1
Gemma
2B / 7B Google
Phi
Microsoft küçük modeller

Kullanım alanları

Geliştiriciler neden seçiyor
Cloudzy'nin Ollama VPS'ı.

Uygulamanız için özel API

Kendi IP'nize atanmış, OpenAI uyumlu bir endpoint. Kullanıcı promptlarını üçüncü taraf sağlayıcılara göndermeden sohbet özellikleri, özetleyiciler veya ajan sistemleri geliştirin.

Arka plan ajanları

E-postaları toplu işleyen, site tarayan veya biletleri otomatik etiketleyen uzun süreli ajanlar, kullanım başı fiyatlı API'lere sığmaz. Sabit ücretli bir VPS sığar. Bir cron job kurun, Ollama'e istek atın, bekleyin, tekrarlayın.

Kod asistanları

Editörünüzdeki Continue / Tabby eklentisinin arkasına DeepSeek-Coder veya Qwen-Coder çalıştırın. Hızlı otomatik tamamlama, öneri başına maliyet yok, kod üçüncü tarafa gönderilmez.

Hobi sohbet botu ve RAG demoları

Bir model çekin, Open WebUI veya LibreChat bağlayın, arkadaşlarınızla bir bağlantı paylaşın. Tüm yığın tek bir VPS üzerinde, aylık birkaç kahve fiyatına.

Uyumluluk dostu LLM'ler

Hassas veriler (hukuki, sağlık, dahili belgeler) VPS'nizde kalır. iptables ve journald ile erişimi denetleyin; model sizin, çevre sizin.

Kendi ince ayarlarınızı yapın

Temel ağırlıkları çekin, bir GPU makinesinde ince ayar yapın, GGUF'u çıkarım için bir CPU Ollama VPS'ye gönderin. Hafta içi düşük maliyetle sunun, yalnızca eğitirken harcayın.

60s
Hazırlama
40 Gbps
Yükseliş bağlantısı
Yalnızca NVMe
Depolama
13
Bölgeler
99.95%
Uptime SLA
14 gün
Para iadesi

Küresel ağ

13 bölge. Dört kıta.
Size uygun olanı seçin, modeli çekin.

Çıkarım sunucunuzu kullanıcılarınıza yakın konuşlandırın. Kuzey Amerika ve Avrupa'da ortanca P50 gecikme süresi 10 ms'nin altında.

us-utah-1us-dal-1us-lax-1us-lvg-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Fiyatlandırma

Yalnızca kullandığın kadar öde. Bu kadar.

Saatlik, aylık veya yıllık. Egress ücreti yok. Taahhüt yok. Şu anda %50 indirim tüm planlarda.

1 GB DDR5

Küçük CPU modeller · 1B–3B

$3.48/ay
$6.95/mo−%50
Şimdi dağıt
14 gün para iade garantisi
  • 1 vCPU @ EPYC
  • 25 GB NVMe
  • 1 TB · 40 Gbps
  • Özel IPv4 + IPv6
  • Tek tıkla Ollama
2 GB DDR5

7B / 8B CPU üzerinde

$7.475/ay
$14.95/mo−%50
Şimdi dağıt
14 gün para iade garantisi
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Özel IPv4 + IPv6
  • Tek tıkla Ollama

SSS. Ollama VPS

Sık sorulan sorular, net cevaplar.

Ollama VPS nedir?

Ollama VPS, yerel LLM çalışma zamanı olan Ollama'yi çalıştırmak üzere yapılandırılmış bir Cloudzy bulut sunucusudur. Llama 3, Mistral, Qwen, DeepSeek veya Gemma gibi açık kaynaklı modeller çekin; bunları kendi OpenAI uyumlu API'nizin arkasında sunun; üçüncü taraf bir model sağlayıcısına trafik göndermeden sohbet uygulamaları, ajanlar ve araçlar geliştirin.

Ollama önceden yüklü mü?

Ollama, panelden tek tıklamayla kurulabilir. Bir Linux şablonu seçin; binary PATH'inize eklenir ve `ollama pull llama3` bir dakika içinde çalışır. HTTP API varsayılan olarak 11434 portunu dinler; bunu bir ters proxy arkasında özel IP'nize bağlayın.

Yalnızca CPU olan bir VPS'de LLM çalıştırabilir miyim?

Evet, küçük modeller için. Llama 3 8B ve Mistral 7B, 16 GB CPU'li bir makinede çalışır; Qwen 0.5B–3B ve Gemma 2B ise 4 GB'da rahatça çalışır. Çıktı hızı modelin ve komutun boyutuna bağlıdır. CPU, GPU'den yavaştır ancak düşük hacimli API'ler, yan projeler ve geliştirme işleri için yeterlidir.

Daha büyük modeller için GPU planlarınız var mı?

Evet. 70B sınıfı modeller veya yüksek hacimli çıkarım için GPU planlarımıza bakın (RTX 4090, RTX 5090, A100). 4090, niceleme ile Llama 3 70B'yi kaldırır; A100 80 GB ise tam hassasiyetli büyük modelleri çalıştırır. Fiyatlandırma sayfasında bağlantıya ulaşabilirsiniz.

OpenAI uyumlu API destekleniyor mu?

Evet. Ollama, OpenAI istemcisiyle doğrudan uyumlu bir `/v1/chat/completions` uç noktası sunar. Mevcut uygulamanızı `http://your-vps:11434/v1` adresine yönlendirin ve model adını değiştirin. Aynı SDK, yeniden yazım gerekmez.

Bir model ne kadar disk alanı kaplar?

Duruma göre değişir. 4-bit kuantize edilmiş 7B model yaklaşık 4 GB tutar. 8B model yaklaşık 5 GB, 70B model 4-bit'te ise ~40 GB'dır. Depolama alanınız el verdiğince model indirin. Planlar NVMe ile 60 GB'tan başlar ve 1,5 TB'a kadar çıkar; aynı sunucuda istediğiniz modelleri bir arada kullanabilirsiniz.

Hazırlama ne kadar hızlı?

Ödeme onaylandıktan sonra VPS'niz 60 saniye içinde hazır olur. Ollama tek tıklamayla kurulunca çalışma ortamı bir dakika içinde ayağa kalkar. İlk model indirme ağ hızına bağlı olduğundan biraz uzun sürebilir; sonrakiler ise NVMe üzerinde önbellekte hazır gelir.

Özel bir IP alıyor muyum?

Evet, her VPS ile birlikte statik bir IPv4 ve IPv6 verilir. Ollama API'sine bu IP üzerinden ulaşabilir, gerçek bir alan adında HTTPS için önüne bir Caddy ters proxy koyabilirsiniz; bu kadar. Kayan IP'ler de mevcuttur.

Gizli ücret var mı?

Hayır. Egress aylık transfer kotana dahil. Snapshot'lar ücretsiz. IPv4 + IPv6 dahil. Root erişimi dahil. Tek ücretli ekstra Floating IP (2,50 $/ay) ve ücretsiz kotanın üzerindeki ek snapshot'lar.

Para iade garantisi var mı?

Evet, satın almadan itibaren 14 gün, soru sormadan tam iade. Panelden başvur veya [email protected] adresine yaz.

Sen hazır olduğunda biz hazırız.
ollama run, 60 saniyede.

Bir bölge seçin, tıklayın, model indirin. Kendi özel LLM'niz, size ait bir IP.

Kredi kartı gerekmez · 14 gün para iade garantisi · İstediğin an iptal et