Skip to main content
%50 indirim tüm planlarda, sınırlı süreyle. Başlangıç fiyatı $2.48/mo

ChatGPT VPS Barındırması

Kendi AI sunucunuz,
kendi kurallarınız.

Açık ağırlıklı LLM'leri ve AI API'lerini kendi sunucunuzda çalıştırın AMD EPYC ile NVMe depolama üzerine inşa edilmiştir.
Şu tarihten beri bağımsız bulut 2008, satıcı bağımlılığı yok, kullanım sınırı yok.
Güvenilen 122,000+ kullanıcılar · şu kaynaktan $2.48/mo.

4.7 · Trustpilot'ta 747 yorum

Başlangıç fiyatı $2.48/mo · %50 indirim · Kredi kartı gerekmez

~ ssh root@ai-001 bağlandı
root@ai-001:~# curl -fsSL https://ollama.ai/install.sh | sh
Ollama yükleniyor...
Ollama başarıyla kuruldu.
root@ai-001:~# ollama pull llama3
model llama3 çekiliyor... 100%
root@ai-001:~# ollama serve &
Listening on 0.0.0.0:11434
root@ai-001:~# _

ChatGPT VPS'e kısa bakış

Cloudzy sunar ChatGPT VPS LLM'leri ve AI inference işlemlerini kendi sunucunuzda barındırmak için 13 bölge, başlangıç fiyatı $2.48/mo. Her plan şu altyapı üzerinde çalışır: AMD EPYC ile DDR5 bellek, NVMe depolama ve 40 Gbps uplink. Ollama, llama.cpp, vLLM veya kendi inference stack'inizi kurun; tam root erişimi, API hız sınırı yok. Dakikalar içinde hazır. 60 saniye. Bağımsızlık 2008, puan: 4.7/5 by 700+ reviewers Trustpilot'ta.

Başlangıç fiyatı
2,48 $ / ay
CPU
AMD EPYC · DDR5
Hazırlama
60 saniye
Bölgeler
Dünya genelinde 13
Para iadesi
14 gün
Kuruluş
2008

Geliştiriciler neden Cloudzy'yi seçiyor

Teknolojiye hakim tercihi.

Müşterilerin bizi gerçekten kıyasladığı dört şey, doğru yapılmış.

Yüksek özellikli altyapı

Son nesil AMD EPYC, sadece NVMe depolama, DDR5 bellek, 40 Gbps uplink. Her plan seviyesinde tek thread liderliği.

Risksiz deneme

Her planda 14 gün para iade garantisi. Soru sorulmadan. Kurulum ücreti yok. Panelden istediğin an iptal et.

%99,95 uptime SLA

13 bölgede otomatik izleme. Son 30 günlük SLA'mız status.cloudzy.com'da herkese açık. Saklamak yok.

7/24 insan desteği

Canlı sohbet ve destek talebi yanıtları genelde 5 dakikadan kısa. Senaryo okuyan değil, mühendisler. Ortalama çözüm 1 saatin altında.

Kendi sunucunuzda çalıştırabileceğiniz AI araçları

Açık ağırlıklı modeller, altyapınız.

İstediğiniz açık ağırlıklı modeli veya AI framework'ünü çalıştırın. Tam root erişimiyle stack'i, modeli ve servis katmanını siz belirlersiniz. Üçüncü taraf API anahtarı gerekmez.

Ollama
Tek komutla LLM servis etme
llama.cpp
CPU ile optimize edilmiş çıkarım
vLLM
Yüksek verimli servis
WebUI'yi Aç
LLM'ler için sohbet arayüzü
LangChain
Orkestrasyon çerçevesi
Hugging Face
Model merkezi + Transformers

Kullanım alanları

Geliştiriciler neden seçiyor
Cloudzy'nin kendi ChatGPT VPS'i.

Özel ChatGPT alternatifi

Llama 3, Mistral veya Phi'yi Open WebUI ile kendi sunucunuzda çalıştırın. Sohbet arayüzü, konuşma geçmişi ve verileriniz VPS'inizden dışarı çıkmaz.

Uygulamanız için API arka ucu

Bir LLM'yi kendi REST API'nizin arkasında çalıştırın. Token başına ücret yok, istek limiti yok. SaaS'niz, botunuz veya dahili araçlarınızla entegre edin.

İnce ayar ve deneyler

Veri setleri yükleyin, LoRA adaptörlerini ince ayarlayın, değerlendirmeler çalıştırın. Kalıcı NVMe depolama sayesinde kontrol noktalarınız yeniden başlatmalardan etkilenmez.

RAG pipeline sunucusu

Yerel bir LLM'yi vektör veritabanıyla (Chroma, Qdrant, Weaviate) birleştirerek retrieval-augmented generation yapın. Her şey tek bir sunucuda.

Çoklu model karşılaştırması

Llama, Mistral ve Phi'yi yan yana çalıştırın. Üretime geçmeden önce çıktıları, gecikmeyi ve kaliteyi karşılaştırın.

Yapay zeka kodlama asistanı

Code Llama veya DeepSeek Coder'yi kendi sunucunuzda barındırın ve yerel bir API aracılığıyla IDE'nize bağlayın. Kod dışarı gönderilmeden otomatik tamamlama ve sohbet.

60s
Hazırlama
40 Gbps
Yükseliş bağlantısı
Yalnızca NVMe
Depolama
13
Bölgeler
99.95%
Uptime SLA
14 gün
Para iadesi

Küresel ağ

13 bölge. Dört kıta.
Bir tık uzakta.

ChatGPT VPS'inizi kullanıcılarınıza fiziksel olarak mümkün olduğunca yakın konumlandırın. Kuzey Amerika ve Avrupa'da P50 medyan gecikme 10 ms'nin altında.

us-utah-1us-dal-1us-lax-1us-nyc-1us-mia-1eu-ams-1eu-lon-1eu-fra-1eu-brn-1me-dxb-1ap-sgp-1ap-syd-1

Fiyatlandırma

Yalnızca kullandığın kadar öde. Bu kadar.

Saatlik, aylık veya yıllık. Egress ücreti yok. Taahhüt yok. Şu anda %50 indirim tüm planlarda.

512 MB DDR5

Küçük modeller · test

$2.48 /ay
$4.95/mo −%50
Şimdi dağıt
14 gün para iade garantisi
  • 1 vCPU @ EPYC
  • 20 GB NVMe
  • 1 TB · 40 Gbps
  • Özel IPv4 + IPv6
  • Root SSH · KVM
2 GB DDR5

Küçük LLM'ler · 7B parametre

$7.475 /ay
$14.95/mo −%50
Şimdi dağıt
14 gün para iade garantisi
  • 1 vCPU @ EPYC
  • 60 GB NVMe
  • 3 TB · 40 Gbps
  • Özel IPv4 + IPv6
  • Root SSH · KVM
8 GB DDR5

13B+ modeller · RAG yığınları

$26.475 /ay
$52.95/mo −%50
Şimdi dağıt
14 gün para iade garantisi
  • 4 vCPU @ EPYC
  • 240 GB NVMe
  • 7 TB · 40 Gbps
  • Özel IPv4 + IPv6
  • Root SSH · KVM

SSS — ChatGPT VPS

Sık sorulan sorular, net cevaplar.

ChatGPT'yi kendi VPS'imde çalıştırabilir miyim?

ChatGPT, OpenAI'a ait tescilli bir hizmettir; ancak Llama 3, Mistral, Phi veya DeepSeek gibi açık ağırlıklı alternatifleri kendi Cloudzy VPS'inizde barındırabilirsiniz. Ollama ve Open WebUI gibi araçlar, tam gizlilikle benzer bir sohbet deneyimi sunar.

LLM çıkarımı için ne kadar RAM'a ihtiyacım var?

Model boyutuna bağlıdır. 7B parametreli bir model (örneğin kuantize Llama 3 8B), 4-8 GB RAM ile çalışır. 13B model 8-16 GB gerektirir. 70B gibi büyük modeller ise 32-64 GB ister. Küçük modeller için 4 GB planla başlayın, gerektiğinde yükseltin.

LLM çalıştırmak için GPU şart mı?

Hayır. llama.cpp ve Ollama gibi araçlar, AMD EPYC üzerinde CPU ile çıkarım yapmak için optimize edilmiştir. GPU'ye kıyasla saniye başına token hızı daha düşük olur; ancak kişisel kullanım, küçük ekipler veya asenkron toplu işler için CPU çıkarımı gayet yeterli çalışır ve GPU barındırmanın çok daha küçük bir maliyetiyle.

Birden fazla modeli aynı anda barındırabilir miyim?

Evet. Yeterli RAM ile Ollama veya vLLM üzerinden birden fazla model çalıştırabilir ve aralarında geçiş yapabilirsiniz. Her model, talep üzerine belleğe yüklenir. 16 GB plan, 2-3 küçük modeli aynı anda rahatlıkla sunabilir.

Veri gizliliği ne durumda?

Her şey kendi VPS'nizde kalır. Üçüncü taraf API'lere hiçbir veri gönderilmez. Model, veri ve ağ tamamen sizin kontrolünüzde. Bu, barındırılan AI servislerine karşı en büyük avantajdır: prompt'larınız ve yanıtlarınız sunucunuzu hiç terk etmez.

Ollama nasıl kurulur?

Tek komutla: curl -fsSL https://ollama.ai/install.sh | sh. Ardından ollama pull llama3 ile modeli çekin ve sohbete başlayın. Temiz bir VPS üzerinde tüm süreç 5 dakikadan kısa sürer.

LLM'imi bir API olarak dışarıya açabilir miyim?

Evet. Ollama, varsayılan olarak 11434 portu üzerinde OpenAI uyumlu bir API sunar. vLLM da OpenAI uyumlu bir endpoint açar. Uygulamanızı, botunuzu veya frontend'inizi VPS'nizin IP ve portuna yönlendirmeniz yeterli.

Çalışma süresi garantisi nedir?

Cloudzy, tüm planlarda %99,95 çalışma süresi SLA sunar. AI sunucunuz, yedekli ağ yolları ve 40 Gbps bağlantıyla 7/24 çevrimiçi kalır.

Bu VPS üzerinde model ince ayarı yapabilir miyim?

CPU ile ince ayar mümkündür ancak yavaştır. Küçük modellerin (7B) LoRA/QLoRA ince ayarı için yüksek RAM'li bir CPU planı deneme amaçlı işe yarar. Büyük modellerin üretim ortamında ince ayarı için GPU örnekleri daha pratiktir.

Para iade politikası nedir?

14 gün içinde soru sorulmadan para iadesi. AI kurulumunuzu test edin, çıkarım hızını ölçün, kararınızı verin. Tam iade için paneli veya desteği kullanın.

Sen hazır olduğunda biz hazırız.
AI sunucusu 60 saniyede.

Kredi kartı gerekmez · 14 gün para iade garantisi · İstediğin an iptal et