K-AI 96 RIM 4090
Moćna konfiguracija za AI inferenciju, LLM i duboko učenje s performansama od 2644 TOPS.
Predstavljamo 4U rack-mount server dizajniran za najzahtjevnija AI opterećenja. Optimiziran za pokretanje velikih jezičnih modela, generiranje slika i složenu analizu podataka.
Konfiguriraj i kupi
2644 TOPS
Ekstremna računalna snaga za trenutni odgovor modernih AI modela.
96 GB VRAM-a
4× NVIDIA RTX 4090 za nesmetan rad modela Llama 3.3, Qwen i DeepSeek.
32 JEZGRE
AMD EPYC 7542 (Rome) sa 64 niti za rukovanje masovnim tokovima podataka.
256 GB RAM-a
ECC memorija poslužitelja osigurava stabilnost sustava pod opterećenjem 24/7.
Zašto odabrati K-AI 96 RIM?
Ovaj stroj nudi nenadmašan omjer cijene i performansi zahvaljujući korištenju četiri NVIDIA GeForce RTX 4090 grafičke kartice. Idealan je izbor za:
- Pristupni put za zaključivanje za tvrtke: Rad internih chatbotova (70B modeli) za 50–200 zaposlenika.
- Generativna umjetna inteligencija: Generiranje flash medija pomoću FLUX.1, SDXL ili Wan 2.2.
- Fino podešavanje: Učinkovito podešavanje modela (LoRA/QLoRA) s veličinama parametara od 7 do 34B.
- RAG (Generiranje proširenim pronalaženjem): Inteligentan rad s dokumentacijom tvrtke u stvarnom vremenu.

Potpune tehničke specifikacije
| sastavni dio | Tehnički podaci |
|---|---|
| grafičke kartice | 4× NVIDIA GeForce RTX 4090 (svaka 24 GB GDDR6X, PCIe 4.0 x16) |
| Procesor | AMD EPYC 7542 (32 jezgre / 64 niti, TDP 225 W) |
| Matična ploča | ASRock Rack ROMED8-2T s IPMI podrškom za udaljeno upravljanje |
| Radna memorija | 256 GB DDR4-2666 ECC RDIMM (proširivo do 512 GB) |
| Skladištenje | 2TB NVMe M.2 (PCIe 4.0 x4) za munjevito brzo pokretanje sustava |
| Napajanje | Dvostruko sinkronizirano ATX napajanje od 2 kW (ukupno 4000 W) |
| Hlađenje | Industrijski 120 mm ventilatori s optimiziranim protokom zraka od naprijed prema natrag |
| Operacijski sustav | Unaprijed instalirani Ubuntu + CUDA + Docker + AI okviri (vLLM, ComfyUI) |
Izmjerene performanse u praksi:
Naši laboratorijski testovi potvrđuju vrhunsku učinkovitost:
- Lama 3.3 70B (AWQ INT4): Doseže do 179 protoka/s u seriji-32.
- Propusnost GPU memorije: 920 GB/s po kartici.
- Vrijeme implementacije: Server je spreman za rad u roku od 16-20 mjeseci (u slučaju najma/leasinga) ili za trenutnu isporuku.
Trebate li individualnu konfiguraciju?
Možemo prilagoditi veličinu RAM-a, kapacitet NVMe diska ili dodati dodatne mrežne elemente prema vašim potrebama.
Zatražite individualnu ponudu







