NVIDIA Tesla P40 vs NVIDIA Tesla P4

Beide Karten sind passive Pascal-Datacenter-GPUs ohne Display-Ausgang – im Homelab landen sie meist im Server für KI-Inferenz oder Transcoding. Die Tesla P40 bringt 24 GB VRAM für lokale LLMs, zieht dafür aber ~250 W und belegt als Dual-Slot-Karte in voller Bauhöhe zwei Steckplätze. Die Tesla P4 ist mit 8 GB, ~75 W und Single-Slot-Low-Profile-Bauform extrem sparsam und kompakt – ideal fürs Transcoding und leichte Inferenz. Kurz: P40 für VRAM, P4 fürs Stromsparen.

NVIDIA Tesla P40

+24 GB GDDR5 – genug VRAM für lokale LLM-Inferenz und größere Modelle
+Deutlich mehr Rechenleistung als die P4 (rund doppelte FP32-Leistung, starke INT8-Inferenz)
+Auf eBay.de oft die günstigste Option pro GB VRAM
+Standard-Add-in-Karte in voller Bauhöhe – passt in die meisten Tower- und Rack-Server
−~250 W Verbrauch – im 24/7-Betrieb spürbar auf der Stromrechnung
−Passiv und Dual-Slot in voller Höhe: braucht kräftigen Luftstrom und belegt zwei Slots
−Stromversorgung über einen EPS-/CPU-8-Pin-Stecker (nicht PCIe) – Adapter oft nötig

NVIDIA Tesla P4

+~75 W – sehr sparsam, ideal für den Dauerbetrieb
+Single-Slot Low-Profile: passt in kompakte Server und enge Gehäuse
+Kommt ohne zusätzlichen Stromstecker aus – Versorgung allein über den PCIe-Slot
+Reicht für Plex/Jellyfin-Transcoding und leichte Inferenz
+Geringe Abwärme, einfacher zu kühlen als die P40
−Nur 8 GB GDDR5 – zu wenig für größere LLMs
−Klar weniger Rechenleistung als die P40

Fazit

Nimm die Tesla P40, wenn du lokale LLMs fahren willst und die 24 GB VRAM brauchst – Stromverbrauch und Kühlung sind dann der Preis. Nimm die Tesla P4, wenn Transcoding und ein sparsamer, kompakter Dauerläufer im Vordergrund stehen und 8 GB reichen. Wer beides will, kombiniert eine P4 fürs Transcoding mit einer P40 für KI.

NVIDIA Tesla P40

Aktuell keine Angebote.

NVIDIA Tesla P4

Okay· 0

HP nVidia Tesla A16 64GB GDDR6 Computing Grafikkarte 4x GPU PCIe x16 4.0 P48409-

€3802.00Sehr gut - Refurbished

€59.88Ø €2900.99€3802.00

3 weitere ähnliche aktuell auf eBay · Wie wird verglichen?

Preisverlauf →Auf eBay ansehen

Häufige Fragen

Tesla P40 oder P4 für lokale LLMs?

Klar die P40. Mit 24 GB VRAM passen deutlich größere Modelle in den Speicher, die P4 ist mit 8 GB schnell am Limit. Für reines Transcoding oder sehr kleine Modelle genügt die P4.

Brauchen die Karten eine extra Kühlung?

Ja, beide sind passiv und haben keinen eigenen Lüfter – sie sind auf den Luftstrom eines Servergehäuses ausgelegt. Im normalen Desktop brauchst du eine Lüfter-Bastellösung (oft 3D-gedruckte Shrouds).

Kann ich die Karten als Display-Ausgang nutzen?

Nein. Beide haben keinen Display-Ausgang und sind reine Rechen-/Transcoding-Beschleuniger. Für Bildausgabe brauchst du eine separate GPU oder die iGPU der CPU.