Rétrospective
LLM locaux sur Mac Studio : pour une personne seule ou une petite équipe, mieux vaut un travailleur lent mais puissant qu'un chat rapide
En passant de deux 3090 Ti à un M3 Ultra, je montre comment une personne seule ou une petite équipe peut tirer parti de LLM locaux lents en les traitant comme des travailleurs en file d'attente, et non comme des remplaçants du chat en temps réel.
4 févr. 202610 min de lecture