Blog portant sur l’actualité informatique, geek et high-tech
Ollama 0.133 – Enfin une gestion en parallèle des LLMs
Mai 2024, par KorbenOllama 0.133 introduit des fonctionnalités expérimentales de parallélisme pour optimiser les applications IA. Grâce aux variables d’environnement OLLAMA_NUM_PARALLEL et OLLAMA_MAX_LOADED_MODELS, les développeurs peuvent gérer plusieurs modèles et requêtes simultanément. De nouveaux modèles IA (…)
→ Lire la suite sur le site d’origine…