Nouveau LLM Open Source de Facebook! Llama 3.3

Olivier_Lambert · Décembre 9, 2024, 3:39

Meta a sorti Llama 3.3, un modèle de langage open source vraiment impressionnant.

Les benchmarks sont vraiment biens:

Voici un petit résumé (ChatGPT generated) de « why is it cool »:

Contrôle total et hébergement sur vos propres serveurs

Avec Llama 3.3, vous pouvez héberger votre modèle directement chez vous. Plus besoin de dépendre de services externes : vos données restent privées, la vitesse d’exécution est top, et vous avez une autonomie complète pour personnaliser le modèle selon vos besoins.

Puissance dans un format compact

Ce modèle de 70 milliards de paramètres offre des performances comparables au modèle Llama 3.1 à 405 milliards de paramètres. Mais voici la magie : il demande jusqu’à 24 fois moins de mémoire GPU! En gros, un seul GPU Nvidia H100 de 80 Go peut suffire, ce qui peut économiser jusqu’à 600 000 $ en matériel et réduire vos coûts d’énergie.

Idéal pour du contenu long et multilingue

Avec une fenêtre contextuelle allant jusqu’à 128 000 tokens (l’équivalent de 400 pages de texte!), vous pouvez créer des contenus longs, faire des analyses complexes, ou gérer des dialogues multilingues en français, espagnol, anglais et plus encore, avec une précision de 91 %.

Moins cher

Le coût de génération de texte est aussi bas que 0,01 $ par million de tokens, le rendant bien plus abordable que des modèles comme GPT-4.

Outils et personnalisation

Vous avez accès à des ressources comme Llama Guard 3 pour garantir la sécurité, et le modèle est ajusté grâce à des retours humains pour rester pertinent et sûr. Disponible sur GitHub, Hugging Face et d’autres plateformes, il est prêt à être intégré dans vos projets.

Si jamais héberger votre propre IA vous intéresse, ce gars-là est vraiment bon pour expliquer le setup: