En raison d'une grêve chez bpost, votre commande pourrait être retardée. Vous avez besoin d’un livre rapidement ? Nos magasins vous accueillent à bras ouverts !
  •  Retrait gratuit dans votre magasin Club
  •  7.000.000 titres dans notre catalogue
  •  Payer en toute sécurité
  •  Toujours un magasin près de chez vous     
En raison de la grêve chez bpost, votre commande pourrait être retardée. Vous avez besoin d’un livre rapidement ? Nos magasins vous accueillent à bras ouverts !
  •  Retrait gratuit dans votre magasin Club
  •  7.000.0000 titres dans notre catalogue
  •  Payer en toute sécurité
  •  Toujours un magasin près de chez vous
  1. Accueil
  2. Livres
  3. Sciences humaines
  4. Sciences
  5. Technique
  6. Ingénierie & Technologie
  7. Quantization Methods for Large Language Models From Theory to Real-World Implementations

Quantization Methods for Large Language Models From Theory to Real-World Implementations EBOOK

Anand Vemula
Ebook | Anglais
9,49 €
+ 9 points
Disponible immédiatement
Passer une commande en un clic
Payer en toute sécurité

Description

 The book provides an in-depth understanding of quantization techniques and their impact on model efficiency, performance, and deployment.

The book starts with a foundational overview of quantization, explaining its significance in reducing the computational and memory requirements of LLMs. It delves into various quantization methods, including uniform and non-uniform quantization, per-layer and per-channel quantization, and hybrid approaches. Each technique is examined for its applicability and trade-offs, helping readers select the best method for their specific needs.

The guide further explores advanced topics such as quantization for edge devices and multi-lingual models. It contrasts dynamic and static quantization strategies and discusses emerging trends in the field. Practical examples, use cases, and case studies are provided to illustrate how these techniques are applied in real-world scenarios, including the quantization of popular models like GPT and BERT.

Spécifications

Parties prenantes

Auteur(s) :
Editeur:

Contenu

Langue:
Anglais

Caractéristiques

EAN:
9798227116703
Date de parution :
18-08-24
Format:
Ebook
Protection digitale:
/
Format numérique:
ePub

Les avis

Nous publions uniquement les avis qui respectent les conditions requises. Consultez nos conditions pour les avis.