Google'un TurboQuant AI-kompresyon algoritması LLM bellek kullanımını 6 kat azaltabilir.

TurboQuant, AI modellerini daha verimli hale getirir ancak diğer yöntemler gibi çıktı kalitesini azaltmaz.

Haberi oku →