Generatieve AI -systemen vereisen aanzienlijke computationele, geheugen- en opslagbronnen.Hoewel AI het potentieel heeft om transformerende doorbraken in de industrie te stimuleren, komt de inzet ervan vaak met hoge kosten.Rag is een cruciaal stadium in AI-ontwikkeling, het verfijnen van grote taalmodellen (LLMS) door gebruik te maken van applicatie- of enterprise-specifieke gegevens.
De kern van RAG is een vectordatabase, die domeinspecifieke gegevens verzamelt en converteert in functievectoren.Rag vertrouwt ook op ANNS -algoritmen om vectoren te identificeren die het model verbeteren door de gelijkenis tussen geaccumuleerde en doelvectoren te evalueren.Om effectief te zijn, moet Rag snel de meest relevante informatie ophalen.Traditioneel zijn ANNS-algoritmen in DRAM ingezet om de vereiste snelle prestaties te bereiken.
De Kioxia AISAQ-technologie levert een schaalbare en efficiënte ANNS-oplossing die in staat is om datasets op miljard-schaal te verwerken met minimaal geheugengebruik en snelle indexschakelmogelijkheden.