RAG Developers' Stack
RAG Developers' Stack là một tập hợp các công cụ và công nghệ được thiết kế để hỗ trợ các nhà phát triển trong việc xây dựng và triển khai các hệ thống tìm kiếm và truy xuất thông tin hiệu quả. Trong đó, RAG (Retrieval-Augmented Generation) là một phương pháp kết hợp giữa việc tìm kiếm dữ liệu từ các nguồn thông tin bên ngoài với khả năng tạo ngôn ngữ tự nhiên từ các mô hình AI hiện đại như GPT!.
RAG stands for Retrieval Augmented Generation.
RAG helps to enhance the accuracy of LLM answers by providing relevant context from external knowledge bases.
LLMs - LLMs are advanced deep learning models based on transformers decoders. We have both open-source and closed LLMs.
Frameworks - Frameworks help to develop RAG applications without coding everything from scratch. LangChain and Llama Index are some of the popular frameworks for building RAG applications.
Vector Databases - Vector databases store the text chunks, metadata and their embeddings.
Data Extraction - RAG applications require extraction of data from websites and documents (PDF, word, slides, etc.)
Open LLMs Access - Ollama is a tool that helps to use open LLMs locally. Platforms like Groq, Hugging Face and Together AI offer API access to open LLMs.
Text Embeddings - Text embeddings are used to transform text chunks into embeddings for similar chunks retrieval. Apart from text embedding models, image embedding and multi-modal embedding models are also available.
Evaluation - Giskard and Ragas are the popular libraries to evaluate RAG applications.
From : https://www.facebook.com/share/p/18r4KRsMEC/