AI · 14/05/2026
RAG nad firemnou dokumentáciou — checklist, ktorý sme si zaplatili chybami
Postavili sme zopár RAG systémov a každý nás niečo naučil — zvyčajne tým, že sa pokazil v produkcii. Tu je checklist, ktorý by sme dali sami sebe na začiatku.
Chunk size je dôležitejší než model
Začnite s ~500 tokenmi a 15 % prekryvom. Príliš malé chunky strácajú kontext, príliš veľké riedia relevanciu. Defaulty meňte až keď to eval suite vyžaduje.
pgvector stačí častejšie, než si myslíte
Ak už máte PostgreSQL, nepridávajte dedicated vector DB len preto, že je trendy. Pre milióny dokumentov pgvector + HNSW index bohato stačí a ušetríte si jednu integráciu.
Bez eval suite lietate naslepo
Zostavte dataset 50–100 otázok s očakávanými zdrojmi a spúšťajte ho v CI. Inak nikdy nezistíte, že zmena promptu zhoršila odpovede.
Páčil sa vám článok?
Píšeme o veciach, ktoré reálne staviame. Ak riešite niečo podobné, ozvite sa.