Zbudowałem własny system wiedzy oparty na AI. Oto co odkryłem.
Nota: To case study opisuje projekt własny — zbudowany przeze mnie, przeze mnie używany. Nie jest to wdrożenie u klienta zewnętrznego. Publikuję go, żeby pokazać możliwości technologii i sposób, w jaki podchodzę do rozwiązywania problemów operacyjnych.
Problem
Przez ponad 12 lat pracy w branży IT, niezależnie od firmy i zespołu, wracał ten sam problem: szukanie informacji, które gdzieś na pewno są.
Firmowe wiki? Zazwyczaj jest. Ale żeby cokolwiek w nim znaleźć, trzeba użyć dokładnie właściwych słów kluczowych. Trochę inaczej sformułowane pytanie — i wyniki nie mają sensu. Klasyczna wyszukiwarka rozumie słowa, ale nie kontekst.
Reszta wiedzy żyje osobno — w plikach na lokalnych dyskach lub serwerach. Każdy wie, że gdzieś to jest. Nikt nie wie gdzie dokładnie. Efekt: kilkadziesiąt minut szukania jednej informacji, kilka razy w tygodniu.
Do tego dochodzi problem z danymi w bazach danych. Żeby zadać proste pytanie — “ile zamówień mieliśmy w zeszłym kwartale z podziałem na regiony?” — trzeba albo znać SQL, albo czekać na programistę lub analityka z wolnym okienkiem.
Prawdziwy koszt chaosu informacyjnego to nie czas szukania. To decyzje podejmowane na podstawie niepełnych danych — i wiedza, która odchodzi razem z pracownikiem.
Cel
Stworzyć jedno miejsce z szybkim dostępem do wszystkich potrzebnych informacji. Bez wyszukiwarki słów kluczowych. Bez przekopywania się przez dziesiątki plików. Pytanie w naturalnym języku — odpowiedź w kilkanaście sekund.
Dodatkowe wymagania:
- Dane mają pozostać lokalnie — żaden dokument nie trafia do zewnętrznych serwerów.
- System ma działać bez zaangażowania programisty przy codziennym użytkowaniu.
- Obsługa wielu typów źródeł: pliki lokalne, strony internetowe, baza danych SQL.
Rozwiązanie
W grudniu 2024 roku zbudowałem pierwszą wersję aplikacji opartej na technologii RAG — Retrieval-Augmented Generation. Więcej o RAG pisałem już wcześniej tutaj.
Zasada działania w skórcie: AI zamiast odpowiadać z własnej wiedzy, najpierw przeszukuje wskazaną bazę dokumentów, znajduje właściwy fragment i na jego podstawie formułuje odpowiedź. Każda odpowiedź ma źródło. System nie zgaduje — cytuje.
Z perspektywy użytkownika wygląda to jak rozmowa z bardzo dobrze poinformowanym współpracownikiem, który przeczytał każdy dokument w firmie.
Obsługiwane źródła danych
Lokalne pliki — PDF-y, dokumenty Word, arkusze Excel. Wgrywasz raz, pytasz ile razy chcesz. Przydatne dla procedur, instrukcji, ofert, umów.
Strony internetowe i artykuły — podajesz link, system pobiera treść i włącza ją do bazy wiedzy. Przydatne dla zespołów śledzących dokumentację techniczną, materiały od dostawców lub branżowe publikacje.
Baza danych SQL — użytkownik zadaje pytanie w naturalnym języku, system sam generuje zapytanie SQL, pobiera dane i zwraca odpowiedź w czytelnej formie. Osoby nietechniczne mogą samodzielnie pobierać informacje z bazy danych — bez programisty, bez analityka, bez czekania.
Prywatność i kontrola
System działa w pełni lokalnie — model językowy uruchomiony na własnej maszynie za pomocą Ollama, dane przechowywane we własnej bazie danych. Dla firm pracujących z danymi wrażliwymi to nie opcja, lecz warunek konieczny.
Dla firm bez takich ograniczeń dostępna jest też integracja z API zewnętrznych dostawców modeli: OpenAI, Anthropic i innych.
Wyniki
- Odpowiedzi w kilkanaście sekund — zamiast kilkudziesięciu minut szukania w plikach i wiki.
- Jedno miejsce dla wszystkich źródeł — pliki lokalne, strony internetowe i baza danych SQL w jednym interfejsie.
- Dostęp do danych bez SQL — pytania do bazy danych w naturalnym języku, bez angażowania programisty.
- Pełna prywatność — dane nie opuszczają lokalnej infrastruktury.
- Zero krzywej uczenia się — interfejs w formie czatu, obsługiwany przez każdego pracownika bez szkolenia.
Wnioski
Wiedza jest w firmie. Problem w tym, że jest wszędzie — i przez to nigdzie.
Ten projekt pokazał mi, że technologia RAG jest dziś wystarczająco dojrzała, żeby wdrażać ją w firmach bez rozbudowanego zaplecza IT. Nie wymaga miesięcy wdrożenia ani zespołu data scientists. Wymaga dobrego zrozumienia problemu i precyzyjnego zaprojektowania systemu pod konkretny przypadek użycia.
Największą wartość przynosi tam, gdzie:
- wiedza jest rozproszona po wielu plikach i systemach
- firma regularnie zatrudnia nowych pracowników i wdrożenie każdego z nich angażuje doświadczony zespół
- dane są w bazie SQL, ale dostęp do nich wymaga pośrednika
- praca z danymi wrażliwymi wyklucza zewnętrzne narzędzia AI
Jeśli chcesz wdrożyć podobne rozwiązanie w swojej firmie — skontaktuj się ze mną. Chętnie porozmawiam o tym, jak taki system mógłby wyglądać w Twoim konkretnym przypadku.