Discord workshop / Fabryka AI

Slayer: trenujemy model od zera razem.

To nie jest kurs wideo. To warsztatowa spolecznosc na Discordzie, w ktorej spotykamy sie 2-3 razy w tygodniu, robimy zadania jak na cwiczeniach na uniwersytecie i uczymy sie treningu modeli przez realne uruchamianie pipeline'u.

Repozytoria i slajdy sa materialami pomocniczymi. Core to sesje, zadania i wspolne debugowanie.
8 blokow warsztatowych
2-3x call'e warsztatowe tygodniowo
Discord community, review, debug
30 dni zwrot bez pytan
Wyzwanie

Uczymy sie, bo probujemy wytrenowac model od zera.

Slayer jest dla osob technicznych, ktore chca zrozumiec, co dzieje sie pod spodem. Mamy plan, slajdy i repozytoria, ale material nie jest produktem samym w sobie. Produktem jest praca w grupie: sesje, zadania, review i decyzje treningowe.

01 / dane

Korpus, licencje, jakosc

Na sesjach budujemy dataset, usuwamy smieci, deduplikujemy, odcinamy benchmark contamination i zapisujemy provenance.

quality gate
02 / tokenizer

Tokenizacja bez magii

Wspolnie trenujemy tokenizer, mierzymy kompresje na polskich danych i sprawdzamy, kiedy vocabulary niszczy koszt treningu.

bpe / unigram
03 / model

Architektura GPT

Przechodzimy przez blok transformera, attention, MLP, normy, embeddingi i rope tak, zeby umiec debugowac training run.

pytorch
04 / training

Petla treningowa

Robimy batching, optimizer, scheduler, mixed precision, gradient clipping, checkpointing i czytamy realne logi z loss curve.

loss / lr / grad
05 / eval

Ewaluacja i bramki

Projektujemy proxy benchmark, sanity checki generacji, regresje i metryki, ktore zatrzymuja slaby run przed spaleniem GPU.

benchmarks
06 / deploy

Checkpoint do inferencji

Przerabiamy eksport, kwantyzacje, vLLM/llama.cpp, OpenAI-compatible endpoint i podstawy monitoringu kosztu tokenow.

serving
Tryb pracy

Jak cwiczenia na uczelni, tylko na prawdziwym modelu.

Calls

2-3 spotkania tygodniowo

Krotkie sesje robocze: kontekst, decyzja techniczna, live coding albo review, potem konkretne zadanie do wykonania.

Discord

Community i asynchroniczny debug

Wrzucamy logi, configi, wykresy, sample i bledy. Grupa widzi, co nie dziala, i uczy sie na realnych awariach.

Repos

Kod i zadania

Repozytoria sa punktem startowym, nie gotowa odpowiedzia. Uczestnicy dopisuja pipeline, uruchamiaja runy i porownuja wyniki.

Slides

Materialy pomocnicze

Slajdy porzadkuja pojecia, ale nie zastepuja pracy. Najwazniejsze rzeczy dzieja sie podczas sesji i po nich.

Co zostaje po warsztacie

Zrozumienie zdobyte przez robienie, nie ogladanie.

Finalem nie jest obejrzany material. Finalem jest wlasne repo, logi, checkpoint, benchmark i intuicja, ktora powstaje dopiero wtedy, gdy samemu naprawia sie training run.

D

Dataset manifest

Wspolnie opracowana lista zrodel, filtry, licencje, deduplikacja, holdout i audit trail danych.

T

Tokenizer report

Porownanie tokenizacji, kompresji i kosztu z wynikami omawianymi na sesjach.

M

Training run

Konfiguracja, krzywa loss, checkpointy, sample, awarie i decyzje omawiane na Discordzie.

E

Eval pack

Minimalny prywatny benchmark, sanity checks, scoring i bramki przed kolejnym kosztem GPU.

Start

Dolacz do Discord community Slayer model training.

  • Format warsztatowy: 2-3 calle tygodniowo, zadania, review logow i wspolne debugowanie.
  • To nie jest biblioteka nagranych lekcji. To aktywna grupa robiaca wyzwanie treningu modelu od zera.
  • Dla osob, ktore chca zrozumiec training od danych do endpointu przez realna prace.
  • 30 dni od zakupu: zwrot bez pytan, bez drobnego druku.
Fabryka AI workshop
Slayer

Zapisy i szczegoly kohorty przez email. Kontakt: k.wikiel@gmail.com.

Kontakt