Discord workshop / Fabryka AI

Slayer: trenujemy model od zera razem.

To nie jest kurs wideo. To warsztatowa społeczność na Discordzie, w której spotykamy się 2-3 razy w tygodniu, robimy zadania jak na ćwiczeniach na uniwersytecie i uczymy się treningu modeli przez realne uruchamianie pipeline'u.

Repozytoria i slajdy są materiałami pomocniczymi. Core to sesje, zadania i wspólne debugowanie.
8 bloków warsztatowych
2-3x call'e warsztatowe tygodniowo
Discord community, review, debug
30 dni zwrot bez pytań
Wyzwanie

Uczymy się, bo próbujemy wytrenować model od zera.

Slayer jest dla osób technicznych, które chcą zrozumieć, co dzieje się pod spodem. Mamy plan, slajdy i repozytoria, ale materiał nie jest produktem samym w sobie. Produktem jest praca w grupie: sesje, zadania, review i decyzje treningowe.

01 / dane

Korpus, licencje, jakość

Na sesjach budujemy dataset, usuwamy śmieci, deduplikujemy, odcinamy benchmark contamination i zapisujemy provenance.

quality gate
02 / tokenizer

Tokenizacja bez magii

Wspólnie trenujemy tokenizer, mierzymy kompresję na polskich danych i sprawdzamy, kiedy vocabulary niszczy koszt treningu.

bpe / unigram
03 / model

Architektura GPT

Przechodzimy przez blok transformera, attention, MLP, normy, embeddingi i rope tak, żeby umieć debugować training run.

pytorch
04 / training

Pętla treningowa

Robimy batching, optimizer, scheduler, mixed precision, gradient clipping, checkpointing i czytamy realne logi z loss curve.

loss / lr / grad
05 / eval

Ewaluacja i bramki

Projektujemy proxy benchmark, sanity checki generacji, regresje i metryki, które zatrzymują słaby run przed spaleniem GPU.

benchmarks
06 / deploy

Checkpoint do inferencji

Przerabiamy eksport, kwantyzację, vLLM/llama.cpp, OpenAI-compatible endpoint i podstawy monitoringu kosztu tokenów.

serving
Tryb pracy

Jak ćwiczenia na uczelni, tylko na prawdziwym modelu.

Calls

2-3 spotkania tygodniowo

Krótkie sesje robocze: kontekst, decyzja techniczna, live coding albo review, potem konkretne zadanie do wykonania.

Discord

Community i asynchroniczny debug

Wrzucamy logi, configi, wykresy, sample i błędy. Grupa widzi, co nie działa, i uczy się na realnych awariach.

Repos

Kod i zadania

Repozytoria są punktem startowym, nie gotową odpowiedzią. Uczestnicy dopisują pipeline, uruchamiają runy i porównują wyniki.

Slides

Materiały pomocnicze

Slajdy porządkują pojęcia, ale nie zastępują pracy. Najważniejsze rzeczy dzieją się podczas sesji i po nich.

Co zostaje po warsztacie

Zrozumienie zdobyte przez robienie, nie oglądanie.

Finałem nie jest obejrzany materiał. Finałem jest własne repo, logi, checkpoint, benchmark i intuicja, która powstaje dopiero wtedy, gdy samemu naprawia się training run.

D

Dataset manifest

Wspólnie opracowana lista źródeł, filtry, licencje, deduplikacja, holdout i audit trail danych.

T

Tokenizer report

Porównanie tokenizacji, kompresji i kosztu z wynikami omawianymi na sesjach.

M

Training run

Konfiguracja, krzywa loss, checkpointy, sample, awarie i decyzje omawiane na Discordzie.

E

Eval pack

Minimalny prywatny benchmark, sanity checks, scoring i bramki przed kolejnym kosztem GPU.

Start

Dołącz do Discord community Slayer model training.

  • Format warsztatowy: 2-3 calle tygodniowo, zadania, review logów i wspólne debugowanie.
  • To nie jest biblioteka nagranych lekcji. To aktywna grupa robiąca wyzwanie treningu modelu od zera.
  • Dla osób, które chcą zrozumieć training od danych do endpointu przez realną pracę.
  • 30 dni od zakupu: zwrot bez pytań, bez drobnego druku.
Fabryka AI workshop
Slayer

Zapisy i szczegóły kohorty przez email. Kontakt: k.wikiel@gmail.com.

Kontakt