Zaawansowane uczenie maszynowe:
wymagania i wskazówki techniczne do realizacji projektu
Wymagania
- Wyniki realizacji projektu muszą być dostarczone w formie linku
do udostępnionego
notatnika Google
Colab oraz wyeksportowanego z niego pliku w formacie PDF.
- Notatnik musi zawierać kod źródłowy projektu w języku R lub
Python oraz dokumentację (w tym wyniki eksperymentów w postaci
tabel lub wykresów, odpowiednio skomentowanych).
- Część kodu źródłowego może znajdować się w osobnych plikach (.R
lub .py) włączanych/importowanych do notatnika.
- Należy zadbać o czytelny układ zawartości notatnika, w tym
wydzielenie fragmentów dokumentacji nieodnoszących się
bezpośrednio do kodu i generowanych szczegółowych wyników i
umieszczenie ich na początku (np. intepretacja zadania, założenia
itp.) lub na końcu (np. podsumowująca dyskusja wyników i
wnioski), zaś przeplatanie z kodem wyłącznie tych fragmentów,
które wyjaśniają ten kod lub bezpośrednio komentują szczegółowe
wyniki.
- Notatnik wraz z ewentualnami dołączonymi dodatkowymi plikami
źródłowymi musi realizować całość przetwarzania danych
wykonanego w ramach projektu oraz być całkowicie
samowystarczalny, tzn. zawierać wszystkie polecenia niezbędne
do wykonania kodu i uzyskania wyników, w tym pobranie i
przygotowanie danych, pobranie ewentualnych dodatkowych plików
źródłowych, instalację wykorzystywanych pakietów bibliotecznych
itp.
- W przypadku, gdy przeprowadzone eksperymenty są czasochłonne
(więcej niż kilka-kilkanaście minut), należy dodatkowo
udostępnić "szybką" wersję notatnika, różniącą się od wersji
pełnej wyłącznie użyciem odpowiednio mniejszych losowych
podzbiorów danych oraz (tam, gdzie to ma zastosowanie)
zmniejszeniem liczby iteracji wykonywanych algorytmów iteracyjnych
(w tyn np. liczby pętli walidacji krzyżowej).
Wskazówki
- Notatnik z kodem w języku R można utworzyć
używając tego
linku.
- Użycie kodu R w ramach notatnika dla języka Python jest możliwe
dzięki użyciu
pakietu rpy2.
- Minimalne przykłady notatników demonstrujące pobieranie zbiorów
danych i dodatkowych plików źródłowych w celu zapewnienia
samowystarczalności:
Strona przedmiotu ZUM
Paweł Cichosz