Zaawansowane uczenie maszynowe:
wymagania i wskazówki techniczne do realizacji projektu
Wymagania
- Wyniki realizacji projektu muszą być dostarczone w formie linku
do udostępnionego
notatnika Google
Colab.
- Notatnik musi zawierać kod źródłowy projektu w języku R lub
Python oraz dokumentację (w tym wyniki eksperymentów), przy czym
część kodu źródłowego może znajdować się w osobnych plikach (.R
lub .py) włączanych/importowanych do notatnika.
- Notatnik wraz z ewentualnami dołączonymi dodatkowymi plikami
źródłowymi musi realizować całość przetwarzania danych
wykonanego w ramach projektu oraz być całkowicie
samowystarczalny, tzn. zawierać wszystkie polecenia niezbędne
do wykonania kodu i uzyskania wyników, w tym pobranie i
przygotowanie danych, pobranie ewentualnych dodatkowych plików
źródłowych, instalację wykorzystywanych pakietów bibliotecznych
itp.
- W przypadku, gdy przeprowadzone eksperymenty są czasochłonne
(więcej niż kilka-kilkanaście minut), należy dodatkowo
udostępnić "szybką" wersję notatnika, różniącą się od wersji
pełnej wyłącznie użyciem odpowiednio mniejszych losowych
podzbiorów danych oraz (tam, gdzie to ma zastosowanie)
zmniejszeniem liczby iteracji wykonywanych algorytmów iteracyjnych
(w tyn np. liczby pętli walidacji krzyżowej).
Wskazówki
- Notatnik z kodem w języku R można utworzyć
używając tego
linku.
- Użycie kodu R w ramach notatnika dla języka Python jest możliwe
dzięki użyciu
pakietu rpy2.
- Minimalne przykłady notatników demonstrujące pobieranie zbiorów
danych i dodatkowych plików źródłowych:
Strona przedmiotu ZUM
Paweł Cichosz