Opis kursu: Regresja logistyczna jest jedną z bardziej popularnych technik wielowymiarowej analizy danych wykorzystywanych w medycynie i naukach przyrodniczych. Jest ona przydatna w sytuacji, gdy wartości zmiennej dwustanowej typu CHORY/ZDROWY bądź POWIKŁANIA/BRAK POWIKŁAŃ pragniemy objaśnić za pomocą innych zmiennych oraz ocenić siłę i kierunek wpływu tych zmiennych na analizowane zjawisko.
W pierwszej części kursu uczestnicy zapoznają się z podstawowymi pojęciami dotyczącymi regresji logistycznej - pojęciem szansy, ilorazu szans, interpretacji ocen parametrów regresji czy sposobie kodowania zmiennych jakościowych.
W swojej zasadniczej części kurs przybliży uczestnikom kompletny proces budowy modelu. Poruszone zostaną kwestie przygotowania danych do analizy, strategii budowy modelu wraz z doborem optymalnej liczby parametrów modelu oraz kwestie diagnostyki modelu i badania jakości jego dopasowania do danych.
Punkty edukacyjne dla lekarzy i lekarzy dentystów: firma StatSoft Polska jest wpisana do rejestru podmiotów prowadzących kształcenie podyplomowe lekarzy i lekarzy dentystów Okręgowej Izby Lekarskiej w Krakowie i za udział w tym kursie można uzyskać 12 punktów edukacyjnych.
Wymagania: umiejętność obsługi komputera w środowisku Windows, podstawowa znajomość pakietu STATISTICA.
Zalecamy wcześniejszy udział w kursie
STATISTICA kurs podstawowy lub
Statystyka dla niestatystyków lub
Statystyka w medycynie - metody podstawowe.
Kontynuacją mogą być np. kursy:
Statystyka w medycynie - metody analizy wariancji i analizy regresji,
Statystyka w medycynie - metody zaawansowane,
Statystyka w medycynie - metaanaliza.
Termin: 14-15.11.2012
Program kursu:
- Wprowadzenie do regresji logistycznej
- Przegląd zagadnień i problemów jakie można modelować za pomocą regresji logistycznej
- Definiowanie zmiennej zależnej
- Pojęcie szansy i ilorazu szans
- Przedziały ufności dla ilorazu szans
- Uwzględnianie zmiennych jakościowych w modelu regresji
- Interpretacja ocen parametrów regresji logistycznej
- Analiza jedno i wieloczynnikowa
- Wykres leśny (forest plot)
- Przygotowanie danych do analizy
- Wpływ liczności zbioru na możliwość przeprowadzenia modelowania
- Braki danych oraz możliwe sposoby radzenia sobie z brakami
- Testowanie losowości braków danych
- Imputacja braków danych
- Kategoryzacja zmiennych
- Radzenie sobie z wartościami odstającymi
- Badanie liniowości wpływu cech na zjawisko
- Badanie zmian szans względem zakresu wartości cechy
- Radzenie sobie z nieliniowym wpływem cechy na zjawisko
- Problem współliniowości zmiennych
- Testowanie interakcji pomiędzy zmiennymi niezależnymi
- Modelowanie
- Dobór parametrów do budowy modelu
- Przesłanki uwzględniania zmiennych w modelu
- Określanie dopuszczalnej liczby parametrów modelu
- Metody krokowe doboru parametrów modelu
- Ocena istotności ocen parametrów regresji oraz istotności modelu
- Test Walda
- Test LR
- AIC, BIC
- Badanie jakości dopasowania modelu
- Miary jakości modelu
- Krzywa ROC oraz pole powierzchni pod krzywą
- Test Hosmera-Lemeshowa
- Techniki walidacji modelu
- Podział na próbę uczącą i testową
- Radzenie sobie w sytuacji niewielkich zbiorów danych – metoda LOO (Leave One Out)
- Zagadnienia dodatkowe
- Wykorzystanie techniki Propensity score do poprawy rzetelności uzyskanych wyników
- Dobre praktyki raportowania wyników opracowanych za pomocą regresji logistycznej