Regresja logistyczna w badaniach medycznych i przyrodniczych


Opis szkolenia: Regresja logistyczna jest jedną z bardziej popularnych technik wielowymiarowej analizy danych wykorzystywanych w medycynie i naukach przyrodniczych. Jest ona przydatna w sytuacji, gdy wartości zmiennej dwustanowej typu CHORY/ZDROWY bądź POWIKŁANIA/BRAK POWIKŁAŃ pragniemy objaśnić za pomocą innych zmiennych oraz ocenić siłę i kierunek wpływu tych zmiennych na analizowane zjawisko.
W pierwszej części kursu uczestnicy zapoznają się z podstawowymi pojęciami dotyczącymi regresji logistycznej – pojęciem szansy, ilorazu szans, interpretacji ocen parametrów regresji czy sposobie kodowania zmiennych jakościowych.
W swojej zasadniczej części kurs przybliży uczestnikom kompletny proces budowy modelu. Poruszone zostaną kwestie przygotowania danych do analizy, strategii budowy modelu wraz z doborem optymalnej liczby parametrów modelu oraz kwestie diagnostyki modelu i badania jakości jego dopasowania do danych.

Punkty edukacyjne dla lekarzy i lekarzy dentystów: firma StatSoft Polska jest wpisana do rejestru podmiotów prowadzących kształcenie podyplomowe lekarzy i lekarzy dentystów Okręgowej Izby Lekarskiej w Krakowie i za udział w tym kursie można uzyskać 12 punktów edukacyjnych.

Wymagania: umiejętność obsługi komputera w środowisku Windows, podstawowa znajomość pakietu STATISTICA. Zalecamy wcześniejszy udział w kursie STATISTICA kurs podstawowy lub Statystyka dla niestatystyków lub Statystyka w medycynie – metody podstawowe.

Kontynuacją mogą być np. szkolenia:Statystyka w medycynie – metody analizy wariancji i analizy regresji, Statystyka w medycynie – metody zaawansowane, Statystyka w medycynie – metaanaliza.

Terminy szkoleń: 15.11.2017 - 16.11.2017;

Program szkolenia:

  1. Wprowadzenie do regresji logistycznej
    • Przegląd zagadnień i problemów jakie można modelować za pomocą regresji logistycznej
    • Definiowanie zmiennej zależnej
    • Pojęcie szansy i ilorazu szans
    • Przedziały ufności dla ilorazu szans
    • Uwzględnianie zmiennych jakościowych w modelu regresji
    • Interpretacja ocen parametrów regresji logistycznej
    • Analiza jedno i wieloczynnikowa
    • Wykres leśny (forest plot)
  2. Przygotowanie danych do analizy
    • Wpływ liczności zbioru na możliwość przeprowadzenia modelowania
    • Braki danych oraz możliwe sposoby radzenia sobie z brakami
      • Testowanie losowości braków danych
      • Imputacja braków danych
      • Kategoryzacja zmiennych
    • Radzenie sobie z wartościami odstającymi
    • Badanie liniowości wpływu cech na zjawisko
      • Badanie zmian szans względem zakresu wartości cechy
      • Radzenie sobie z nieliniowym wpływem cechy na zjawisko
    • Problem współliniowości zmiennych
    • Testowanie interakcji pomiędzy zmiennymi niezależnymi
  3. Modelowanie
    • Dobór parametrów do budowy modelu
      • Przesłanki uwzględniania zmiennych w modelu
      • Określanie dopuszczalnej liczby parametrów modelu
      • Metody krokowe doboru parametrów modelu
    • Ocena istotności ocen parametrów regresji oraz istotności modelu
      • Test Walda
      • Test LR
      • AIC, BIC
  4. Badanie jakości dopasowania modelu
    • Miary jakości modelu
      • Krzywa ROC oraz pole powierzchni pod krzywą
      • Test Hosmera-Lemeshowa
    • Techniki walidacji modelu
      • Podział na próbę uczącą i testową
      • Radzenie sobie w sytuacji niewielkich zbiorów danych – metoda LOO (Leave One Out)
  5. Zagadnienia dodatkowe
    • Wykorzystanie techniki Propensity score do poprawy rzetelności uzyskanych wyników
    • Dobre praktyki raportowania wyników opracowanych za pomocą regresji logistycznej