Analizy chemometryczne w STATISTICA – kurs podstawowy



Opis szkolenia:
W trakcie kursu zasadniczy nacisk położony jest na poznanie podstawowych technik analizy chemometrycznej. Początkowy etap jest wprowadzeniem teoretycznym do zagadnień analizy danych, ze szczególnym uwzględnieniem etapu planowania i wykonania eksperymentu oraz przygotowania danych. W części poświęconej planowaniu i wykonaniu eksperymentu zostaną poruszone zagadnienia związane z jakością wyników analiz, koniecznością opisu doświadczenia, parametrów eksperymentu jak również koniecznością subiektywnej oceny jakości próbek, która może stanowić istotną informację na etapie tworzenia macierzy danych. W części poświęconej przygotowaniu danych będą omówione strategie postępowania w przypadku, gdy braki danych wynikają z sytuacji, gdy stężenie analitu jest niższe niż granica wykrywalności metody analitycznej lub gdy nie wykonano pomiaru. Szczegółowo zostanie omówione znaczenie etapu kontroli danych jak również powszechne strategie transformacji zmiennych. W części poświęconej podstawowym technikom analizy chemometrycznej zostaną omówione: analiza podobieństwa (analiza skupień, jednoczesna analiza obiektów i cech), analiza dyskryminacyjna oraz analiza głównych składowych. Dane wykorzystywane w trakcie kursu w przykładach analiz pochodzą z rzeczywistych badań chemiczno-mikrobiologicznych opublikowanych w literaturze o zasięgu światowym.

Wymagania: Umiejętność obsługi komputera w środowisku Windows, podstawowa znajomość pakietu STATISTICA. Zalecamy wcześniejszy udział w kursie STATISTICA kurs podstawowy lub Statystyka dla niestatystyków

Kontynuacją mogą być np. szkolenia:DOE – komputerowe wspomaganie planowania i analizy statystycznej badań innowacyjnych,
Sieci neuronowe,
kursy z cyklu data mining.

Terminy szkoleń: 26.06.2017 - 27.06.2017; 13.11.2017 - 14.11.2017;

Program szkolenia

  1. Wstęp
    • cele i Program szkolenia
  2. Wprowadzenie teoretyczne do technik chemometrycznych
  3. Planowanie i wykonanie eksperymentu
    • wyniki analiz
    • opis doświadczenia
    • parametry eksperymentu
    • ocena organoleptyczna (głównie wizualna/zapachowa) jakości próbek
  4. Przygotowanie danych
    • braki danych
      • zastępowanie braków w danych w przypadku gdy wartość oznaczenia była niższa niż granica wykrywalności metody analitycznej
      • zastępowanie braków w sytuacji gdy nie wykonano pomiaru
    • kontrola danych
      • wyeliminowanie pomyłek powstałych w trakcie przygotowania danych, czyli tzw. „błędów grubych”
      • wykrycie w zbiorze danych obiektów różniących się istotnie od innych, czyli tzw. punktów odbiegających
      • uzyskanie przesłanek do ewentualnej transformacji niektórych zmiennych
      • określenie jednorodności zbioru danych, czyli potwierdzenie pochodzenia wszystkich danych z tej samej populacji
    • transformacja zmiennych
      • normalizacja
      • autoskalowanie
      • centrowanie
      • inne
  5. Podstawowe informacje o zarządzaniu arkuszem
    • usuwanie danych parami
    • zstępowanie średnią
    • etykiety tekstowe – włączanie/wyłączanie przypadków
  6. Analiza podobieństwa – CA (ang.: Cluster Analysis)
    • wstęp teoretyczny
    • analiza skupień (grupowanie względem obiektów i cech)
      • metody aglomeracji (pojedyncze wiązanie, pełne wiązanie, średnich połączeń, średnich połączeń ważonych, metoda Warda)
      • miary odległości (odległość euklidesowa, odległość kwadratowa euklidesowa, odległość Manhattan, odległość Czebyszewa, 1-r Persona, niezgodność procentowa)
      • indeks Sneatha w ocenie ilości statystycznie istotnych skupisk
    • jednoczesna analiza obiektów i cech, technika „cluster imaging”
  7. Analiza funkcji dyskryminacyjnej: LDA (ang.: Linear Discriminant Analysis)
    • wstęp teoretyczny
    • analiza krokowa (standardowa, postępująca)
    • wybór zmiennych
    • definiowanie analizy
    • interpretacja wyników
  8. Techniki czynnikowe: PCA (technika analizy głównych składowych; ang.: Principal Component Analysis)
    • wstęp teoretyczny
    • definiowanie analizy
    • identyfikowanie liczby istotnych czynników (wykres osuwiska, kryterium jedności)
    • strategie rotacji
    • interpretacja głównych składowych (wartość własna, % wyjaśnionej wariancji, % skumulowany wyjaśnionej wariancji)
    • wizualizacja
    • wyjaśnienie różnicy pomiędzy wizualizacją ładunków czynnikowych i wartości czynnikowych
  9. Przykłady do samodzielnej analizy