Predvideni program vaj

  1. Pregled podatkov pred multivariatno analizo
  2. Metode napovedovanja:
    • Multipla regresija I (osnovni model in regresijska diagnostika)
    • Multipla regresija II (nelinearni modeli, modeli s kategorialnimi napovedniki)
    • Logistična regresija
  3. Prvi delni kolokvij
  4. Metode strukturiranja:
    • Analiza glavnih komponent
    • Eksploratorna faktorska analiza
  5. Analiza manjkajočih podatkov
  6. Drugi delni kolokvij

Zgornji razpored je samo informativen in se lahko spreminja glede na različne nepredvidene dejavnike.

Gradiva za vaje

Splošno

Dodatne funkcije. Datoteka se bo občasno posodabljala (zadnja verzija: 16. 12. 2020)!
Seznam funkcij, ki jih bomo srečali na vajah. Tudi ta seznam bom posodabljal (zadnjič: 28.9.2018).

Priporočam, da pred prvimi vajami:
1. rešite osvežitvene naloge:
R: osvežitvene naloge.
Podatki za naloge.

2. rešite preizkus na tej povezavi. Pravilni odgovori bodo objavljeni po prvih vajah. Test je kratek in vam bo vzel le nekaj minut.

Lahko tudi preberete dodatek A in B v knjigi "Postopki klasične testne teorije" (Sočan, 2004/2011)
Datoteke za vaje iz Postopkov klasične testne teorije: PKTT - zip

1. Pregled podatkov pred multivariatno analizo

Pred vajami instalirajte paketa car in psych, lahko tudi takole:
install.packages(c("car", "psych"))

Zapiski za prve vaje
Koda za R
Podatki (csv)

2. Multipla linearna regresija

Napovedni model:
gradivo
(popravljena) koda za R
podatki (txt)

Literatura:
Analysis of Multivariate Social Science Data, 6. poglavje
Postopki klasične testne teorije, 4.3 in 4.4.1.

Domača naloga do 19. oktobra:
Preglejte podatke za multiplo regresijo. Preverite, ali so v podatkih manjkajoče vrednosti in ali se pojavljajo vrednosti, bistveno nižje ali višje od pričakovanega razpona (pribl. +/- 3 SD). Preglejte obliko porazdelitve in razmislite, v kolikšni meri se pri posameznih spremenljivkah prilega normalni (pomagajte si s funkcijami hist ali histkriv, car∷qqPlot, boxplot ali car∷Boxplot, psych∷describe). Preverite prisotnost uni-in multivariatnih osamelcev (za slednje si pomagajte s funkcijo mahalanobis ali mahalqq). Preglejte korelacijsko matriko in ocenite, ali so odnosi med spremenljivkami približno linearni (uporabite funkciji psych∷corr.test in car∷spm).

Diagnostika, kategorialni napovedniki in nelinearni odnosi (gradivo za 2. 11.):
podatki (.txt)
zapiski
R-jeva koda

Za primer z vzgojnim slogom in pismenostjo preverite, kako se spremenijo rezultati, če v model najprej vključite pismenost in šele nato vzgojni slog.

3. Logistična regresija

Zapiski
Podatki (txt)
R-jeva koda

Prvi delni kolokvij

Ponavljanje pred prvim delnim kolokvijem:
Naloge in podatki (zip) (popravljeno 22.11.)

Kolokvij bo vsaka od skupin opravljala v času svojih vaj. Vsa gradiva bodo na voljo v e-ućilnici (Moodle), kjer boste tudi oddali rezultate.

4. Analiza glavnih komponent

Literatura:
Analysis of Multivariate Social Science Data, 5. poglavje
Postopki klasične testne teorije, 5.1 in 5.3

Povzetek
R-jeva koda - 1. del (dodano 22. 11.)
Podatki - sposobnosti
Podatki - impulzivnost
R-jeva koda - 2. del

5. Eksploratorna/raziskovalna faktorska analiza

Analysis of Multivariate Social Science Data, 7. poglavje
Potrebovali bomo paket psych (priporočljiv je tudi GPArotation).
Besedilo
Podatki (1)
Podatki (2)

R-jeva koda (1)
R-jeva koda (2)

6. Manjkajoči podatki

Instalirajte paket missForest.
Besedilo
R-jeva koda
Podatki (txt)

Drugi delni kolokvij

Naloge za ponavljanje:
Navodila in podatki. V besedilu so naloge na prvih dveh straneh, ostalo so rešitve z outputi. Če imate težave s paketom GPRrotation, uporabite rotacijo promax namesto geomin.

Podatki bodo na voljo malo pred kolokvijem.