5 Esimerkkidatan silmäily

Silmäillään hieman esimerkkidataa, varmistetaan, että kaikki kunnossa. Katsotaan head-komennolla 10 ensimmäistä riviä:

id randt lastdt status age ps1 ps2 ps3 dt2 dt3 arm swtrtdt apumuuttuja
1 2018-01-12 2018-03-02 1 20 1 1 1 2018-02-02 2018-03-01 A NA 1
2 2017-11-04 2017-12-15 1 50 1 1 1 2017-12-01 2017-12-12 B NA 3
3 2017-05-20 2018-01-04 0 40 1 1 1 2017-08-02 2018-01-02 A 2018-01-01 3
4 2018-02-06 2018-09-06 1 42 1 1 1 2018-04-20 2018-06-05 B NA 1
5 2018-01-14 2019-01-10 1 38 1 1 1 2018-04-14 2018-04-26 A NA 1
6 2018-01-19 2018-10-03 1 46 1 1 1 2018-04-12 2018-05-24 A NA 1

5.1 Esimerkkidatan struktuuri

On parasta katsoa myös esimerkkidatan struktuuri. ipswswitch nikottelee heti vastaan, jos esim. kvalitatiiviset muuttujat eivät ole tyyppiä factor. Kaikki näyttää alla olevassa listauksessa olevan kunnossa.

str(toydata)
## 'data.frame':    400 obs. of  13 variables:
##  $ id         : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ randt      : Date, format: "2018-01-12" "2017-11-04" "2017-05-20" ...
##  $ lastdt     : Date, format: "2018-03-02" "2017-12-15" "2018-01-04" ...
##  $ status     : int  1 1 0 1 1 1 0 0 1 0 ...
##  $ age        : int  20 50 40 42 38 46 40 33 23 34 ...
##  $ ps1        : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ ps2        : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ ps3        : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ dt2        : Date, format: "2018-02-02" "2017-12-01" "2017-08-02" ...
##  $ dt3        : Date, format: "2018-03-01" "2017-12-12" "2018-01-02" ...
##  $ arm        : Factor w/ 2 levels "A","B": 1 2 1 2 1 1 2 2 2 2 ...
##  $ swtrtdt    : Date, format: NA NA "2018-01-01" ...
##  $ apumuuttuja: int  1 3 3 1 1 1 3 2 1 3 ...