5 Esimerkkidatan silmäily
Silmäillään hieman esimerkkidataa, varmistetaan, että kaikki kunnossa. Katsotaan head-komennolla 10 ensimmäistä riviä:
id | randt | lastdt | status | age | ps1 | ps2 | ps3 | dt2 | dt3 | arm | swtrtdt | apumuuttuja |
---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | 2018-01-12 | 2018-03-02 | 1 | 20 | 1 | 1 | 1 | 2018-02-02 | 2018-03-01 | A | NA | 1 |
2 | 2017-11-04 | 2017-12-15 | 1 | 50 | 1 | 1 | 1 | 2017-12-01 | 2017-12-12 | B | NA | 3 |
3 | 2017-05-20 | 2018-01-04 | 0 | 40 | 1 | 1 | 1 | 2017-08-02 | 2018-01-02 | A | 2018-01-01 | 3 |
4 | 2018-02-06 | 2018-09-06 | 1 | 42 | 1 | 1 | 1 | 2018-04-20 | 2018-06-05 | B | NA | 1 |
5 | 2018-01-14 | 2019-01-10 | 1 | 38 | 1 | 1 | 1 | 2018-04-14 | 2018-04-26 | A | NA | 1 |
6 | 2018-01-19 | 2018-10-03 | 1 | 46 | 1 | 1 | 1 | 2018-04-12 | 2018-05-24 | A | NA | 1 |
5.1 Esimerkkidatan struktuuri
On parasta katsoa myös esimerkkidatan struktuuri. ipswswitch nikottelee heti vastaan, jos esim. kvalitatiiviset muuttujat eivät ole tyyppiä factor. Kaikki näyttää alla olevassa listauksessa olevan kunnossa.
## 'data.frame': 400 obs. of 13 variables:
## $ id : int 1 2 3 4 5 6 7 8 9 10 ...
## $ randt : Date, format: "2018-01-12" "2017-11-04" "2017-05-20" ...
## $ lastdt : Date, format: "2018-03-02" "2017-12-15" "2018-01-04" ...
## $ status : int 1 1 0 1 1 1 0 0 1 0 ...
## $ age : int 20 50 40 42 38 46 40 33 23 34 ...
## $ ps1 : num 1 1 1 1 1 1 1 1 1 1 ...
## $ ps2 : num 1 1 1 1 1 1 1 1 1 1 ...
## $ ps3 : num 1 1 1 1 1 1 1 1 1 1 ...
## $ dt2 : Date, format: "2018-02-02" "2017-12-01" "2017-08-02" ...
## $ dt3 : Date, format: "2018-03-01" "2017-12-12" "2018-01-02" ...
## $ arm : Factor w/ 2 levels "A","B": 1 2 1 2 1 1 2 2 2 2 ...
## $ swtrtdt : Date, format: NA NA "2018-01-01" ...
## $ apumuuttuja: int 1 3 3 1 1 1 3 2 1 3 ...