4 Workflow R:llä työskennellessä

R:llä työskennellessä workflow kulkee usein seuraavasti:

  1. tutkimusdata valmistellaan “paljailla” R-skripteillä
  2. tilastoajot tehdään sitten suoraan R Markdown -dokumentissa

Workflow’n jako R-skripteihin ja R Markdown -dokumentteihin on toki täysin vapaata ja yksilöllistä - toiset tekevät kaiken tai lähes kaiken suoraan R Markdown -dokumenteissa, toiset taas tekevät vain varsinaiset tilastoanalyysit ja visualisoinnit R Markdownin puolella.

Voit kysellä, että mitä hyötyä on ajaa tilastoajot R Markdown -dokumentissa. Vastaan seuraavasti.

Kuvittele tilannetta, jossa kirjoittaisit MS Wordilla kollegoillesi raporttia, jossa olisi tekstin ohella useita taulukoita ja kuvaajia. Jos tutkimustyön ohjaajasi huomaisi jonkun virheen ja pyytäisi sinua korjaamaan dataasi, sinun pitäisi korjausten jälkeen yksi kerrallaan ladata uudet taulukot ja kuvaajat MS Word -dokumenttiin. (Toim. huom.: “Been there, done that… 😭”) R Markdown -dokumentissa tälle ei ole tarvetta: taulukot ja kuvaajat päivittyvät automaattisesti, jos muutat jotakin datassasi.

Halutessasi voit milloin vain sementoida R Markdownilla kirjoittamasi tekstin kuvaajineen valmiiksi ja jakaa sen vaikka juuri MS Word -muodossa kollegoillesi - tai PDF:nä.

Kolmas vaihtoehto on tehdä kuten tein tämän tekstin kanssa, jota juuri luet todennäköisesti web-muodossa: päätin kääntää sen HTML:ksi, jotta sain tehtyä tästä pikaoppaasta verkkosivut.


R-opas by Ville Langén is licensed under Attribution-ShareAlike 4.0 International