Když si často hrajete s analýzou dat a Excel vás již štve, naučte se R. V tomto článku najdete bezplatné kurzy, knížky a další zdroje, které vám s tím pomohou.
Interaktivní kurzy
Nejjednodušší začátek. Nemusíte nic instalovat a přímo v prohlížeči se naučíte, jak si v R hrát s daty.
- DataCamp s šesti kapitolkami a 61 praktickými kroky. Zabere vám to maximálně dvě hodiny a naučíte se hodně. Kurz od belgických borců, co vyvíjejí R Fiddle.
- Try R je ještě popisnější a delší. Původně tento kurz fungoval placeně na Code School, ale starý O'Reilly to zasponzoroval, a máte to zadarmo!.
- Swirl použijete, až budete R mít spuštěné. Pak si můžete vybrat z několika kurzů, které rovnou v R zvládnete. Na swirl spoléhá také Coursera v rámci některých svých lekcí.
Online kurzy
Na Courseře jsem dělal kurzy Computing for Data Analysis a Data Analysis. Oba doporučuji.
Obecných statistických online kurzů je více. Já jsem prošel kurzem Statistics One z Princetonu a zkoušel jsem Statistics: Making Sense of Data z Univerzity v Torontu. Kurz Passion Driven Statistics se mi moc nelíbil, navíc se pracovalo v SASu.
České knihy o R
Česky psané zdroje jsou velmi krátké a výstižné.
- Arnošt Komárek. Základy práce s R. PDF, 16 stránek.
- Vladislav Bíma, Arnošt Komárek, Lenka Komárková. Jak na jazyk R. PDF, 18 stránek.
- Arnošt Komárek. Hrátky s R. PDF, 51 stránek.
- Michal Kulich. Stručný úvod do R. PDF, 6 stránek.
Manuály a knížky
Máte v kanceláři nástěnku? Pak si na ni vylepte cheat sheet o R (PDF, 6 stránek).
Do knihovničky či čtečky si pak vložte:
- W. N. Venables, D. M. Smith a R Core Team. An Introduction to R. PDF, 106 stránek, anglicky. Oficiálních publikací od vývojářů R je více na stránce The R Manuals.
- Gareth James, Daniela Witten, Trevor Hastie a Robert Tibshirani. Introduction to Statistical Learning with Applications in R. PDF, 441 stránek, anglicky.
- Julian J. Faraway. Practical Regression and Anova using R. PDF, 213 stránek, anglicky.
- J. H. Maindonald. Using R for Data Analysis and Graphics. PDF, 96 stránek, anglicky.
- Emmanuel Paradis. R for Beginners. PDF, 58 stránek, anglicky.
- Theresa Scott. An Introduction to R. PDF, 52 stránek, anglicky.
- John Verzani. simpleR – Using R for Introductory Statistics. PDF, 114 stránek, anglicky.
- seznam z Youtube pro 21 krátkých videí o R od Google.
- přístupy k programování v R vás naučí tutoriál od software carpentry.
I když si z těchto odkazů žádný nedočtete (chování návštěvníků tohoto blogu už znám…), aspoň si nebudete moci stěžovat, že se nemáte kam obrátit. Pokud byste byli i přesto ztraceni, můžete vyzkoušet R for Dummies. Já jsem z této edice zkoušel jen Statistics for Dummies a hodilo se to — statistici vám většinou nejsou schopni normální řečí vysvětlit, k čemu různé statistiky slouží.
Jste-li čtyřnohá kočka, čtěte vám přizpůsobený tutoriál.
Instalace R
Ať již budete dělat jakýkoliv kurz nebo číst kteroukoliv z knih, donutí vás nainstalovat si program R k sobě. Raději je tedy předběhněte.
Potřebujete jádro R (verze pro Windows, Mac i Linux/Android; na iTunes vidím i něco pro iOS) a prostředí RStudio (Windows, Mac, Linux/Android), ve kterém se dobře pracuje.
R pro webovou analytiku
Data z Google Analytics nahrajete do R, připojíte k nim svá interní data nebo chytře zanalyzujete, a fáze 3 je zisk.
- Petr Havlík na blogu Optimics sepsal praktický postup na získávání dat z Google Analytics do R. Zmíněnou knihovnu R Google Analytics od Brora Skardhamara používám často, neboť mimo jiné pomáhá proti nepopulárnímu vzorkování dat.
- V R je velmi jednoduché udělat analýzu nákupního košíku (které produkty se nakupují zároveň).
- I na data z Google Analytics lze použít analýzu sociálních sítí a jiné šlerkoviny.
- Mí oblíbení Indové z Tatvicu mají o R pro webovou analytiku a predikci mnoho praktických článků (vhodné např. pro e-shopy). Velmi aktuálním tématem je detekce anomálií, o které Ravi Pathak povídal na konferenci Superweek 2014. K dispozici je také starší video o anomáliích v klíčových ukazatelích. I když Adobe Analytics obdobné techniky přidává rovnou do nástroje, někteří na to využívají API a R.
Pro pravidelnou inspiraci slouží agregátor R-bloggers.
Pokud vás napadne další užitečný zdroj, přispějte do komentářů.
Aktualizováno 25.2.2015 o swirl, R for cats a videa od Google.
Ahoj,
prvně bych rád pochválil blog. Dnes jsem na něj narazil poprvé a zítra určitě projdu i další blogposty.
Za druhé, rád bych se tě zeptal, jaké zdroje by jsi doporučil k analýze dat, které se zpravidla týkají webu, výkonnosti apod. Např. do této skupiny řadím kohortní analýzu retence, RFM segmentaci apod.
Díky za odpověď. Ať se daří.
Ahoj,
díky. K tématům, která zmiňuješ, mám seznam zdrojů uveden pod nedávnou přednáškou na Marketing Festivalu: http://jasek.info/festival/
K tomu bych ještě chtěl doplnit blog Petra Šimečka z Kebooly: http://padak.keboola.com (psal o RFM, kohortách, detekci anomálií i jiných potřebných technikách).
Pavel
pan Jasek stale niecim prekvapi, tesim sa na nejake skolenie.. verim ze nejake o analytike vyskoci. pozdravujem
Přehled online kurzů o R: http://www.flaviobarros.net/…ces-learn-r/
Sbírka konkrétních metod (např. analýza časových řad, forecasting) http://blog.revolutionanalytics.com/…ta-book.html . Z tohoto zdroje vybírám užitečné příklady pro data mining: http://cran.r-project.org/…a_mining.pdf
Knihy o strojovém učení v R:
http://machinelearningmastery.com/…ning-with-r/
Praktické tutoriály na tvorbu modelů, analýzu dat a pokročilé metody využití R z konference UseR 2014:
http://user2014.stat.ucla.edu/#…
Pingback: Poznámky z akce II. Prague R Meetup • Dlouhý chvost
Pingback: Datové knížky • Dlouhý chvost