Въведение в статистическото програмиране с R

Съдържание
R е език за статистическо програмиране, той е безплатен и с отворен код. Използва се главно за операциите на извличане на данни или статистика, всичко това с цел създаване на приложения за анализ на големи количества данни.
Интерфейсът на командния ред на R Отначало това може да бъде донякъде плашещо, но това е засенчено след оценяването на силата и възможностите, които езикът ни предлага за споделяне и възпроизвеждане на информационен анализ.
R Тя може да бъде изтеглена безплатно за всички съществуващи днес безплатни платформи, имаме възможност да я инсталираме в Windows, Linux и дори Mac.
За целите на този урок ще използваме версията за Windows които можем да намерим на официалната страница на проекта в следния линк. След изтегляне и инсталиране ще имаме нашето функционално копие на R, ако го изпълним, ще имаме началния екран на R което трябва да изглежда така:

R Позволява ни да работим с данни по бърз и ефективен начин, но интерфейсът му по подразбиране не е идеален за тази задача. Един от проблемите е, че всичко се отваря в отделни прозорци, което затруднява работата, а също и интерфейсът на командния ред не е еднакъв във всички операционни системи.
Въпреки че има много интерфейси за решаване на този проблем, в този урок ще използваме RStudio която е достъпна за всички платформи, но е важно да се спомене, че е необходимо да има R инсталиран преди инсталирането, за да получите версията на Windows отиваме на следната връзка и изтегляме съответната версия.
След инсталацията изпълняваме RStudio и трябва да видим основния интерфейс:

RStudio ни дава организацията на всички прозорци на R в рамките на един панел и допълнително ни дава достъп до функции, които могат да бъдат трудни за намиране, в допълнение към това можем да споменем и други допълнителни предимства:
  • Нека разделим нашата работа на Проекти където всеки от тях ще има своята работна директория, история и изходни файлове.
  • Интеграция с GitHub.
  • Позволява ви да съхранявате история графично.
  • Можете да експортирате графиките в различни формати и размери.
  • Тя ни позволява да завършим кода с табличния ключ.
  • Можете да създавате интерактивни диаграми благодарение на определени пакети.
Както виждаме RStudio е доста оптимален начин за работа RНа пазара обаче има и други решения, всеки човек трябва да ги проучи и да прецени дали са по -добре адаптирани към нуждите на всеки човек.
Има няколко начина за работа R където първото нещо, на което ще обърнем внимание, е R конзолаВъпреки факта, че не можем да съхраняваме свършената работа тук, е доста полезно да тестваме някои функции и да започнем да се запознаваме с езика.
Работата с конзолата е доста проста, въвеждаме команда и след това R ни дава изхода, нека опитаме проста операция за добавяне, както следва:
> 10 + 7

Ние натискаме Въведете и автоматично R В следния ред той ни дава отговор на нашата операция:

Както можем да видим в изображението, първият ред съдържа командата с нашата операция, важно е да споменем това R не изисква използването на точка и запетая за завършване на реда или друг терминален оператор. Можем да видим във втория ред преди отговора [1] това показва начина, по който R изпълнява аритметични операции и използва вектор, първият означава индекса на първия елемент на вектора, където можем да подчертаем, че много други езици обработват индексите от нулата, но R прави го от единия.
Както споменахме по -рано, конзолата е доста полезна, но не е най -добрата за работа, главно защото няма възможност за съхраняване на нашите команди и възможност за въвеждане само на една команда наведнъж, нещо подобно се случва с Python, но не бива да се притесняваме оттогава RStudio ни дава скриптов прозорец разположена в горната част на нашата конзола, ако не я намерим, отиваме на Файл> Нов файл> R скрипт или натиснете Shift + Command + N.
По принцип R скриптът е обикновен текст с разширението .R. За да видим как работи, можем да пресъздадем нашата аритметична операция от предишния пример, като създадем нов скрипт и добавим няколко допълнителни командни реда, нека видим:
 10 + 7 1:50 печат ("Hello World") 

А R скрипт можете да стартирате ред по ред с опцията, която имаме в горното меню, наречена Бягай и ще видим изхода на същия в конзолата, нека видим отговора за всеки ред от нашия скрипт:

Как можем да видим, че първият ред ни дава резултата, който получихме по -рано, вторият ред създава списък с числа от 1 до 50, където числото в скоби е първият индекс за този ред и накрая имаме впечатлението за класическия Здравей свят.
След като видяхме начините, по които можем да работим с езика, ще преминем към по -теоретични концепции, за да разберем по -добре какво имаме на разположение в езика за работа и изпълнение на нашите проекти.
Както във всички езици за програмиране, променливи са един от най -важните аспекти, за да ги създадете R Трябва само да напишем името му, без да дефинираме типа. Ние използваме оператор за присвояване за да даде стойността на променливата.
ВажноМожем да присвоим стойността на променлива със знак за равенство, но това е лоша практика в R, за да направите правилното присвояване, използвайте оператора <-.
Нека да видим как присвояването на стойност на променлива и след това отпечатването й изглежда:
 x <- 58 x 

Можем също така да присвоим няколко стойности на нашите променливи с функцията конкатенация:
y <- c (5, 2, 11, 28, 17)

Ако изпълним примера, ще видим в десния панел как имаме стойността на х и числовия списък, присвоен на Y:

Увеличете

Освен това, за да премахнем променлива от работното пространство, просто трябва да използваме функцията rm, дори можем да почистим цялото работно пространство, нека видим как правим това:
 rm (x) rm (списък = ls ()) 

С първия ред премахваме променливата, а с втория ред цялото пространство.
В езика имаме четири структури от данни, които се разпознават от R:
Анимационен векторВектор е едноизмерен масив, където всички данни, присъстващи в него, трябва да бъдат от един и същ тип, цяло число, char и т.н., освен това е важно да се отбележи, че това е основният обект от данни в R.
Масиви и матрициМатрицата е подобна на вектор, при който данните трябва да са от същия тип, но матрицата има две измерения и информацията е организирана в редове и колони. Масивът е подобен на масива, но може да има повече от две измерения.
Рамки за данниРамките с данни са колекция от вектори със същата дължина, тя е подобна на матрицата, но особеността на този тип структура е, че те могат да бъдат от смесени типове данни, където векторите могат дори да имат имена.
СписъциНай -общият тип структура в R, списък е колекция от елементи от всякакъв клас, дължина или структура, можем дори да имаме други списъци.
Освен това, R Той има няколко функции, които ни позволяват да преобразуваме един тип структура в друг, нека видим:
as.vector ()Тази функция ви позволява да конвертирате матрици в едномерни вектори.
as.matrix ()Можете да конвертирате структури от данни в масив.
as.data.frame ()Можете да конвертирате структури от данни в рамки от данни.
as.list ()Можете да конвертирате структури от данни в списъци.
Една от силните страни на R е, че можете да добавяте пакети, които ни позволяват да разширим функционалностите на езика. На други езици тези плъгини идват в библиотеки, но в R библиотеката е мястото, където се съхраняват всички пакети.
The пакети на R може да дойде от две различни места, някои идват с R по подразбиране, но те не са активни, а други могат да бъдат намерени в онлайн хранилища.
За да видите пакетите, които в момента са инсталирани или заредени, можем да изпълним следните функции:
 библиотека () търсене () 

Функцията библиотека () ни носи списък на пакетите, които са инсталирани в момента, нека видим част от това, което ни хвърля, когато изпълним този ред:

Функцията Търсене () От друга страна, той ни показва чрез конзола пакетите, които са заредени в момента, нека видим на следващото изображение кои пакети сме заредили:

Освен това, за да инсталираме пакети, можем да го направим по няколко начина, първият е чрез опцията в горното меню Инструменти> Инсталиране на пакети и след това имаме чрез функциите на езика, последният е този, който препоръчваме, тъй като по този начин може да бъде част от нашия скрипт.
За да инсталираме пакет, който използваме install.packages, след това трябва да го включим, можем да използваме библиотека или изискват За това обаче е най -добре да използвате последното, за да избегнете объркване с обхвата на функциите, нека видим как ще инсталираме и включим пакета ggplot2:
 install.packages ("ggplot2") изискват ("ggplot2") 

Накрая, за да изтрием пакет, който можем да използваме премахнете.пакети, нека видим как се използва:
remove.packages ("ggplot2")

С това приключваме този урок, с който вече имаме представа как да работим R, в допълнение към изясняване на точки като променливи и структури от данни, съществени аспекти, които трябва да знаем, за да се възползваме пълноценно от този мощен и ефективен език.Хареса ли ви и помогнахте на този урок?Можете да възнаградите автора, като натиснете този бутон, за да му дадете положителна точка
wave wave wave wave wave