Monday 26 December 2016

Pemograman Dasar dengan R - Bagian 1

Struktur Data Pada R

Tutorial  pemograman dasar dengan R bagian 1 ini saya sadur dari buku The Art of R Programming  tentunya dengan gaya bahasa yang saya pahami. Bahasa pemograman R adalah bahasa pemograman open source pertama kali dibuat oleh Ross Ihaka dan Robert Gentleman dari Departemen Statistik Universitas Auckland Selandia Baru merupakan software environment untuk analysis statistik dan dapat menampilkan report-nya dalam bentuk grafik.  

Apabila kita mempunyai harapan untuk menjadi data scientist saya menyarankan untuk menguasai bahasa pemograman R ini, karena selain open source bahasa R diperuntukan untuk analysis statistik serta  dapat dihubungkan dengan framework spark untuk mengolah Big data. R dapat di download di https://cran.r-project.org/bin/windows/base/ untuk versi studio dapat di download di https://www.rstudio.com/products/rstudio/download/

Setelah R dapat diinstall diharapkan pembaca langsung mempraktekan dan menuliskan kembali contoh kode yang diberikan bukan hanya copy paste supaya terbiasa.

Gambar tampilan R Studio


Pada tulisan ini saya akan mengenalkan struktur data dari R yang meliputi:
  • ·         Vektor
  • ·         Matrik
  • ·         Array
  • ·         Data Frame
  • ·         List

Vektor
Vektor merupakan array berdimensi satu  dalam bahasa R perintah vector dinotasikan dengan sebuah fungsi c() contoh kode:
#vektor Numerik
>x <- c(88,5,12,13)
>x
[1] 88 5 12 13
Pada contoh kode diatas kita mendefinisikan sebuah vector numerik x dengan 88, 5, 12 dan 13 kemudian pada baris kedua kita memanggil vektor x .
  
Matrik
Matrik merupakan Array berdimensi dua yang mempunyai unsur atau type data data yg sama, matrik dalam R didefinisikan dengan perintah matrix, dengan format sebagai berikut:
myymatrix <- matrix(vektor, nrow=r, ncol=c)
vektor  = berisi unsur-unsur dari matrik
r           = banyaknya baris
c           = banyaknya kolom
contoh kode:
> y <- matrix(c(1,2,3,4), nrow = 2, ncol = 2)
> y
     [,1] [,2]
[1,]    1    3
[2,]    2    4


Array
Array pada R didefinisikan dengan perintah array , seperti vector dan matrik, array juga hanya berisi satu jenis data, contoh kode:
> a <- array(c("green", "yellow"), dim = c(3,3,3))
> a
, , 1
 
     [,1]     [,2]     [,3]    
[1,] "green"  "yellow" "green" 
[2,] "yellow" "green"  "yellow"
[3,] "green"  "yellow" "green" 
 
, , 2
 
     [,1]     [,2]     [,3]    
[1,] "yellow" "green"  "yellow"
[2,] "green"  "yellow" "green" 
[3,] "yellow" "green"  "yellow"
 
, , 3
 
     [,1]     [,2]     [,3]    
[1,] "green"  "yellow" "green" 
[2,] "yellow" "green"  "yellow"
[3,] "green"  "yellow" "green"

  
Data Frame
Data frame merupakan kumpulan data dalam bentuk tabular dan pada data frame dapat berisi jenis data yang berbeda, pada R data frame didefinisikan dengan perintah data.frame , contoh kode:

> kids <- c("jack", "Jill")
> ages <- c(12,13)
> d <- data.frame(kids, ages)
> d
  kids ages
1 jack   12
2 Jill   13


List
List adalah struktur data yang bisa berisi lebih dari satu jenis data (numerik, karakter dll) dan lebih dari satu struktur data (vektor dll) dan didefinisikan dengan perintah list contoh kode:

> j <- list(name="Joe", salary=55000)
> j
$name
[1] "Joe"
 
$salary

[1] 55000