Veri Analizi İçin Olmazsa Olmaz R Paketleri | Gülşah Semiz
Veri Analizi İçin Olmazsa Olmaz R Paketleri

Veri analizi yaparken kullanılan olmazsa olmaz R paketleri (kütüphaneleri): tidyverse (ggplot2, dplyr, readr vb.), xml2, caret, sqldf, tseries, zoo, forecast, randomForest, tree, gam, e1071, xml2, ggmap, caret, pls, plotly.


Veri Analizi İçin Olmazsa Olmaz R Paketleri

R’ı ve özellikle RStudio’yu çok seven biri olarak, bu yazıyı yazmakta neredeyse geç kaldığımı düşünüyorum.

Peki R’ı Neden Bu Kadar Seviyorum?

R’ı bu kadar sevmemin temel sebebi açık kaynak kodlu olması. Çünkü açık kaynak kodlu olması demek, ticari programların tam tersine, gönüllü yazılımcılar oluşturulduğu ve sürekli geliştirildiği anlamına geliyor.

Bu da tabi ki, bir veri analizci olarak ihtiyaç duyduğunuz hemen hemen her model için bu harika topluluğun üyeleri tarafından geliştirilmiş bir R paketi olduğu anlamına geliyor.

Eğer zaten halihazırda bir R kullanıcı iseniz ya da veri analizi alanında çalışıyorsanız, bunları biliyorsunuz demektir. Fakat tüm bunları biliyor olmanız, kullanabileceğiniz tüm R paketlerini de bildiğiniz anlamına gelmiyor. İşte bu yüzden bu yazımda kendi kullandığım ve veri analizinde mutlaka ihtiyacınız olacak bazı paketleri burada listelemeye karar verdim.

Veri Analizi için Olmazsa Olmaz R Kütüphaneleri

  • tidyverse: bir koleksiyon paket. Aşağıdaki paketleri (ve daha fazlasını) içeriyor:
    • ggplot2: verilerin görselleştirilmesi için esas bir paket.
    • dplyr: veri manipülasyonu için kullanılır.
    • readr: csv ya da tsv gibi dikdörtgen şeklindeki veri tablolarının okunması için kullanılır.
    • stringr: karakterden oluşan verilerin manipülasyonu için kullanılır
    • Tüm hepsini ve daha fazlasını tek seferde indirmek için bu kodu çalıştırabilirsiniz: install.packages(“tidyverse”)
  • sqldf: R üzerinde SQL sorgularını çalışmak için
  • tseries: zaman serisi objelerini (ts) analiz etmek için esas bir paket, özellikle finansal veri analizinde oldukça kullanışlı.
  • zoo: düzensiz (ve tabi ki düzenli) zaman serisi objelerinin analizinde kullanılır.
  • forecast: ARIMA gibi modelleri kullanarak zaman serisi verilerinden tahmin yapmak için kullanılır.
  • randomForest: Random Forest (Rastgele Orman) yöntemi kullanarak sınıflandırma ve regresyon modelleri oluşturmak için kullanılır.
  • tree: sınıflandırmak ve regresyon ağaçları oluşturmak için kullanılır.
  • gam: düz bir çizgi şeklinde olmayan veri ilişkilerini daha iyi açıklamak için ihtiyaç duyulan regresyon modellerini oluşturmak için kullanılır.
  • e1071: içerisinde çeşitli ve oldukça önemli istatistik modelleri bulundurur.
  • xml2: xml dosyalarının R’ın içerisine aktarılmasında ve doğru parçalarak ayrılarak okunmasında kullanılır.
  • ggmap: ggplot2 içerisinde görsel olarak etkileyici haritalar oluşturmak için kullanılır.
  • caret: regresyon ve sınıflandırma modellerin öğretilme sürecinde kullanılır.
  • pls: Principal component regression da dahil olmak üzere çok değişkenli regresyon modelleri oluşturmak için kullanılır.
  • plotly: interaktif grafikler oluşturmak için kullanılır.

Bazı paketlerin ortak olarak içerdiği fonksiyonlar olabilir ama hepsinde mutlaka özgün ve işe yarar bir fonksiyon bulacaksınız.

Tüm Paketleri İndirin

Aşağıdaki kodu çalıştırarak tüm bahsettiğim paketleri tek seferde indirebilirsiniz.

install.packages("tidyverse")
install.packages("xml2")
install.packages("caret")
install.packages("sqldf")
install.packages("tseries")
install.packages("zoo")
install.packages("forecast")
install.packages("randomForest")
install.packages("tree")
install.packages("gam")
install.packages("e1071")
install.packages("xml2")
install.packages("ggmap")
install.packages("caret")
install.packages("pls")
install.packages("plotly")



Gulsah Semiz
Entegre pazarlama ve veri analizi uzmanı Gülşah, yüksek lisansını Bentley Üniversitesi'nde Pazarlama Analitiğini üzerine tamamladı.

Sizin Yorumunuz?




Tüm Yorumlar

Bu yazı hakkında yapılmış olan tüm yorumları aşağıda görebilirsiniz. Yapılan yorumların tüm sorumluluğu ilgili kişilere aittir. Küfür/Hakaret içermeyen tüm yorumlar en kısa sürede onaylanır.




  1. Yasin tarafından 13 Ağustos 2019 1:24 pm tarihinde:

    Merhaba,
    “R” yeni başlayan biri olarak ilk tavsiyeniz ne olur, özellikle bilmem gereken bir şeyler var mıdır?
    paylaşımınız için ayrıca teşekkürler.
    iyi günler.

  2. Gulsah Semiz tarafından 22 Ocak 2020 1:40 am tarihinde:

    Selamlar Yasin — R ile ilgili dersler paylaşmayı planlıyorum yakın zamanda. Yeni başlayanlara tavsiyem başlama amaçlarına göre değişir. Örneğin istatistiksel analiz yapmak için kullanacaksa bir kişi, R’ı kullanmayı öğrenmenin yanında, istatistik bilgisini de geliştirmeli. Çünkü örneğin regresyon analizi yapmak için R’da bir satır kod yazmak yeterli. Ama ortaya çıkan model elinizdeki veri için ne kadar anlamlı/doğru, bu R’dan ziyade istatistikle ilgili.