Makalah Sistem Rekomender

MAKALAH
SISTEM REKOMENDER






Disusun Oleh :
Rr. Binar Novicha P                16.01.63.0002





Fakultas Teknologi Informasi
Jurusan Teknik Informatika

2018

BAB I
PENDAHULUAN
1.1  Latar Belakang
Pada era digital, mudah untuk produsen film untuk mengetahui genre film apa yang disukai penontonnya dari sistem jajak pendapat atau vote. Data referensi vote dari penonton disimpan untuk kemudian diolah menggunakan teknik statistik sehingga menghasilkan rekomendasi genre film terkait[1]. Namun, seringnya data yang dihasilkan berbanding terbalik dengan penjualan film di pasaran.
Maka digunakan recommender Systems atau Recommendation Systems merupakan bagian dari information filtering system yang memprediksi tingkat atau kecenderungan pengguna. Recommender systems sangat umum diaplikasikan pada tahun-tahun terakhir pada berbagai bidang, yang paling populer adalah pada bidang film, musik, berita, buku, artikel penelitian, query pencarian, social tags, dan produk secara umum.

1.2  Rumusan Masalah
1.      Apa tujuan dari penggunaan Sistem Recommender?
2.      Apa manfaat yang didapat dari penggunaan Sistem Recommender?
1.3  Tujuan Penulisan
1.      Mengetahui pengaplikasian Sistem Recommender Movie di dalam industri film



BAB II
PEMBAHASAN
Recommender systems menghasilkan daftar rekomendasi dalam satu atau dua cara melalui penyaringan konten yang kolaboratif. Pendekatan penyaringan kolaboratif membangun model dari perilaku pengguna di masa lampau (item yang dibeli dahulu atau dipilih dan atau tingkat nilai yang diberikan pada item tersebut), lalu menggunakan model tersebut untuk memprediksi item yang mungkin diminati oleh pengguna. Sasarannya adalah pengunjung toko online, di mana system ini memberikan prediksi dan penawaran terbaik produk apa yang disukai. Teknologi ini banyak diapdopsi oleh perusahaan besar di dunia e-commerce dalam seperti Amazon, Netflix dan Pandora. Sedemikian pentingnya recomender system ini bagi ecommerce maupun industri lainnya seperti film karena kemampuannya untuk memberikan referensi yang disukai oleh customer, membuat strategi marketing, hingga meningkatkan loyalitas pelanggan. Bahkan kompetisi pun telah diadakan oleh Netflix untuk menguji hasil rekomendasi dengan nilai yang cukup besar. Riset di recommender system menjadi begitu penting karena perannya di bidang e-commerce telah terbukti banyak memberikan terobosan baru di dunia bisnis dan ilmu pengetahuan.
Salah satu jenis recommmender system yang sering digunakan adalah Collaborative Filtering yang didasarkan pada pengumpulan dan analisa informasi dalam jumlah besar. mengenai perilaku, aktivitas, dan kecenderungan pengguna dalam rangka untuk memprediksi apa yang disukai oleh pengguna berdasarkan kemiripan dengan pengguna yang lainnya.
2.1  Collaborative Filtering
Collaborative filtering merupakan salah satu algoritma yang digunakan untuk menyusun recommender system dan telah terbukti memberikan hasil yang sangat baik. Rating produk merupakan elemen terpenting dari algoritma ini, rating diperoleh dari sebagian besar customer di mana customer secara explicit memberikan penilaiaannya terhadap produk. Kesimpulannya ialah system memberikan imbal balik kepada customer dengan mengolah data-data tersebut, sebagai gambaran dari skala nol sampai 5 yang mengindikasikan penilaian yang paling tidak disukai hingga paling disukai menurut sudut pandang customer, data ini memungkinkan untuk dilakukannya perhitungan statistik yang hasilnya menunjukkan produk mana yang diberikan rating tinggi oleh customer.
Collaborative filtering menggunakan database yang diperoleh dari user. Ada dua komponen utama dalam data ini agar dapat membuat prediksi bagi recommender system yaitu user dan item. Keduanya membentuk rating matrix berupa m user {u1, u2, u3, …, um} dan daftar n item {i1, i2, i3,…, i4}. Di mana setiap user memberikan penilaiannya pada item berupa rating dalam skala 1 sampai 5. Rating ini dilambangkan dengan Iu1. Tidak semua user memberikan rating ke setiap produk karena berbagai macam faktor, hal ini menyebabkan banyaknya missing value yang mengakibatkan sparsity pada data. User item rating matrix
dapat digambarkan dengan table di bawah.



Collaborative filtering dibagi menjadi dua kategori[2] yaitu memory based, model based dan gabungan keduanya menjadi hybrid recommendation system[3] bertujuan untuk mengatasi kelemahan yang muncul pada kedua kategori sebelumnya. Memory based recommendation menggunakan user rating sebagai bahan untuk menemukan similarity atau derajat kesamaan antar user. Di domain bisnis algoritma ini telah diterapkan pada situs Amazon, keunggulannya adalah
kemudahan dalam implementasi dan sangat efektif. Sedangkan untuk model based recommendation tidak jauh berbeda dengan algoritma sebelumnya, yaitu menggunakan rating sebagai sumber data. Namun algoritma ini menggunakan teknik-teknik di data mining atau machine learning seperti Bayesian dan clustering. Gabungan dari model dan memory based membentu hybrid recomennder system. Algoritma ini di ciptakan untuk mengatasi kelemahan yang terdapat pada dua algoritma sebelumnya seperti sparsity. Berikut adalah perbandingan antara memory based dan model based recommendation system[4]:
a.       Memory based
Teknik yang dipakai adalah: Neighbor-based CF (item based/user-based CF. Algorithms with Pearson/vector cosine correlation) Item-based/user-based top-N Recommendations. Keunggulannya berupa implementasi mudah, mudah menambahkan data-data baru tidak perlu menpertimbangkan content item yang direkomendasikan, skala yang baik dengan co-rated item. Sedangkan kekurangan  dari algortima ini adalah bergantung pada rating dari user, menurun-nya performa jika data jarang, skalabilitas yang terbatas pada dataset yang besar
b.      Model Based
Teknik yang dipakai adalah: Bayesian belief nets CF, clustering CF, MDP-based CF, latent semantic CF, sparse factor analysis, CF using dimensionality, reduction techniques seperti SVD dan PC. Kelebihan: dapat mengatasi masalah data yang jarang, skalability dan masalah lainnya, akurasi meningkat, memberikan intuitive rational untuk recomendasi. Kekurangannya adalah diperlukannya sumber daya yang besar untuk proses komputasi.
c.       Hybrid Recommendation System
Teknik yang digunakan berupa content based CF (fab), content boosted CF, hybrid CF kombinasi memory based dan model based (personality diagnosis). Teknik ini sebagai solusi atas kelemahan yang terdapat pada memory dan model based CF seperti sparsity dan grayship, sehingga meningkatkan akurasi prediksi. Beberapa kelemahan juga muncul seperti meningkatnya kompleksitas program hingga perlunya data external yang terkadang tidak tersedia.

1.1  Collaborative Filtering

Keuntungan utama dari pendekatan collaborative filtering adalah tidak membutuhkan mesin untuk menganalisa konten sehingga handal dalam merekomendasikan item yang kompleks secara akurat. Misalkan film tanpa perlu memahami item film itu sendiri. Banyak algoritma digunakan untuk mengukur kesamaan pengguna atau kesamaan item dalam system rekomendasi. Sebagai contoh pendekatan k-nearest neighbor (k-NN) dan Pearson Correlation.

2.3  Kekurangan Collaborative Filtering
1.      Cold Start
Sistem ini sering membutuhkan data yang tersedia dalam jumlah besar untuk dapat menghasilkan rekomendasi yang akurat.
2.      Scalability
Ada jutaan pengguna dan produk yang tersedia,sehingga membutuhkan kekuatan komputasi yang sangat besar untuk mengkalkulasi rekomendasi.
3.      Sparsity
Ada kemungkinan item yang benar-benar dibutuhkan oleh pengguna memiliki rating yang kecil dikarenakan tertutupi oleh item lain.

2.4  Metode Collaborative Filtering

install.packages(“recommenderlab”)
library(datasets)
# Load required library
library(recommenderlab) # package being evaluated
library(ggplot2) # For plots
# Load the data we are going to work with
data(MovieLense)
MovieLense
# 943 x 1664 rating matrix of class ‘realRatingMatrix’ with 99392 ratings.
# Visualizing a sample of this
image(sample(MovieLense, 500), main = “Raw ratings”)


# Visualizing ratings
qplot(getRatings(MovieLense), binwidth = 1, main = "Histogram of ratings", xlab = "Rating")

summary(getRatings(MovieLense)) # Skewed to the right


# How many movies did people rate on average
qplot(rowCounts(MovieLense), binwidth = 10,
      main = "Movies Rated on average",
      xlab = "# of users",
      ylab = "# of movies rated")


recommenderRegistry$get_entries(dataType = "realRatingMatrix")
scheme <- evaluationScheme(MovieLense, method = "split", train = .9,k = 1, given = 10, goodRating = 4)
      scheme
      algorithms <- list(
        "random items" = list(name="RANDOM", param=list(normalize = "Z-score")),
        "popular items" = list(name="POPULAR", param=list(normalize = "Z-score")),
        "user-based CF" = list(name="UBCF", param=list(normalize = "Z-score",
                                                       method="Cosine",
                                                       nn=50, minRating=3)))
results <- evaluate(scheme, algorithms, n=c(1, 3, 5, 10, 15, 20))
      plot(results, annotate = 1:4, legend="topleft")




plot(results, "prec/rec", annotate=3)

BAB III
KESIMPULAN
Dengan evaluasi yang ada diatas terlihat bahwa UBCF lebih bagus dari IBCF. Pendekatan item random merupakan yang paling buruk, tapi malah popular item menampilkan yang terbaik dengan menggunakan algoritma Cosine Similarity yang digunakan untuk mengukur kesamaan pengguna atau kesamaan item dalam sistem rekomendasi.

BAB IV
DAFTAR PUSTAKA
[1] B. Sarwar, G. Karypis, J. Konstan, and J. Riedl,“Analysis of Recommendation Algorithms for ECommerce,”Discovery.
[2] “Empirical Analysis of Predictive Algorithms for Collaborative Filtering,” pp. 43–52.
[3] P. Melville, R. J. Mooney, and R. Nagarajan,“Content-Boosted Collaborative Filtering for Improved Recommendations,” pp. 187–192.
[4] X. Su and T. M. Khoshgoftaar, “A Survey of Collaborative Filtering Techniques,” Adv. Artif. Intell., vol. 2009, no. Section 3, pp. 1–19, 2009.


0 komentar:

Posting Komentar

  © Watch and Learn Center

Design by Binar Novicha