Makalah Sistem Rekomender
MAKALAH
SISTEM REKOMENDER
Disusun Oleh :
Rr. Binar
Novicha P 16.01.63.0002
Fakultas Teknologi Informasi
Jurusan Teknik Informatika
2018
BAB I
PENDAHULUAN
1.1
Latar Belakang
Pada
era digital, mudah untuk produsen film untuk mengetahui genre film apa yang
disukai penontonnya dari sistem jajak pendapat atau vote. Data referensi vote
dari penonton disimpan untuk kemudian diolah menggunakan teknik statistik
sehingga menghasilkan rekomendasi genre film terkait[1]. Namun, seringnya data
yang dihasilkan berbanding terbalik dengan penjualan film di pasaran.
Maka
digunakan recommender Systems atau Recommendation Systems merupakan bagian dari
information filtering system yang memprediksi tingkat atau kecenderungan
pengguna. Recommender systems sangat umum diaplikasikan pada tahun-tahun
terakhir pada berbagai bidang, yang paling populer adalah pada bidang film,
musik, berita, buku, artikel penelitian, query pencarian, social tags, dan
produk secara umum.
1.2
Rumusan Masalah
1.
Apa tujuan dari
penggunaan Sistem Recommender?
2.
Apa manfaat yang
didapat dari penggunaan Sistem Recommender?
1.3
Tujuan Penulisan
1.
Mengetahui
pengaplikasian Sistem Recommender Movie di dalam industri film
BAB II
PEMBAHASAN
Recommender
systems menghasilkan daftar rekomendasi dalam satu atau dua cara melalui
penyaringan konten yang kolaboratif. Pendekatan penyaringan kolaboratif
membangun model dari perilaku pengguna di masa lampau (item yang dibeli dahulu
atau dipilih dan atau tingkat nilai yang diberikan pada item tersebut), lalu
menggunakan model tersebut untuk memprediksi item yang mungkin diminati oleh
pengguna. Sasarannya adalah pengunjung toko online, di mana system ini memberikan
prediksi dan penawaran terbaik produk apa yang disukai. Teknologi ini banyak
diapdopsi oleh perusahaan besar di dunia e-commerce dalam seperti Amazon,
Netflix dan Pandora. Sedemikian pentingnya recomender system ini bagi ecommerce
maupun industri lainnya seperti film karena kemampuannya untuk memberikan referensi
yang disukai oleh customer, membuat strategi marketing, hingga meningkatkan
loyalitas pelanggan. Bahkan kompetisi pun telah diadakan oleh Netflix untuk menguji
hasil rekomendasi dengan nilai yang cukup besar. Riset di recommender system
menjadi begitu penting karena perannya di bidang e-commerce telah terbukti
banyak memberikan terobosan baru di dunia bisnis dan ilmu pengetahuan.
Salah
satu jenis recommmender system yang sering digunakan adalah Collaborative
Filtering yang didasarkan pada pengumpulan dan analisa informasi dalam
jumlah besar. mengenai perilaku, aktivitas, dan kecenderungan pengguna dalam
rangka untuk memprediksi apa yang disukai oleh pengguna berdasarkan kemiripan
dengan pengguna yang lainnya.
2.1 Collaborative Filtering
Collaborative
filtering merupakan salah satu algoritma yang digunakan untuk menyusun
recommender system dan telah terbukti memberikan hasil yang sangat baik. Rating
produk merupakan elemen terpenting dari algoritma ini, rating diperoleh dari
sebagian besar customer di mana customer secara explicit memberikan
penilaiaannya terhadap produk. Kesimpulannya ialah system memberikan imbal
balik kepada customer dengan mengolah data-data tersebut, sebagai gambaran dari
skala nol sampai 5 yang mengindikasikan penilaian yang paling tidak disukai
hingga paling disukai menurut sudut pandang customer, data ini memungkinkan
untuk dilakukannya perhitungan statistik yang hasilnya menunjukkan produk mana
yang diberikan rating tinggi oleh customer.
Collaborative filtering
menggunakan database yang diperoleh dari user. Ada dua komponen utama dalam
data ini agar dapat membuat prediksi bagi recommender system yaitu user dan
item. Keduanya membentuk rating matrix berupa m user {u1, u2, u3, …, um} dan
daftar n item {i1, i2, i3,…, i4}. Di mana setiap user memberikan penilaiannya
pada item berupa rating dalam skala 1 sampai 5. Rating ini dilambangkan dengan
Iu1. Tidak semua user memberikan rating ke setiap produk karena berbagai macam
faktor, hal ini menyebabkan banyaknya missing value yang mengakibatkan sparsity
pada data. User item rating matrix
dapat digambarkan dengan table
di bawah.
Collaborative
filtering dibagi menjadi dua kategori[2] yaitu memory based, model based dan
gabungan keduanya menjadi hybrid recommendation system[3] bertujuan untuk mengatasi
kelemahan yang muncul pada kedua kategori sebelumnya. Memory based
recommendation menggunakan user rating sebagai bahan untuk menemukan similarity
atau derajat kesamaan antar user. Di domain bisnis algoritma ini telah
diterapkan pada situs Amazon, keunggulannya adalah
kemudahan dalam implementasi
dan sangat efektif. Sedangkan untuk model based recommendation tidak jauh berbeda
dengan algoritma sebelumnya, yaitu menggunakan rating sebagai sumber data.
Namun algoritma ini menggunakan teknik-teknik di data mining atau machine learning
seperti Bayesian dan clustering. Gabungan dari model dan memory based membentu
hybrid recomennder system. Algoritma ini di ciptakan untuk mengatasi kelemahan
yang terdapat pada dua algoritma sebelumnya seperti sparsity. Berikut adalah
perbandingan antara memory based dan model based recommendation system[4]:
a.
Memory based
Teknik yang dipakai
adalah: Neighbor-based CF (item based/user-based CF. Algorithms with
Pearson/vector cosine correlation) Item-based/user-based top-N Recommendations.
Keunggulannya berupa implementasi mudah, mudah menambahkan data-data baru tidak
perlu menpertimbangkan content item yang direkomendasikan, skala yang baik
dengan co-rated item. Sedangkan kekurangan dari algortima ini adalah bergantung pada
rating dari user, menurun-nya performa jika data jarang, skalabilitas yang
terbatas pada dataset yang besar
b.
Model Based
Teknik yang dipakai
adalah: Bayesian belief nets CF, clustering CF, MDP-based CF, latent semantic
CF, sparse factor analysis, CF using dimensionality, reduction techniques
seperti SVD dan PC. Kelebihan: dapat mengatasi masalah data yang jarang,
skalability dan masalah lainnya, akurasi meningkat, memberikan intuitive
rational untuk recomendasi. Kekurangannya adalah diperlukannya sumber daya yang
besar untuk proses komputasi.
c.
Hybrid
Recommendation System
Teknik yang
digunakan berupa content based CF (fab), content boosted CF, hybrid CF
kombinasi memory based dan model based (personality diagnosis). Teknik ini
sebagai solusi atas kelemahan yang terdapat pada memory dan model based CF
seperti sparsity dan grayship, sehingga meningkatkan akurasi prediksi. Beberapa
kelemahan juga muncul seperti meningkatnya kompleksitas program hingga perlunya
data external yang terkadang tidak tersedia.
1.1 Collaborative Filtering
Keuntungan
utama dari pendekatan collaborative filtering adalah tidak membutuhkan mesin
untuk menganalisa konten sehingga handal dalam merekomendasikan item yang
kompleks secara akurat. Misalkan film tanpa perlu memahami item film itu
sendiri. Banyak algoritma digunakan untuk mengukur kesamaan pengguna atau
kesamaan item dalam system rekomendasi. Sebagai contoh pendekatan k-nearest
neighbor (k-NN) dan Pearson Correlation.
2.3 Kekurangan Collaborative Filtering
1.
Cold Start
Sistem ini sering
membutuhkan data yang tersedia dalam jumlah besar untuk dapat menghasilkan
rekomendasi yang akurat.
2.
Scalability
Ada jutaan pengguna
dan produk yang tersedia,sehingga membutuhkan kekuatan komputasi yang sangat
besar untuk mengkalkulasi rekomendasi.
3.
Sparsity
Ada kemungkinan
item yang benar-benar dibutuhkan oleh pengguna memiliki rating yang kecil
dikarenakan tertutupi oleh item lain.
2.4 Metode Collaborative Filtering
install.packages(“recommenderlab”)
library(datasets)
# Load required
library
library(recommenderlab)
# package being evaluated
library(ggplot2) #
For plots
# Load the data we
are going to work with
data(MovieLense)
MovieLense
# 943 x 1664 rating
matrix of class ‘realRatingMatrix’ with 99392 ratings.
# Visualizing a
sample of this
image(sample(MovieLense, 500),
main = “Raw ratings”)
# Visualizing
ratings
qplot(getRatings(MovieLense),
binwidth = 1, main = "Histogram of ratings", xlab =
"Rating")
summary(getRatings(MovieLense))
# Skewed to the right
# How many movies
did people rate on average
qplot(rowCounts(MovieLense),
binwidth = 10,
main = "Movies Rated on
average",
xlab = "# of users",
ylab = "# of movies rated")
recommenderRegistry$get_entries(dataType
= "realRatingMatrix")
scheme <-
evaluationScheme(MovieLense, method = "split", train = .9,k = 1,
given = 10, goodRating = 4)
scheme
algorithms <- list(
"random items" =
list(name="RANDOM", param=list(normalize = "Z-score")),
"popular items" =
list(name="POPULAR", param=list(normalize = "Z-score")),
"user-based CF" =
list(name="UBCF", param=list(normalize = "Z-score",
method="Cosine",
nn=50, minRating=3)))
results <-
evaluate(scheme, algorithms, n=c(1, 3, 5, 10, 15, 20))
plot(results, annotate = 1:4,
legend="topleft")
plot(results,
"prec/rec", annotate=3)
BAB III
KESIMPULAN
Dengan
evaluasi yang ada diatas terlihat bahwa UBCF lebih bagus dari IBCF. Pendekatan
item random merupakan yang paling buruk, tapi malah popular item menampilkan
yang terbaik dengan menggunakan algoritma Cosine Similarity yang digunakan
untuk mengukur kesamaan pengguna atau kesamaan item dalam sistem rekomendasi.
BAB IV
DAFTAR PUSTAKA
[1] B. Sarwar, G. Karypis, J.
Konstan, and J. Riedl,“Analysis of Recommendation Algorithms for ECommerce,”Discovery.
[2] “Empirical Analysis of
Predictive Algorithms for Collaborative Filtering,” pp. 43–52.
[3] P. Melville, R. J. Mooney,
and R. Nagarajan,“Content-Boosted Collaborative Filtering for Improved
Recommendations,” pp. 187–192.
[4] X. Su and T. M. Khoshgoftaar,
“A Survey of Collaborative Filtering Techniques,” Adv. Artif. Intell., vol.
2009, no. Section 3, pp. 1–19, 2009.
0 komentar:
Posting Komentar