Teknologi

Bagaimana Spotify Memilih Lagu Untuk Anda

Siapa guna Spotify?

Tahukah anda sains di sebalik macam mana Spotify boleh teka apakah lagu kegemaran anda.

Sebelum pergi lebih jauh, apa kata kita menjengah sejarah penyusunan muzik diatas talian.

Pada awal 2000, Songza antara terawal yang memulakan perkhidmatan muzik diatas talian menggunakan susun atur yang dibuat oleh manusia. Dimana ada sekumpulan peminat tegar muzik yang akan mengkelasifikasikan kategori muzik berdasarkan kegemaran mereka. Walaubagaimanapun ianya menjadi tidak praktikal kerana ianya tidak berupaya untuk mengikut kehendak citarasa semua.

Kemudian, datang pula Pandora. Apa yang Pandora lakukan adalah menggunakan tanda tag sifat secara manual kepada fail lagu yang ada. Kemudian Pandora boleh menapis lagu tersebut berdasarkan tanda tag sifat yang ada pada setiap fail dan memainkan lagu yang berada dalam tag sifat kategori yang sama.

Kemudian, makmal agensi media dari MIT yang dipanggil Echo Nest telah mengambil langkah lebih radikal dengan keupayaan untuk menjadikan pemilihan lagi bersifat peribadi (personalized). Echo Nest menggunakan algoritma khas untuk menganalisa audio dan konteks teks lagu, untuk membolehkan proses pengecaman, rekemen, mencipta senarai untuk dimainkan (playlist) dan analisis dibuat.

Dalam penciptaan Spotify, apa yang dibuat, adalah dengan menggabungkan ketiga-tiga kaedah tersebut, untuk mencipta satu revolusi dalam enjin pencarian dan pemilihan yang berkuasa.

Pada pengguna Spotify, anda mungkin perasan ada trek senarai Discover Weekly. Dimana trek ini dibangunkan dengan menggunakan jenis model peenggalakan (recommendation model) seperti berikut:

1. Model Penapisan Kolabratif (Collaborative Filtering models) – untuk menganalisa tingkah laku anda dan pengguna lain..

2. Model Pemproses Bahasa Biasa – Model Natural Language Processing (NLP) – yang menganalisa teks jenis lagu dan lirik

3. Model Audio – yang menganalisa trek lagu.

Berikut adalah penerangan ringkas tentang model yang diterangkan

1. Model Penapisan Kolabratif (Collaborative Filtering models)

Apabula bercerita tentang collaborative filtering, pasti akan ingat tentang platform Netflix. Dimana Netflix adalah antara syarikat yang terawal dalam mempelopori dan mempopularkan model kaedah penggalakkan (recommend). Dimana pengguna boleh meletak penarafan berdasarkan bintang (star rating) untuk menggalakkan filem yang mereka sukai.

Model ini terpakai pada Netflix, tetapi tidak pada Spotify. 
Dimana Spotify membuat penarafan berdasarkan jumlah trek dimainkan, beserta data tambahan seperti samada pengguna menyimpan ke dalam senarai kegemaran mereka atau melawat laman artis tersebut setelah mendengar lagu artis tersebut.


Kemudian Spotify akan menyemak akaun profil pengguna tersebut dan membandingkan ianya dengan akaun pengguna yang lain.

2. Model Pemproses Bahasa Biasa – Model Natural Language Processing (NLP)

Sumber data untuk model-model ini, seperti nama yanhg dicadang, adalah kata-kata biasa: trek metadata, artikel berita, blog, dan teks-teks lain yang ada disekitar internet.

Pemprosesan Bahasa Semula Jadi, yang merupakan kebolehan komputer untuk memahami percakapan manusia sebagaimana yang dituturkan, adalah bidang yang luas yang sering dimanfaatkan melalui API sentimen analisis API (Application Programming Interface).

Spotify mencari keseluruhan web dan sentiasa mencari blog yang dipaparkan dan teks bertulis lain mengenai muzik untuk mengetahui apa yang orang katakan mengenai artis dan lagu tertentu (dimana didalamnya ada mengandungi kata sifat dan bahasa tertentu yang sering digunakan merujuk kepada artis dan lagu, dan artis lain dan lagu serta apa yang dibincangkan bersama diantara mereka.)

3. Model Audio – yang menganalisa trek lagu

Menambah model ketiga (model audio) meningkatkan lagi ketepatan perkhidmatan cadangan muzik yang Spotify gunakan.

Tetapi model ini juga berfungsi sebagai tujuan sekunder: tidak seperti dua jenis pertama, model audio mentah mengambil lagu-lagu baru ke dalam akaun.

Model audio ini sebenarnya bertindak untuk meneutralkan lagu-lagu popular yang sudah muncul berbanding lagu yang baru muncul (tetapi tidak begitu popular).

Sebagai contoh, katakanlah LAGU A sudah popular kerana mempunyai lebih 100 orang yang mendengar dan menyimpan dalam senarai kegemaran mereka.

Dengan keupayaan Model Natural Language Processing (NLP), Spotify boleh menawarkan lagu yang mempunyai rentak yang hampir serupa dan memasukkan dalam senari pemain “Discover Weekly” yang ada.

Bagi pengguna Spotify, mungkin anda ada perasan tentang senarai “Discover Weekly”, dan mungkin anda tertanya bagaimana Spotify boleh wujudkan senarai tersebut.

Rangkaian neural convolutional (convolutional neural networks) adalah teknologi yang sama digunakan dalam perisian penegcaman wajah. 
Dalam kes Spotify, ianya telah diubahsuai untuk digunakan pada data audio berbanding piksel.

Dalam proses menganalisa audio, setiap ‘frame audio’ akan ditapis dan dianalisa dengan lagu-lagu yang telah dipilih untuk dibuat perbandingan.
Daripada situ, Spotify boleh belajar untuk mengenali lagu tersebut dan mempelajari adakah anda suka ataupun tidak.

Selepas diproses, rangkaian analisa audio akan mula memahami lagu tersbeut, termasuk ciri-ciri seperti anggaran masa, kekunci, mod, tempo, dan kekerapaan serta beberapa lagi karakteristik mengenai lagu tersebut.

Kenapa model?
Model in merujuk kepada proses latihan model pembelajaran mesin (machine learning) yang melibatkan data latihan yang perlu dipelajari. Model pembelajaran mesin pula merujuk kepada model artifak yang dicipta untuk proses latihan.

Dan model pembelajaran mesin digunakan untuk tekaan pada data baru yang dimana pada awal latihan ianya akan melibatkan proses manual untuk manusia mengajar dan mengenalpasti samada tekaan yang dibuat adalah betul atau salah.

Yang warna kuning icon gajah tu, untuk Hadoop ya. Bukan gajah kena mandi kunyit!

Apakah itu Hadoop?

Hadoop adalah rangka-kerja perisian berasaskan sumber terbuka yang digunakan untuk menyimpan data dan membolehkan aplikasi beroperasi dalam kluster komoditi perkakasan.

Hadoop menyediakan ruang penyimpanan pelbagai jenis data dalam skala besar, dengan keupayaan pemprosesan yg berkuasa dan keupayaan menguruskan pelbagai jenis tugasan serentak.

Saya berharap agar perkongsian makluamt ini boleh membantu saya sendiri dan juga anda uyang ingin tahu bagaimana Spotify berfungsi (untuk ciri Discover Weekly).

Buat masa ini, saya akan meneruskan perjalanan saya melalui “Discover Weekly” saya sendiri, mencari muzik kegemaran saya yang baru sambil menghargai teknologu pembelajaran mesin (Machine Learning) yang sedang berkerja di belakang tabir.

Sumber
Ever Wonder How Spotify Discover Weekly Works? Data ScienceSupervised collaborative filtering is prettyRecommending music on Spotify with deep learning
Selanjutnya...

Artikel Berkaitan

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button
Close
Close

Adblock Detected

Please consider supporting us by disabling your ad blocker