Machine Learning adalah bidang besar dengan penelitian baru yang sering muncul. Ini adalah bidang yang hangat di mana akademisi dan industri terus bereksperimen dengan hal-hal baru untuk meningkatkan kehidupan kita sehari-hari.
Dalam beberapa tahun terakhir, AI generatif telah mengubah dunia melalui penerapan machine learning. Misalnya, ChatGPT dan Stable Diffusion.
Berikut adalah paper machine learning terbaik untuk dibaca agar Anda tidak ketinggalan tren yang akan datang.
1. Pelajari Keindahan dalam Lagu: Neural Singing Voice Beautifier
Singing Voice Beautifying (SVB) adalah sebuah tugas baru dalam AI generatif yang bertujuan untuk meningkatkan suara nyanyian amatir menjadi suara yang indah. Inilah tujuan penelitian dari Liu et al. (2022) ketika mereka mengusulkan model generatif baru yang disebut Neural Singing Voice Beautifier (NSVB).
NSVB adalah model semi-supervised learning menggunakan algoritma latent-mapping yang berfungsi sebagai pitch corrector dan meningkatkan kualitas nada vokal. Penelitian ini menjanjikan peningkatan dalam industri musik dan layak untuk dicoba.
2. Penemuan Simbolik Algoritma Optimasi
Model deep neural network telah berkembang menjadi lebih besar dari sebelumnya, dan banyak penelitian telah dilakukan untuk menyederhanakan proses pelatihan. Penelitian terbaru oleh tim Google (Chen et al. (2023)) telah mengusulkan optimisasi baru untuk Neural Network yang disebut Lion (EvoLved Sign Momentum). Metode ini menunjukkan bahwa algoritma lebih efisien dalam penggunaan memori dan memerlukan tingkat pembelajaran yang lebih kecil dibandingkan Adam. Ini adalah penelitian hebat dan sangat menjanjikan yang tidak boleh dilewatkan.
3. TimesNet: Pemodelan Variasi 2D Temporal untuk General Time Series Analysis
Analisis time series adalah kasus yang umum digunakan di banyak bisnis; Misalnya, prediksi harga, deteksi anomali, dan lain sebagainya. Namun, ada banyak tantangan dalam menganalisis data temporal hanya berdasarkan data saat ini (data 1D). Itulah mengapa Wu et al. (2023) mengusulkan metode baru yang disebut TimesNet untuk mengubah data 1D menjadi data 2D, yang mencapai kinerja yang sangat baik dalam eksperimen. Anda harus membaca paper ini untuk memahami metode baru ini dengan lebih baik karena akan sangat membantu analisis time series di masa depan.
4. OPT: Open Pre-trained Transformer Language Models
Saat ini, kita berada di era AI generatif di mana banyak Large Language Models (LLM) dikembangkan secara intensif oleh perusahaan. Sebagian besar penelitian semacam ini tidak akan merilis model mereka atau hanya tersedia secara komersial. Namun, kelompok riset Meta AI (Zhang et al. (2022)) mencoba melakukan sebaliknya dengan merilis secara publik model Open Pre-trained Transformers (OPT) yang dapat dibandingkan dengan GPT-3. Paper ini adalah awal yang baik untuk memahami model OPT dan detail penelitian, karena kelompok tersebut mencatat semua detail dalam papernya.
5. REaLTabFormer: Menghasilkan Data Relasional dan Tabular yang Realistis menggunakan Transformers
Model generatif tidak terbatas hanya pada menghasilkan teks atau gambar, tetapi juga data tabular. Data yang dihasilkan ini sering disebut data sintetis. Banyak model dikembangkan untuk menghasilkan data tabular sintetis, tetapi hampir tidak ada model untuk menghasilkan data tabular relasional sintetis. Inilah tujuan penelitian Solatorio and Dupriez (2023); membuat model yang disebut REaLTabFormer untuk data relasional sintetis. Eksperimen ini menunjukkan bahwa hasilnya secara akurat mendekati model sintetis yang ada, yang dapat diperluas ke banyak aplikasi.
6. Apakah Reinforcement Learning (Tidak) untuk Natural Language Processing?: Benchmarks, Baselines, dan Building Blocks untuk Optimalisasi Natural Language Policy
Konsep Reinforcement Learning adalah pilihan yang sangat baik untuk tugas Natural Language Processing (NLP), tetapi apakah itu benar? Ini adalah pertanyaan yang coba dijawab oleh Ramamurthy et al. (2022). Peneliti memperkenalkan berbagai library dan algoritma yang menunjukkan di mana teknik Reinforcement Learning memiliki keunggulan dibandingkan metode supervised dalam tugas NLP. Ini adalah paper yang direkomendasikan untuk dibaca jika Anda menginginkan alternatif untuk keahlian Anda.
7. Tune-A-Video: Penyetelan Satu Kali Model Difusi Gambar untuk Pembuatan Teks-to-Video
Pembuatan teks menjadi gambar sangat populer di tahun 2022, dan tahun 2023 diproyeksikan pada kemampuan pembuatan teks menjadi video (text-to-video/T2V). Penelitian oleh Wu et al. (2022) menunjukkan bagaimana T2V dapat diperluas dalam banyak pendekatan. Penelitian ini mengusulkan metode Tune-a-Video baru yang mendukung tugas T2V seperti perubahan subjek dan objek, transfer gaya, pengeditan atribut, dan lain-lain. Ini adalah paper yang bagus untuk dibaca jika Anda tertarik dengan penelitian teks-to-video.
8. PyGlove: Bertukar Ide ML secara Efisien
Kolaborasi yang efisien adalah kunci kesuksesan dalam tim mana pun, terutama dengan meningkatnya kompleksitas dalam bidang machine learning. Untuk mendorong efisiensi, Peng et al. (2023) menghadirkan library PyGlove untuk berbagi ide ML dengan mudah. Konsep PyGlove adalah untuk menangkap proses penelitian ML melalui list aturan patching. List ini kemudian dapat digunakan kembali dalam tahapan eksperimen apa pun, yang meningkatkan efisiensi tim. Ini adalah penelitian yang mencoba menyelesaikan masalah machine learning yang belum banyak dilakukan, sehingga patut dibaca.
9. Seberapa Dekat ChatGPT dengan Human Expert? Perbandingan Korpus, Evaluasi, dan Deteksi
ChatGPT telah banyak mengubah dunia. Dapat dikatakan bahwa trennya akan terus meningkat karena publik sudah mendukung penggunaan ChatGPT. Namun, bagaimana hasil ChatGPT saat ini dibandingkan dengan Human Experts? Inilah pertanyaan yang coba dijawab oleh Guo et al. (2023) Tim penelitian ini mencoba mengumpulkan data dari para pakar dan hasil prompt ChatGPT, yang kemudian mereka bandingkan. Hasilnya menunjukkan bahwa ada perbedaan implisit antara ChatGPT dan para pakar. Penelitian ini adalah sesuatu yang saya rasa akan terus ditanyakan di masa depan karena model AI generatif akan terus berkembang dari waktu ke waktu, sehingga patut dibaca.
Kesimpulan
Ada banyak penelitian yang menjanjikan yang menurut saya tidak boleh kita lewatkan karena menunjukkan hasil yang menjanjikan yang mungkin mengubah standar saat ini. Dalam artikel ini, saya telah menunjukkan kepada Anda 9 paper ML teratas untuk dibaca, mulai dari model generatif, model time series hingga efisiensi alur workflow. Semoga bermanfaat.
Comments