Penambangan Data Tekstual
Jalur peminatan ini bertujuan untuk memahami lebih jauh bidang analisis data tekstual. Analisis data tekstual adalah proses untuk mendapatkan informasi dari data semi-terstruktur atau tidak terstruktur. Informasi ini biasanya diperoleh melalui penyusunan pola dan tren melalui pendekatan pembelajaran pola statistik atau melalui penyusunan pola dengan teori logika. Terapan dari text mining antara lain: mesin terjemahan, keterangan gambar, penambangan opini, ekstraksi informasi, segmentasi teks, analisis sentimen, peringkasan teks, pengelompokan teks, kategorisasi teks, analisa / identifikasi hoak, analisis spam, penjawab pertanyaan otomatis, set expansion, concept expansion, truth discovery, pelabelan topik, parsing kalimat bahasa alami, dll.
Mata kuliah-mata kuliah yang spesifik untuk jalur penambangan data tekstual ini antara lain:- IF1801013 - Penambangan Data Tekstual dan Pemrosesan Bahasan Alami (Text Mining and Natural Language Processing)
Mata kuliah ini membahas pemrosesan data tekstual pada dokumen Web. Topik yang dibahas meliputi Dimensionality Reduction, Use of Links and Structure, Relations and Passage Retrieval, Question Answering, Machine Learning and Text Classification, Partitional and Hierarchical Text Clustering, Sequence Labeling and Named Entity recognition, dan Information Extraction. - IF1801023 - Temu Kembali Informasi Tekstual (Text Retrieval)
Mata kuliah ini mencakup metode/algoritma, desain dan implementasi dari temu kembali informasi tekstual modern. Topik yang dibahas meliputi: desain dan implementasi sistem temu kembali, teknik-teknik analisis tekstual, model temu kembali (contohnya: Boolean, ruang vektor, probabilistik, dan metode-metode pembelajaran), evaluasi pencarian, dan umpan balik temu kembali. Mata Kuliah ini dilaksanakan dengan pertemuan tatap muka, diskusi, dan presentasi dari mahasiswa secara individu/berkelompok dalam menyelesaikan sebuah problem/kasus. - IF1801033 - Pembelajaran Mesin untuk Data Tekstual (Machine Learning for Text)
Mata kuliah ini membahas metode-metode pembelajaran mesin untuk data tekstual. Pembelajaran mesin adalah aplikasi kecerdasan buatan (AI) yang menyediakan kemampuan sistem untuk secara otomatis belajar dari pengalaman tanpa secara eksplisit diprogram. Pembelajaran mesin berfokus pada pengembangan program komputer yang dapat mengakses data dan menggunakannya untuk belajar sendiri. Topik yang dibahas meliputi perangkingan dan pembelajaran mesin untuk temu kembali informasi teks dan pencarian Web, pemodelan bahasa secara statistik, metode-metode kernel, Word-Context Matrix Factorization Model, representasi vektor kata, dan Neural Language Model. - IF1801043 - Analisis Semantik (Semantic Analysis)
Mata kuliah ini membahas analisis semantik dari data tekstual. Analisis semantik adalah proses yang menghubungkan struktur sintaksis, mulai dari tingkat frasa, klausa, kalimat, dan paragraf hingga tingkat penulisan secara keseluruhan, hingga makna bahasa mereka yang independen. Topik yang dibahas meliputi pemahaman bahasa, pendekatan/metode analisis semantik (logika predikat dan pendekatan statistik), Logical Form Language, Logical Graph, Dependency Structure to Logical Forms for Semantic Parsing, Ontologi Domain, dan Resources for Semantic Analysis. - IF1801053 - Pemrosesan Data Tekstual pada Web (Text Processing on the Web)
Mata kuliah ini membahas pemrosesan data tekstual pada dokumen Web. Topik yang dibahas meliputi Dimensionality Reduction, Use of Links and Structure, Relations and Passage Retrieval, Question Answering, Machine Learning and Text Classification, Partitional and Hierarchical Text Clustering, Sequence Labeling and Named Entity recognition, dan Information Extraction. - IF1801063 - Representasi Pengetahuan Data Tekstual (Text Knowledge Representation)
Mata kuliah ini membahas metode untuk merepresentasikan pengetahuan dari data tekstual. Pendekatan yang digunakan untuk merepresentasikan pengetahuan biasanya melibatkan metode kecerdasan buatan. Pengetahuan yang direpresentasikan biasanya dari domain yang spesifik atau tertutup. Topik yang dibahas meliputi metode untuk mengekstraksi relasi dan entity dari dokumen teks, representasi dengan model grafik (model diskriminatif dan generatif), Distance Supervision for Relation Extraction, dan Unsupervised Relation Extraction using Generative Models.
Keterampilan khusus yang diharapkan dari mahasiswa program studi Informatika dari jalur penambangan data tekstual adalah: mampu menerapkan dan menganalisis metode penambangan data tekstual, seperti: mesin terjemahan, keterangan gambar, penambangan opini, ekstraksi informasi, segmentasi teks, analisis sentimen, peringkasan teks, pengelompokan teks, kategorisasi teks, analisa / identifikasi hoak, analisis spam, penjawab pertanyaan otomatis, set expansion, concept expansion, truth discovery, pelabelan topik, parsing kalimat bahasa alami, dll.
Untuk daftar lengkap mahasiswa jalur penambangan data tekstual, silakan diakses melalui tautan berikut ini Daftar Mahasiswa Jalur Penambangan Data Tekstual.
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN