Weekly outline

  • General

    SELAMAT DATANG PADA MATAKULIAH BUSINESS INTELLIGENCE AND ANALYTICS


    Dosen Pengampu


    Drs. Tuga Mauritsius, M.S., Ph.D.

    tmauritsus@binus.edu


    Deskripsi Mata Kuliah

    Dalam era revolusi industri 4.0 yang tengah melanda dunia saat ini, berbagai organisasi bisnis, pemerintah, individu bahkan mesin memproduksi sejumlah data dalam volume yang sangat besar sebagai produk sampingan dari aktivitas mereka. Sejalan dengan itu, para pengambil keputusan dan sistem semakin bergantung pada teknologi cerdas (intelligent technology) untuk menganalisis data secara sistematis dalam upaya untuk meningkatkan ketepatan keputusan yang diambil. Dalam banyak kasus, mengotomatisasi proses analisis dan pengambilan keputusan semakin diperlukan karena data baru yang dihasilkan dari berbagai sumber tersebut meningkat secara tajam baik dalam volume maupun kecepatan.

    Kuliah ini akan membahas bagaimana prinsip-prinsip dasar business intelligence dan data sains dapat digunakan untuk meningkatkan ketepatan pengambilan keputusan. Prinsip-prinsip dasar dan teknik dasar dalam data sains dan data mining akan didalami. Pembahasan prinsip prinsip dasar tersebut akan dilakukan dari perspektif yang lebih umum, yang memayungi berbagai teknik data sains dan data mining. Kendati demikian, dalam kuliah ini akan dilengkapi pula dengan berbagai contoh kasus yang diambil dari berbagai aplikasi dunia nyata untuk menempatkan teknik data mining sesuai konteks.

    Secara lebih luas, memahami kekuatan dan keterbatasan teknik data sains dapat memberikan pendekatan baru bagi para manajer bisnis dan profesional sistem informasi untuk mendukung tugas mereka dalam memecahkan berbagai masalah bisnis yang kompleks dengan pendekatan berbasis data. Kuliah ini akan memberikan pemahaman tentang konsep dasar data sains, teknik-teknik dan berbagai contoh aplikasi bisnis.

    Capaian Pembelajaran
    CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
    CP2: Mendeskripsikan cara cara mengevaluasi suatu model
    CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models
    CP4: Menganalisa dataset dengan menggunakan berbagai metode data analytics
    CP5: Mendeskripsikan bisnis scenario global dimana data dan data mining dapat diterapkan

    Peta Kompetensi




    Topik
    1. Business Intelligence, Data Science and Data Mining
    2. Business Problem and Data Science Solutions
    3. Project Understanding and Data Understanding
    4. Predictive Modelling
    5. Fitting a Model
    6. Over-fitting and Its Avoidance
    7. Similarity and Cluster Analysis
    8. Evaluating a Model
    9. Visualizing Model Performance
    10. Evidence and Probability
    11. Representing and Mining Text
    12. Other Data Science Tasks and Techniques

    Komponen Penilaian

    Assesment Activity
    Weight
    Attendance (F2F)
    10%
    Discussion Forum Activity
    10%
    Assignment
    20%
    Quiz
    10%
    UTS
    20%
    UAS
    30%


    Cara Mempelajari Materi
    Dalam kuliah ini akan dijelaskan prinsip-prinsip dasar, penggunaan, dan beberapa penjelasan rinci mengenai teknik-teknik data mining dan data sains. Pembelajaran dilakukan melalui penjelasan, forum diskusi, dan studi kasus dari dunia nyata. Penekanan diletakan pada pemahaman konsep-konsep fundamental data sains dan penerapannya pada aplikasi bisnis dari data mining. Pertemuan kelas merupakan kombinasi antara kuliah / diskusi tentang materi dasar, diskusi tentang aplikasi bisnis dari ide dan teknik, diskusi kasus, latihan siswa, dan demo. Selain itu, kuliah ini juga akan mencakup beberapa aktivitas langsung menggunakan beberapa tool data mining secara spesifik.

    Buku

    Foster Provost & Tom Fawcett (2013) Data Science for Business: What you need to know about data mining and data analytic thinking, O'Reilly, ISBN: 978-1-449-36132-7.
  • W1: Session 1 - Topik 1

    Topik 1 - Business Intelligence, Data Science and Data Mining

    Tujuan pembelajaran
    • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining

    Terdiri dari sub-topik sebagai berikut:
    • Overall goals
    • Main Literatures
    • Software
    • Decision support system
    • Business Intelligence
    • Data science and data mining

  • W1: Session 2 - Topik 2

    Topik 2 - Business Problem and Data Science Solutions

    Tujuan pembelajaran:
    • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
    • CP2: Mendeskripsikan cara cara mengevaluasi suatu model
    • CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models

    Terdiri dari sub-topik sebagai berikut:
    • The need for data mining
    • From business problems to data mining tasks
    • Supervised vs. unsupervised methods
    • The data mining process

  • W2: Session 3 - Topik 3

    Topik 3 - Project Understanding and Data Understanding

    Tujuan pembelajaran:
    • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining

    Terdiri dari sub-topik sebagai berikut:
    • Project Understanding
    • Data Understanding
    • Attribute Understanding
    • Data Quality
    • Data Visualization
    • Data Preparation
    • Data selection
    • Data cleaning
    • Data transformation
    • Data integration
  • W3: Session 4 - Topik 4

    Topik 4 - Predictive Modelling

    Tujuan pembelajaran:
    • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
    • CP2: Mendeskripsikan cara cara mengevaluasi suatu model

    Terdiri dari sub-topik sebagai berikut:
    • Models and induction
    • Attribute selection
    • Decision Trees
    • Probability Estimation
  • W4: Session 5 - Topik 5

    Topik 5 - Fitting a Model

    Tujuan pembelajaran:
    • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
    • CP2: Mendeskripsikan cara cara mengevaluasi suatu model

    Terdiri dari sub-topik sebagai berikut:
    • Linear classifiers
    • Linear regression
    • Logistic regression
    • Example: tree induction vs. logistic regression

  • W5: Session 6 - Topik 6

    Topik 6 - Over-fitting and Its Avoidance

    Tujuan pembelajaran:
    • CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models

    Terdiri dari sub-topik sebagai berikut:
    • Generalization and Overfitting
    • From holdout evaluation to cross-validation
    • Learning curves
    • Overfitting avoidance and complexity control

  • W5: Session 7 - Review 1

    Review Topik 1 - Topik 6 (face to face)

    Tujuan pembelajaran:
    • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
    • CP2: Mendeskripsikan cara cara mengevaluasi suatu model
    • CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models

    Terdiri dari sub-topik sebagai berikut:
    • Business Intelligence, Data Science and Data Mining
    • Business Problem and Data Science Solutions
    • Project Understanding and Data Understanding
    • Predictive Modelling
    • Fitting a Model
    • Overfitting and Its Avoidance


    • W7: Session 8 - Topik 7

      Topik 7 - Similarity and Cluster Analysis

      Tujuan pembelajaran:
      • CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models

      Terdiri dari sub-topik sebagai berikut:
      • Similarity and distance
      • Introduction to cluster analysis
      • Major clustering techniques and algorithms
      • Validation of Clustering's
      • Case Study

    • W7: Session 9 - Topik 8

      Topik 8 - Evaluating a Model

      Tujuan pembelajaran:
      • CP4: Menganalisa dataset dengan menggunakan berbagai metode data analytics
      • CP5: Mendeskripsikan bisnis scenario global dimana data dan data mining dapat diterapkan

      Terdiri dari sub-topik sebagai berikut:
      • Measuring accuracy
      • Confusion matrix
      • Unbalanced classes
      • A key analytical framework: Expected value
      • Evaluate classifier use
      • Frame classifier evaluation
      • Evaluation and baseline performance

    • W8: Session 10 - Topik 9

      Topik 9 - Visualizing Model Performance

      Tujuan pembelajaran:
      • CP4: Menganalisa dataset dengan menggunakan berbagai metode data analytics

      Terdiri dari sub-topik sebagai berikut:
      • Measuring accuracy
      • Confusion matrix
      • Unbalanced classes
      • A key analytical framework: Expected value
      • Evaluate classifier use
      • Frame classifier evaluation
      • Evaluation and baseline performance

    • W9: Session 11 - Topik 10

      Topik 10 - Evidence and Probability

      Tujuan pembelajaran:
      • CP4: Menganalisa dataset dengan menggunakan berbagai metode data analytics

      Terdiri dari sub-topik sebagai berikut:
      • Introduction
      • Bayes' Rule
      • Applying Bayes' rule to data science
      • Naive Bayes
      • Advantages and Disadvantages of Naive Bayes
      • Example

    • W10: Session 12 - Topik 11

      Topik 11 - Representing and Mining Text

      Tujuan pembelajaran:
      • CP4: Menganalisa dataset dengan menggunakan berbagai metode data analytics

      Terdiri dari sub-topik sebagai berikut:
      • Why Text Is Important but Difficult
      • Text Representation
      • Bag of Words
      • Term Frequency
      • Measuring Sparseness: Inverse Document Frequency
      • Term Frequency (TF) and Inverse Document Frequency (TIDF)
      • Beyond Bag of Words
      • Example: Mining News Stories to Predict Stock Price Movement

    • W11: Session 13 - Topik 12

      Topik 12 - Other Data Science Tasks and Techniques

      Tujuan pembelajaran:
      • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
      • CP2: Mendeskripsikan cara cara mengevaluasi suatu model
      • CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models

      Terdiri dari sub-topik sebagai berikut:
      • Co-occurrences and Associations
      • Profiling: Finding Typical Behaviour
      • Link Prediction and Social Recommendation
      • Data Reduction and Latent Information
      • Bias, Variance, and Ensemble Methods
    • W11: Session 14 - Review 2

      Review Topik 7 - Topik 12 (face to face)

      Tujuan pembelajaran:
      • CP1: Mendemostrasikan pemahanan terhadap teknik teknik data mining
      • CP2: Mendeskripsikan cara cara mengevaluasi suatu model
      • CP3: Memanfaatkan data mining dalam membangun descriptive dan predictive models
      • CP4: Menganalisa dataset dengan menggunakan berbagai metode data analytics
      • CP5: Mendeskripsikan bisnis scenario global dimana data dan data mining dapat diterapkan

      Terdiri dari sub-topik sebagai berikut:
      • Co-occurrences and Associations
      • Profiling: Finding Typical Behaviour
      • Link Prediction and Social Recommendation
      • Data Reduction and Latent Information
      • Bias, Variance, and Ensemble Methods