資料探勘是一門結合統計學與資訊科學相關理論的方法學,希望從堆積如山的資料中,利用自動或半自動的方式,發掘出隱藏在資料中的有用資訊。本中心特別在本次的暑期課程規劃此課程,希望藉由不同的個案實例,運用R語言進行資料探勘,透過視覺化的方式呈現與判讀數據,達到理論與實作兼具的學習目的。課程大綱簡介如下:
- 資料探勘與R軟體使用
- 建立模型的步驟
- 分類:乳腺癌醫學診斷應用、鳶尾花分類應用、新生兒體重數值預測、客戶信用風險評估、交叉驗證與部署模型
- 關聯::關聯規則基本概念、購物產品關聯分析、鐵達尼號關聯分析、維修案例序列分析
- 集群::鳶尾花集群模型、動物分群應用、電信公司的客戶分群、蛋白質攝取集群分析
- 模型評估分析與部署
有關本課程的詳細上課時間及報名資訊請參考http://teach.cc.ntu.edu.tw/course/index.html