Skip to main content

Big data(빅데이터) 심화


POSTECH
Enrollment is Closed

강좌 소개

이 강좌는 기본적인 빅데이터의 개념부터 시작하여 기술적인 챌린지와 다양한 접근 방법들을 설명하고 직접 프로그래밍을 통해 실습하므로써 빅데이터 문제를 스스로 풀수있는 능력을 기르는 것을 목표로 합니다. 구체적으로, 빅데이터의 기초 이론과 모델에 대한 설명, 데이터베이스와 SQL을 사용한 빅데이터 접근 방법, 그리고 맵리듀스와 하둡, 스파크를 이용한 접근 방법 등 최신 빅데이터 시스템을 이용하여 빅데이터 문제를 직접 코딩하고 해결하는 과정으로 구성되어 있습니다. 또한, 빅데이터에 필요한 통계 이론, 기계학습 및 최적화 이론, 데이터 전처리 방법 등에 대해 강의합니다.  강좌 진행 중 퀴즈, 프로그래밍 숙제, 그리고 시험을 통해 학습 내용을 충분히 이해했는지를 점검할 예정입니다. 컴퓨터 전공자, 또는 비 전공자일 경우, 필요한 수학이나 알고리즘, 프로그래밍 코딩에 대한 기초지식이 있는 분들은 대상으로 강의를 진행할 예정이므로 학습에 어려움이 있을경우 필요한 내용을 스스로 공부하면서 따라올 것을 권장합니다.



강좌 목차

주차주차
1Ⅰ. Introduction to Big Data, Data ModelsIntroduction to Big Data
Data Models
Discussion
2Ⅱ. Data Analysis with SQLRelational Algebra and SQLite
SQL and Query Processing
Discussion
3Ⅲ. MapReduceScalable Data Processing
MapReduce Concept
Discussion
4Ⅳ. HadoopHadoop (HDFS, YARN)
MapReduce Programming
Discussion
5Reading Week 1No Lecture, Time to Catch-up
6Ⅴ. SparkSpark Concept
Spark Programming
Discussion
7Ⅵ. NoSQL, Data MeasuresNoSQL Concept
Data Measures
Discussion
8Ⅶ. Statistics, Data PreprocessingStatistics for Big Data
Data Preprocessing
Discussion
9Ⅷ. Machine Learning IMachine Learning Fundamentals, Decision Trees
Naïve Bayes, Rule Learning, Lazy Learning
Discussion
10Reading Week 2No Lecture, Time to Catch-up
11Ⅸ. Machine Learning IIEnsembles, Evaluations
Linear Classification, Artificial Neural Network, Linear SVM
Discussion
12Ⅹ. Machine Learning III, OptimizationNonlinear SVM, Ranking SVM
Optimization
Discussion
13XI. ClusteringClustering Concepts, Partitioning Methods, Hierarhical Methods
Density-based Methods, Grid-based Methods, Evaluation of Clustering
Discussion
14XII. Recommender SystemRecommender System Ⅰ
Recommender System Ⅱ
Discussion




Instructor

유환조

포스텍 컴퓨터공학과 교수

포스텍 정보통신연구소 부소장

University of IOWA Computer Science 교수

University of Illinois at Urbana Champaign Computer Science 박사


Staff

이지완

포스텍 컴퓨터공학과