Khóa học cung cấp các kiến thức về công cụ R, ngôn ngữ Python để có thể áp dụng trong việc phân tích dữ liệu.
Lịch khai giảng gần nhất
04/2024
Thời gian học
19h30 - 21h30
Đơn vị đào tạo
Main organization
Giới thiệu về khóa học
MỤC TIÊU CỦA KHÓA HỌC
- Học viên biết cách dùng công cụ R, Python trên môi trường Goolge Colab để có thể áp dụng trong việc phân tích dữ liệu.
- Học viên sẽ hiểu rõ các mô hình phân tích hồi quy- áp dụng kiến thức toán học, kinh tế lượng, xác suất thống kê, để phân tích dữ liệu trên công cụ R
- Học viên biết cách biểu diễn dữ liệu từ những kết quả của phân tích.
- Học viên biết cách sử dụng các thư viện có sẵn trong R và Python để viết các Model thống kê, phân tích dữ liệu.
- Làm chủ được kỹ năng xử lý dữ liệu, đặc biệt là dữ liệu có số lượng lớn thường gặp trong tài chính, ngân hàng, bảo hiểm, viễn thông, CNTT, …
ĐỐI TƯỢNG CỦA KHÓA HỌC
- Sinh viên, nghiên cứu sinh nhóm ngành kinh tế, chính trị, xã hội, khoa học, etc. cần kỹ năng lập trình ứng dụng cho việc làm bài tập nghiên cứu, khóa luận tốt nghiệp và học bổ trợ cho công việc sau này
- Người đi làm trong ngành kinh tế, tài chính, thống kê, khoa học xã hội cần học kỹ năng phân tích thống kê dữ liệu để bổ trợ cho công việc.
- Những người đang muốn theo nghề Data Analyst, Data Scientist chuyên nghiệp
- Bất cứ ai muốn hiểu biết về ứng dụng của ngôn ngữ R + Python cho việc phân tích thống kê, phân tích dữ liệu bắt đầu học từ số 0
Nội dung khóa học
Buổi 1: Tổng quan về phân tích dữ liệu định lượng
- Giới thiệu về phương pháp phân tích định lượng
- Thống kê mô tả
- Thống kê suy diễn
- Ngôn ngữ R và Python
- Thực hành trên R và Python
Buổi 2+3. Thống kê mô tả
- Mẫu và các phương pháp chọn mẫu
- Các đại lượng thống kê mô tả
- Phân phối mẫu
- Ước lượng và kiểm định
- Thực hành trên R và Python
Buổi 4+5. Biểu diễn dữ liệu
- Biểu diễn dữ liệu
- Mất mát dữ liệu và xử lý
- Thực hành trên R và Python
Buổi 6+7. Hồi quy tuyến tính đơn
- Motivation
- Giới thiệu hồi quy tuyến tính đơn
- Ước lượng và diễn giải
- Đánh giá mô hình và kiểm định giả thuyết
- Thực hành trên R và Python
Buổi 8+9. Hồi quy đa biến
- Giới thiệu mô hình
- Ước lượng và diễn giải
- Vấn đề cộng tuyến
- Tối ưu hóa mô hình
- Thực hành trên R và Python
Buổi 10+11 Hồi quy phi tuyến
- Giới thiệu mô hình
- Minh họa mô hình phi tuyến và diễn giải
- Một số dạng mô hình hồi quy phi tuyến
- Thực hành trên R và Python
Buổi 12+13 Hồi quy dữ liệu bảng
- Giới thiệu dữ liệu dạng bảng.
- Mô hình pooled OLS
- Hồi quy tác động cố định
- Hồi quy tác động ngẫu nhiên
- Thực hành trên R và Python
Buổi 14+ 15 Mô hình hồi quy logistic
- Giới thiệu mô hình
- Xây dựng mô hình và diễn giải
- Đánh giá mô hình
- Thực hành trên R, python
Buổi 16 Hồi quy Robust
- Giới thiệu mô hình
- Xây dựng mô hình và diễn giải
- Đánh giá mô hình
- Thực hành trên R, python
Buổi 17+18 Mô hình Lasso
- Giới thiệu mô hình
- Xây dựng mô hình và diễn giải
- Đánh giá mô hình
- Thực hành trên R, python
Buổi 19+20 Mô hình time series
- Giới thiệu mô hình
- Xây dựng mô hình và diễn giải
- Đánh giá mô hình
- Thực hành trên R, python
Buổi 21 Hướng dẫn làm project
- Giới thiệu project
- Lựa chọn và xây dựng mô hình phân tích
- Thực thi và đánh giá mô hình
- Thực hành trên R, python
TỔNG KẾT - TRAO CHỨNG NHẬN