
Udemy – Data Engineering Essentials using SQL, Python, and PySpark
Đã tải 145+
49000₫
Mô tả
Khóa học "Data Engineering Essentials using SQL, Python, and PySpark" là một khóa học đào tạo về kỹ thuật dữ liệu theo hướng dự án sử dụng SQL, Python và PySpark được xuất bản bởi Udemy Academy. Sau khi hoàn thành khóa học này, bạn sẽ có khả năng tạo một pipeline dữ liệu để xử lý và lưu trữ thông tin, cũng như thực hiện các dự án kỹ thuật và phân tích dữ liệu bằng các kỹ thuật và công nghệ đã được đào tạo. Kỹ thuật dữ liệu là quá trình lọc, lưu trữ và xử lý các dữ liệu khác nhau dựa trên nhu cầu và mục tiêu của một dự án hoặc nghiên cứu cụ thể. Kỹ thuật dữ liệu là một khái niệm tổng quát và bao gồm nhiều phân ngành nhỏ. Ở phần đầu của khóa học này, bạn sẽ được làm quen với các nguyên tắc và cơ bản của các ngôn ngữ lập trình Python và SQL, và sau khi giải quyết các bài tập và dự án trong phần này, bạn sẽ chuyển sang các chủ đề tiếp theo và nâng cao hơn.
Những gì bạn sẽ học trong khóa học "Data Engineering Essentials using SQL, Python, and PySpark":
Xây dựng Data Pipeline với SQL
Hệ thống quản lý cơ sở dữ liệu Postgres
Cài đặt ban đầu của cơ sở dữ liệu và thực hiện các thao tác đơn giản trên thông tin như thêm, xóa, cập nhật, v.v.
Viết các truy vấn và yêu cầu SQL đơn giản
Lọc, tích hợp và nén dữ liệu bằng SQL
Tạo chỉ mục và bảng trong môi trường cơ sở dữ liệu bằng các lệnh DDL và các lệnh khác
Phân vùng và phân loại thông tin trong cơ sở dữ liệu
Các hàm định sẵn trong SQL như thao tác với giá trị chuỗi, v.v.
Viết các truy vấn SQL phức tạp và cụ thể với Postgresql
Nguyên tắc lập trình Python
Triển khai và thực hiện các thao tác đơn giản trong cơ sở dữ liệu với ngôn ngữ lập trình Python
Các lệnh điều kiện và vòng lặp trong Python
Danh sách và tập hợp trong Python
Các loại dữ liệu và kiểu dữ liệu trong lập trình Python
Thư viện Map và Reduce trong Python
Thư viện Pandas
Cài đặt ban đầu của môi trường phát triển ứng dụng kỹ thuật dữ liệu
Các loại API dataframe của Spark như select, filter, groupBy, orderBy, v.v.
Sử dụng các tệp và định dạng khác nhau như Parquet, JSON, CSV, v.v. để xây dựng các truyền dữ liệu
Thông số khóa học:
Nhà xuất bản: Udemy
Giảng viên: Durga Viswanatha Raju Gadiraju
Ngôn ngữ: Tiếng Anh
Trình độ: Trung cấp
Số lượng bài học: 624
Thời lượng: 56 giờ
Yêu cầu đầu vào cho khóa học "Data Engineering Essentials using SQL, Python, and PySpark":
Laptop có cấu hình khá (tối thiểu 4 GB RAM và bộ vi xử lý Dual Core)
Đăng ký tài khoản GCP với tín dụng khả dụng hoặc truy cập AWS
Thiết lập phòng thí nghiệm tự hỗ trợ trên các nền tảng đám mây (bạn có thể phải trả phí đám mây tương ứng trừ khi bạn có tín dụng)
Bằng cấp về Khoa học Máy tính hoặc Công nghệ Thông tin hoặc kinh nghiệm làm việc trong lĩnh vực CNTT là điều rất được mong đợi