Khóa học cấu trúc dữ liệu python trên github

Chào mọi người, chuyện là Maz đã hoàn thành xong 8 khóa học trong lộ trình của chứng chỉ Google Data Analytics hồi tháng 2 vừa rồi. Nhưng vì mải mê vui chơi sau khi có chứng chỉ nên đến tận bây giờ mình mới có thể viết review và chia sẻ cho mọi người được 🙂

Nội dung bài viết lần này bao gồm có

  1. Google Data Analytics là gì?
  2. 3 lý do mình muốn chinh phục chứng chỉ này
  3. Mình đã học được gì trong lộ trình 8 khóa học của Google
  4. Đánh giá của mình về chứng chỉ Google Data Analytics
  5. Lời khuyên dành cho bạn
1. Chứng chỉ Google Data Analytics là gì?

Vào tháng 3 năm 2021, Google đã chính thức ra mắt một chương trình đào tạo trong lĩnh vực Data is Data Analytics Professional Certificates. Bộ phận nội dung và mục tiêu của chương trình này là trang bị kiến ​​thức cũng như kỹ năng cho những ai muốn bắt đầu trở thành Nhà phân tích dữ liệu

Với định nghĩa về Phân tích dữ liệu từ Google

"Data analysis is the collection, transformation, and organization of data in order to draw conclusions, make predictions, and drive informed decision-making. Data analytics in the simplest terms is the science of data. It's a very broad concept that encompasses everything from the job of managing and using data to the tools and methods that data workers use each and every day"

Có hai khái niệm được Google đề cập trong nội dung trên. Đầu tiên là “Phân tích dữ liệu”, nó khá giống với quá trình phân tích dữ liệu mà mình từng chia sẻ trong các bài viết trước. Bắt đầu từ công việc thu thập, tổ chức lưu trữ để chuyển hóa, phân tích và đưa ra các đề xuất. ‘”Phân tích dữ liệu” là một thuật ngữ mở rộng hơn khi nó đề cập đến bất kể công việc nào cần sử dụng dữ liệu cho các công cụ phân tích trong vận động hành động liên tục hàng ngày

Từ đó, định hướng mà Google hướng tới trong khóa học của mình là trang bị cho học viên kiến ​​thức và cả kỹ năng trong lĩnh vực phân tích dữ liệu

2. Lý do khiến mình muốn chinh phục chứng chỉ Google Data Analytics
  • Đầu tiên, mình bị ấn tượng bởi mức độ “Hot” bởi bằng chứng chỉ do Google cung cấp, một công ty siêu hạng và có danh tiếng không thể từ chối. Ngoài ra, nếu bạn lên internet và tìm kiếm các khóa học dành cho Data Analytics thì Chứng chỉ Google Data Analytics luôn xuất hiện ở top đầu và được rất nhiều người khen ngợi.
  • Thứ hai, mình rất muốn biết và muốn xem ở bên ngoài kia, thế giới đang bàn luận, định nghĩa về Data Analyst như thế nào. Đặc biệt là ở Google, một công ty công nghệ lớn và danh tiếng thì họ đang sử dụng dữ liệu ra sao, công việc của người làm phân tích dữ liệu như thế nào
  • Cuối cùng, mình biết ở Việt Nam có rất nhiều bạn trẻ đang bắt đầu định hướng tham gia và lĩnh vực này. Vì thế việc học một chứng chỉ trong ngành là cần thiết với các bạn. Mọi người hay hỏi Maz nên chọn khóa học nào đây?
3. Mình học được gì trong lộ trình của Google Data Analytics Certificate

A. Các công cụ mình được học và thực hành

  • bảng tính. Phân vùng dữ liệu với Excel và Google Sheets
  • SQL [Ngôn ngữ truy vấn có cấu trúc]. Truy vấn và xử lý dữ liệu với SQL
  • Hoạt cảnh. Trực tiếp hóa dữ liệu và tạo bảng điều khiển
  • R and library Tidyverse. Xử lý, phân tích và trực tiếp hóa dữ liệu

Với 4 công cụ mà Google giảng dạy, anh đã trau dồi gần như là có đầy đủ các kỹ năng chuyên môn để trở thành một người làm phân tích dữ liệu. Từ việc xử lý dữ liệu đơn giản trên Excel, truy vấn dữ liệu trong cơ sở dữ liệu bằng SQL, trực quan hóa với công cụ BI như Tableau và cả việc sử dụng 1 ngôn ngữ lập trình như R để phân tích. Chỉ có một sự trở nên sợ hãi rằng, so với Power BI và Python thì Tableau và R có vẻ ít phổ biến hơn. Vì thế, sẽ khó cho các bạn nào có định hướng học Power BI và Python

B. Các kỹ năng của mình được Google dạy khi làm phân tích

Trong lộ trình này, mình học tổng cộng 8 từ khóa học tương ứng với 6 giai đoạn trong quá trình thực hiện phân tích dữ liệu kết hợp với từ khóa mở đầu giới thiệu các khái niệm và từ khóa cuối cùng là thực hiện một dự án

Nội dung cụ thể từng khóa học như sau

khóa 1. cơ sở. Dữ liệu, dữ liệu, mọi nơi

Google sẽ giải thích một số khái niệm cơ bản trong môi trường và công việc phân tích dữ liệu như hệ sinh thái dữ liệu, quy trình phân tích dữ liệu, vai trò dữ liệu và trình độ của nhà phân tích dữ liệu. Từ đó bạn sẽ có được những kiến ​​thức tổng quan nhất, cũng như hiểu được vì sao Google lại chia nội dung học thành 8 khóa học vì nó tương ứng với các giai đoạn phân tích dữ liệu mà Google đề ra

Điểm sơ qua các nội dung tiêu biểu mà mình học được trong khóa này

  • 5 kỹ năng cần thiết của Data Analyst
  • 5 khía cạnh chính của Tư duy phân tích
  • Các biến thể của vòng đời dữ liệu
  • 6 bước Phân tích dữ liệu
  • Công cụ mà Nhà phân tích dữ liệu sử dụng trong Hệ sinh thái dữ liệu

khóa 2. Đặt câu hỏi để đưa ra quyết định dựa trên dữ liệu

Mọi người thường nghĩ Data Analyst chỉ làm phân tích trong lúc xử lý dữ liệu để tìm hiểu sâu. Nhưng thực tế là mình đã thực hiện công việc phân tích ngay từ khi tiếp nhận một yêu cầu hay một bài toán. Mình phải phân rõ các khía cạnh của yêu cầu bằng việc đặt những câu hỏi cần thiết cho đối tác, từ đó xây dựng được cho mình chiến lược phân tích và giải quyết vấn đề

Các điểm chính trong khóa này

  • Đặt câu hỏi hiệu quả bằng phương pháp SMART
  • 6 loại vấn đề phổ biến
  • Dữ liệu nhỏ và dữ liệu lớn
  • Các loại Stakeholders và vai trò của họ trong dự án
  • Cách làm việc với các bên liên quan và các mẹo về Giao tiếp

Phải nói rằng, khi học xong khóa học này mình càng thấy rõ tầm quan trọng của việc xác định đúng vấn đề và hướng giải quyết khi bắt đầu phân tích một bài toán

khóa 3. Chuẩn bị dữ liệu để khám phá

Chuẩn bị dữ liệu là giai đoạn thứ hai trong “Quy trình phân tích dữ liệu”. Bước này vô cùng quan trọng vì đơn giản là không có đủ dữ liệu thì bạn ảo tưởng làm phân tích nào được cả

Các nội dung tiêu biểu

  • Nguồn dữ liệu
  • Phân biệt định dạng và cấu trúc dữ liệu
  • Các loại dữ liệu và cách xác định dữ liệu tốt
  • Các cấp độ và kỹ thuật mô hình hóa dữ liệu
  • Hiểu sự thiên vị, độ tin cậy, quyền riêng tư, đạo đức và quyền truy cập
  • Khái niệm cơ bản về SQL với BigQuery
  • Bắt đầu với Linkedin và Kaggle

Mình ấn tượng rất nhiều nội dung khóa này như là. làm sao để phân biệt tính đúng đắn và tính toàn vẹn của dữ liệu, cách cấu trúc và tổ chức các loại dữ liệu cũng như cung cấp một số nguồn để lấy dữ liệu như Kaggle hay GitHub

khóa 4. Xử lý dữ liệu từ bẩn sang sạch

Tiếp nối nội dung của khóa số 3 [ chuẩn dữ liệu đầy đủ và đảm bảo tính toàn vẹn của dữ liệu]. Ở liệu trình số 4, mình được tiếp cận với các phương pháp chuẩn hóa và làm sạch dữ liệu một cách chỉn chu và có phương pháp

Pointing through a few content places nhé

  • Mô tả các biện pháp thống kê liên quan đến tính toàn vẹn của dữ liệu bao gồm sức mạnh thống kê, kiểm tra giả thuyết và biên độ lỗi

Một số kiến ​​thức thống kê đã được nhắc đến. mẫu, dân số, biên độ sai số, thử nghiệm A/B và khoảng tin cậy, …

  • Tại sao tính toàn vẹn của dữ liệu lại quan trọng?
  • Phải làm gì khi bạn phát hiện có vấn đề với dữ liệu của mình?
  • Kỹ thuật làm sạch dữ liệu
  • Làm sạch dữ liệu trong bảng tính và SQL
  • Ghi lại quá trình làm sạch dữ liệu

khóa 5. Phân tích dữ liệu để trả lời câu hỏi

Chuyện gì tới rồi cũng sẽ tới, giai đoạn phân tích ở đây rồi. Mục tiêu của khóa học này là giúp mình hiểu rõ mục tiêu và những nhiệm vụ chính trong lúc khai phá những hiểu biết sâu sắc từ dữ liệu. Ngoài ra, SQL sẽ được hướng dẫn nhiều ở khóa này

Các nội dung chính bao gồm

  • Tổng hợp dữ liệu để phân tích
  • Tổ chức dữ liệu để phân tích
  • Sắp xếp dữ liệu trong bảng tính và SQL
  • Chuyển đổi và định dạng dữ liệu
  • Kết hợp nhiều bộ dữ liệu
  • Tổng hợp dữ liệu bằng VLOOKUP và THAM GIA
  • Bảng tổng hợp và quy trình xác thực dữ liệu

Thú vị nhất theo mình là phần kiến ​​thức xử lý dữ liệu với SQL. Xuất phát từ yêu cầu bài toán, bạn được hướng dẫn sử dụng bất kỳ phần quan trọng nào của SQL để xử lý

khóa 6. Chia sẻ dữ liệu thông qua nghệ thuật trực quan hóa

Phân tích bằng Excel với SQL rồi, tiếp theo mình sẽ được học phương pháp trực quan hóa dữ liệu bằng Tableau để có thể mang lại kết quả trình bày với các đối tác một cách hiệu quả hơn

  • Trực quan hóa dữ liệu và truyền đạt thông tin chuyên sâu về dữ liệu
  • Các khung để tổ chức Trực quan hóa với Phương pháp McCandless và Kaiser Fung’s Junk Charts Trifecta Checkup
  • nguyên tắc thiết kế
    • Chọn hình ảnh phù hợp
    • Tối ưu hóa tỷ lệ mực dữ liệu
    • Sử dụng định hướng hiệu quả
    • Màu
    • Số thứ
  • Các giai đoạn của tư duy thiết kế
  • Kể chuyện dữ liệu với Tableau
  • Một công thức cho một trực quan hóa mạnh mẽ

Phải nói đây là một trong những khóa học thú vị nhất. By may have too many kiến ​​thức hay ho mình đã được học một cách bài bản hơn bao giờ hết

khóa 7. Phân tích dữ liệu với lập trình R

Ngoài việc sử dụng Excel, SQL và Tableau để thực hiện tất cả các quá trình phân tích phía trên, Google còn muốn mang đến cho học viên một loại ngôn ngữ lập trình phân tích dữ liệu là R. Trong khóa này, mình được trang bị các kiến ​​thức như

  • Khái niệm lập trình cơ bản. Các khái niệm cơ bản khi bạn tiếp xúc với một ngôn ngữ mới
  • Khám phá các gói R. Tìm hiểu các thư viện của R
  • Làm sạch dữ liệu trong R. Clean data with R
  • Tạo trực quan hóa dữ liệu trong R. Trực tiếp hóa dữ liệu với các thư viện có sẵn

Ngoài ra, trong phần thực hành, bạn sẽ được tập trên RStudio từ mức độ dễ đến khó

khóa 8. Nền tảng phân tích dữ liệu của Google. Hoàn thành một Case Study

Chương cuối là nơi để mình có thể tổng hợp tất cả các kiến ​​thức và kỹ năng đóng gói lại trong một vấn đề/bài toán thực tế. Có 2 dự án được Google cung cấp là

  • Nghiên cứu điển hình 1. Xe đạp đi xe đạp-Chia sẻ
  • Nghiên cứu điển hình 2. Thiết bị thông minh Bellabeat

Sau khi bạn hoàn thành công việc xử lý dữ liệu, phân tích với SQL, Tableau và R, bạn sẽ phải tổng hợp lại một tệp báo cáo. Xây dựng thêm danh mục đầu tư là chuyên mục cuối cùng mà Google hướng dẫn. Cụ có thể tạo tài khoản trên GitHub, sau đó đăng tải các sản phẩm của mình lên đó

Phỏng vấn giả [phỏng vấn thử] là một phần cũng thú vị. Được xem người của Google tuyển dụng và quá trình phỏng vấn xuyên suốt 3 vòng cũng giúp mình phần nào có nhiều kinh nghiệm hơn

4. Đánh giá của mình về chứng chỉ này

A. Các điều khiển ấn tượng

  • Lộ trình các khóa học giúp các bạn chưa có kinh nghiệm tích lũy được khá đầy đủ kiến ​​thức và kỹ năng phục vụ công việc của một Chuyên viên phân tích dữ liệu mới thành lập. Từ cách đặt vấn đề, phương pháp cho đến các kỹ năng như excel, SQL, Tableau, R, …
  • Giảng viên hướng dẫn ở cấp giám đốc/trưởng phòng của nhiều phòng ban có sử dụng dữ liệu trong công ty Google. 8 khóa học do 8 người hướng dẫn, từ đó giúp mình mở rộng nhiều góc nhìn hơn về “dữ liệu thế giới”
  • Có nhiều khách mời tham gia chia sẻ, tức bên ngoài giảng viên chính mình còn thấy nhiều video phỏng vấn nhiều thành viên khác trên Google về các vấn đề trong mỗi khóa học

B. Những điểm còn thiếu

  • Các kỹ năng dạy học không thật sự sâu sắc. SQL, R, Tableau, Excel. Hầu hết bài giảng và cách tiếp cận được Google thiết kế dựa trên “vấn đề cần gì thì mình học cái đó”. Việc làm này mang tính ứng dụng thực tiễn cao nhưng không chắc chắn bạn sẽ hiểu đầy đủ tri thức toàn phần bằng các kỹ năng có kỹ năng. Ví dụ như nếu học về SQL, thật sự sẽ còn rất rất nhiều phần kiến ​​thức mình nên học qua chứ không phải “cưỡi ngựa xem hoa” vài nội dung như. CHỌN – TỪ – Ở ĐÂU – THAM GIA – PIVOT – NHÓM THEO. Tương tự như vậy cho phần của Tableu và R
  • Khóa học có ở Coursera và có phí 39USD/ tháng. Nếu bạn hoàn thành càng nhanh, bạn càng tiết kiệm được tiền. Nếu bạn muốn tự do, thì có thể xin tài trợ từ Coursera
5. Lời giới thiệu của Maz

A. Đối tượng phù hợp

  • Người mới bắt đầu muốn tìm hiểu về Data Analytics và Data Analyst [entry level]. By may Google xây dựng khóa học với những nội dung cơ bản Mục đích giúp xây dựng nền tảng cho người chưa có kinh nghiệm
  • Muốn làm đẹp hồ sơ của mình bằng chứng chỉ của Google
  • Có thể dành ra 8-10 tiếng/tuần để học và hoàn thành các bài tập

B. Đối tượng không phù hợp

  • Người đã có kinh nghiệm và kiến ​​thức về Phân tích dữ liệu từ trước. Thật ra mình học là để củng cố kiến ​​thức nền tảng để có thể trình bày những điều cơ bản này một cách khoa học và dễ dàng. Nếu nói mình học được nhiều kiến ​​thức mới không thì mình phải thừa nhận là không, ngoại trừ mình có học được R
  • Người muốn sử dụng Power BI cũng như Python. Một cách dễ hiểu là nếu bạn học Tableau và R sẽ không phổ biến bằng 2 đối thủ kia

Kết quả

Vì vậy, nội dung bài viết đã hoàn thành lần này rồi. Tuy hơi dài nhưng Maz muốn cung cấp cho mọi người nhiều thông tin nhất theo cách có thể. Lựa chọn lựa chọn một khóa học cho bản thân vô cùng quan trọng vì phía trước bạn sẽ phải đánh đổi thời gian, công sức và tiền bạc cho việc học. Vì vậy hãy cân nhắc kỹ thật và lựa chọn cho mình một nơi phù hợp nha

Mọi người có thể đọc lại các bài viết mà Maz có nói về SQL và Tableau ở đây nha

  • Hướng dẫn tự học các nội dung quan trọng của SQL
  • Mình sử dụng công cụ trực quan hóa dữ liệu như thế nào?

Tham gia nhóm chia sẻ kiến ​​thức Dữ liệu tại đây. Liên kết nhóm

Theo dõi Maz tại đây để cùng cập nhật thông báo mỗi khi có bài viết mới nhé

  • trang chủ. Maz học Data & Lucas học Product
  • liên kết
  • Instagram
  • TikTok

** Mọi thông tin trên blog đều thuộc bản quyền của blog Maz Nguyễn. Vui lòng đọc kỹ Thông báo bản quyền trước khi sao chép hoặc đăng tải lại nội dung/hình ảnh của bài viết **

—————————————————————————————————–

Maz có một dự án dạy học ở đây. Maz Học Data với SQL là khóa học đầu tiên, bạn có thể tham khảo qua nếu thấy cần thiết nhé

Chủ Đề