Trong tin học dữ liệu (data là)

1. KHÁI NIỆM THÔNG TIN VÀ DỮ LIỆU:

* Thông tin (Informations):

- Thông tin là sự hiểu biết của con người về một thực thể nào đó. Có thể thu thập, lưu trữ, xử lí được của các hiện tượng, sự vật trong thế giới khách quan và các hoạt động của con người trong đời sống xã hội.

VD: Bạn Nam lớp 10A học giỏi, ngoan và cao 1m70. Đó là thông tin về bạn Nam.

* Dữ liệu (Data):

Là sự biểu diễn của thông tin và đã được đưa vào trong máy tính.

2. ĐƠN VỊ ĐO LƯỢNG THÔNG TIN

Bit (viết tắt của Binary Digital) là đơn vị nhỏ nhất để đo lượng thông tin.

VD1: Giới tính của con người chỉ có thể là nam hoặc nữ. Chúng ta qui ước Nam là 1 và Nữ là 0.

VD2: Trạng thái bóng đèn chỉ có thể sáng (1) hoặc tối (0)

Ngoài ra người ta còn dùng các đơn vị cơ bản khác để đo thông tin:

            - 1 Byte = 8 Bit

            - 1 KB (Kilobyte)=1024 Byte

            - 1 MB(Megabyte)=1024 KB

            - 1 GB (Gigabyte)=1024 MB 

            - 1 TB (Terabyte)= 1024 GB

            - 1 PB (Petabyte)= 1024 TB

3. CÁC DẠNG THÔNG TIN

Một số dạng thông tin phi số thường gặp:

- Dạng văn bản: Báo chí, sách, vở, . . . 

- Dạng hình ảnh: Bức tranh, băng hình, bản đồ, . . .

- Dạng âm thanh: Tiếng nói, tiếng còi, tiếng chim hót, . . .

4. MÃ HÓA THÔNG TIN TRONG MÁY TÍNH                                                                                                                                                                                                                                                                                                                                                                                                                                                               Thông tin muốn máy tính xử lí được cần chuyển hóa, biến đổi thông tin thành một dãy bit. Cách biến đổi đó gọi là “Mã hóa thông tin”

    Để mã hóa thông tin dạng văn bản dùng bộ mã ASCII gồm 255 kí tự  được đánh số từ 0 đến 255 và các số hiệu này gọi là mã ASCII thập phân của kí tự. Nếu dùng dãy 8 bit để biểu diễn thì gọi là mã ASCII nhị phân của kí tự.

VD: Kí tự B

- Mã thập phân là 66

- Mã nhị phân là 01000010

5. BIỂU DIỄN THÔNG TIN TRONG MÁY TÍNH

Thông tin có thể được biểu diễn ở 2 dạng: Thông tin loại số và phi số

a/ Thông tin loại số

* Hệ đếm: Là tập các kí hiệu và quy tắc sử dụng tập kí hiệu đó để biểu diễn và xác định giá trị các số.

            - Hệ đếm La Mã là hệ đếm không phụ thuộc vào vị trí. Mỗi kí hiệu có một giá trị như: I=1, V=5, X=10, L=50, C=100, D=500, M=1000

            VD: X trong biểu diễn XI và IX đều có giá trị là 10

    - Hệ đếm Thập phân, Nhị phân, Hexa là hệ đếm phụ thuộc vào vị trí.

            VD: Số 1 trong 10 khác với số 1 trong 01.

Trong hệ đếm cơ số b, có một số N được biểu diễn là:

            N=dndn-1dn-2 ...d1d0,d-1d-2. .d-m

                Giá trị N được tính theo CT:

                N=dnbn+dn-1bn-1+. . .+d0b0+

                           d-1b-1+ . . .+d-mb-m

VD: 453,610=

4*102+5*101+3*100+6*10-1

* Hệ đếm dùng trong Tin học

Trong Tin học thường dùng 2 hệ đếm: Hệ nhị phân, hệ cơ số 16 (hệ Hexa)

+ Hệ nhị phân (hệ cơ số 2): Là hệ dùng hai kí hiệu là chữ số 0 và 1

VD:1012= 1*22+0*21+1*20

= 510

+ Hệ cơ số 16: Là hệ dùng các kí hiệu:0,1,2, . ,9, A, B, C, D, E, F có các giá trị tương ứng là 10,11,12,13,14,15 

VD: 1BE16=

1*162+11*161+14*160=44610

* Biểu diễn số nguyên 

Biểu diễn số nguyên bằng 1 byte như sau:

Bit 7

Bit 6

Bit 5

Bit 4

Bit 3

Bit 2

Bit 1

Bit 0

Bit 7 dùng để xác định số nguyên là âm hay dương

* Biểu diễn số thực

Dùng dấu chấm (.) để ngăn cách giữa phần nguyên và phần phân.

VD: 13456.25

b/ Thông tin loại phi số

* Văn bản:

VD: 01010100  01001001

01001110 biểu diễn xâu kí tự “TIN”

* Các dạng khác: Hình ảnh, âm thanh, . . .

Khái niệm “Phân tích dữ liệu” hay Data Analysis đã ra đời từ lâu, nhưng chưa được vận dụng và khai thác đúng mức. Cho đến vài năm gần đây thuật ngữ này đang dần được nhắc đến nhiều hơn với những ứng dụng thực tiễn mà nó mang lại ở hầu hết các ngành nghề.

Ngày nay các doanh nghiệp cần tận dụng mọi lợi thế mà họ có để tồn tại trong môi trường ngày càng khắc nghiệt. Thị trường bất ổn, nền kinh tế bị thổi phồng, hoàn cảnh chính trị thay đổi, và đại dịch toàn cầu khiến thái độ người tiêu dùng không còn dễ dàng như trước đây. Các doanh nghiệp muốn duy trì và phát triển cần đưa ra những lựa chọn thông minh và hạn chế thấp nhất rủi ro. Phân tích dữ liệu chính là phương pháp tối ưu nhất để doanh nghiệp nhìn rõ bản thân, nhìn rõ thị trường và tìm cho mình lựa chọn tối ưu.

Hãy cùng Trung Tâm Tin Học tìm hiểu về Data Analysis- Phân tích dữ liệu các bạn nhé!

Data Analysis là gì?

Có nhiều cách tiếp cận khác nhau tuy nhiên quy cho cùng Phân tích dữ liệu được hiểu là quá trình làm sạch và xử lý dữ liệu thô, đồng thời trích xuất thông tin theo yêu cầu, trực quan hóa dữ liệu dưới dạng hình ảnh, bảng biểu, đồ thị đồng thời dựa trên những số liệu đã phân tích dự báo kế hoạch tương lai.

Phân tích dữ liệu đóng một vai trò quan trọng trong việc xử lý dữ liệu lớn thành thông tin hữu ích, giúp nhà quản lý có cái nhìn bao quát, nhanh chóng đưa ra quyết định sáng suốt.

Trong tin học dữ liệu (data là)

Tại sao Data Analysis được ứng dụng trong mọi lĩnh vực?

Mọi ngành nghề đều có nguồn dữ liệu với thông tin và đặc thù riêng, cho dù ở vị trí nào doanh nghiệp nào bạn cũng cần cân nhắc hết tất cả những rủi ro, ưu điểm nhược điểm trước khi đưa ra quyết định, và đây chính là lúc Data Analysis vào cuộc.

Sau đây là một số lý do tại sao Data Analysis quan trọng với ngành nghề của bạn.

Nhắm mục tiêu khách hàng tốt hơn: Bạn không muốn lãng phí thời gian quý báu, tài nguyên và tiền bạc của doanh nghiệp để thực hiện các chiến dịch quảng cáo nhắm mục tiêu đến các nhóm nhân khẩu học có ít hoặc không quan tâm đến hàng hóa và dịch vụ bạn cung cấp. Nếu bạn đang làm việc trong lĩnh vực Marketing hay Truyền thông quảng cáo Data Analysis giúp bạn biết nơi bạn nên tập trung nỗ lực quảng cáo và phân chia ngân sách phù hợp.

Vận dụng dữ liệu sẵn có tìm ra Insight khách hàng: Thông qua phân tích dữ liệu doanh nghiệp của bạn có thể hiểu rõ hơn về thói quen chi tiêu, thu nhập khả dụng và các lĩnh vực có khả năng quan tâm nhất của đối tượng khách hàng mục tiêu. Bạn là nhà quản lý doanh nghiệp, Data Analysis giúp bạn dễ dàng hơn trong việc định giá, xác định độ dài của chiến dịch kinh doanh và thậm chí dự đoán số lượng hàng hóa cần sản xuất.

Giảm chi phí hoạt động: Phân tích dữ liệu cho bạn biết lĩnh vực nào trong doanh nghiệp của bạn cần nhiều tài nguyên hơn, và lĩnh vực nào đang làm việc không hiệu quả cần xem xét thu nhỏ hoặc loại bỏ hoàn toàn.

Dữ liệu chính xác cho quyết định tối ưu: Các quyết định được cung cấp đầy đủ thông tin có nhiều khả năng là các quyết định thành công.Phân tích dữ liệu giúp nhà quản lý doanh nghiệp có được thông tin chính xác, liên quan, phù hợp đưa ra quyết định phát triển các chiến lược tiếp thị, kế hoạch kinh doanh cũng như dự báo phần nào tương lai doanh nghiệp.

Trong tin học dữ liệu (data là)

Ai có thể tham gia ngành Data Analysis?

Câu trả lời chính là bất cứ ai. 

Dù bạn đang làm việc trong lĩnh vực nào, bộ phận Marketing- Truyền thông, bộ phận Kinh doanh- Quản trị, Nhân sự hay cấp quản lý… Data Analysis sẽ là kỹ năng hữu ích, là bước đệm giúp bạn phát triển sự nghiệp cũng như quản lý hiệu quả hơn doanh nghiệp của mình.

Bạn không cần có kiến thức CNTT chuyên sâu, hay phải hiểu biết về Lập trình mới có thể tham gia, Data Analysis với nhiều công cụ hỗ trợ giúp bạn dễ dàng thực hiện công việc phân tích dữ liệu và đạt hiệu quả như monng muốn.

Với chương trình Data Analysis tại Trung Tâm Tin Học, chúng tôi giới thiệu đến bạn cách vận dụng ExcelPower BI trong phân tích dữ liệu, kết hợp dự đoán dự báo với Azure ML- dịch vụ điện toán đám mây cũng đến từ “ông lớn” Microsoft. Khóa học được thiết kế dành cho người bắt đầu, chỉ cần bạn quan tâm về phân tích dữ liệu và muốn ứng dụng nhanh nhất vào thực tiễn là có thể tham gia.

Hy vọng một số kiến thức tổng quan về Data Analysis phần nào giúp bạn hiểu rõ hơn về ngành nghề tuy mới mà không mới, đồng thời chứa đựng nhiều tiềm năng này. Cùng nhau cập nhật kỹ năng bởi Làm chủ dữ liệu chính là làm chủ thành công!

Trung Tâm Tin Học ĐH.KHN TP. HCM

Tải thêm tài liệu liên quan đến bài viết Trong tin học dữ liệu (data là)