Tôi có thể trở thành nhà khoa học dữ liệu chỉ với Python không?

Bạn có thể hỏi xung quanh, đọc câu trả lời của Quora hoặc nói chuyện với ai đó trong ngành. Chắc chắn, những phương pháp này sẽ cung cấp thông tin cho bạn, nhưng chắc chắn rằng thông tin này sẽ thiên về trải nghiệm cá nhân của người khác. Làm thế nào những người khác trở thành nhà khoa học dữ liệu ít quan trọng đối với bạn, tôi cá là. Điều bạn quan tâm là liệu bạn có thể trở thành một. Kỹ năng của bạn có phù hợp với lĩnh vực này không?

Vì vậy, đừng nói về cách chúng tôi ở khoa học dữ liệu 365 trở thành nhà khoa học dữ liệu, thay vào đó, hãy tiếp cận mọi thứ khác đi một chút

Nếu bạn muốn trở thành một nhà khoa học dữ liệu, bạn nên trả lời những câu hỏi như một

Một nhà khoa học dữ liệu sẽ không lấy kinh nghiệm và nền tảng của chỉ một hoặc hai nhà khoa học dữ liệu khác và chấp nhận họ như một hướng dẫn tinh túy. Vì vậy, bao nhiêu dữ liệu sẽ đủ về mặt thống kê để cung cấp cho chúng tôi ý tưởng về những gì cần thiết để trở thành một nhà khoa học dữ liệu?

Chúng tôi đã thu thập dữ liệu từ 1.001 hồ sơ LinkedIn được liệt kê công khai của các nhà khoa học dữ liệu. Chúng tôi có thể giả định một cách an toàn rằng hồ sơ LinkedIn của một người là một công cụ ước tính không thiên vị cho CV của một người. Do đó, với mức độ chắc chắn hợp lý về mặt khoa học, chúng tôi đã tìm thấy một số hiểu biết đáng kinh ngạc. Thông tin chi tiết mà chúng tôi rất vui được chia sẻ với bạn

Một nhà khoa học dữ liệu cho tất cả và tất cả các nhà khoa học dữ liệu cho một

Dữ liệu tổng hợp cho một nghiên cứu thuộc loại này là dữ liệu tốt nhất, vì nó sẽ giữ kín mọi hồ sơ cá nhân của các nhà khoa học dữ liệu trong khi làm nổi bật các động lực chính dẫn đến thành công trong sự nghiệp của họ. Bằng cách này, chúng tôi bỏ qua mọi ảnh hưởng cá nhân không liên quan đến bạn

Dưới đây là danh sách tất cả những phát hiện của chúng tôi. Bạn có thể đọc toàn bộ nghiên cứu hoặc chuyển sang bất kỳ phần nào bạn thấy thú vị nhất, tùy bạn chọn

  1. Tóm lược
  2. Cấp độ giáo dục
  3. Trình độ học vấn và kinh nghiệm làm việc
  4. Công việc trước đây
  5. Bằng cấp học thuật
  6. xếp hạng đại học
  7. Tự chuẩn bị và các khóa học trực tuyến
  8. Các khóa học trực tuyến và xếp hạng đại học
  9. Ngôn ngữ lập trình
  10. Quốc gia làm việc và ngôn ngữ lập trình
  11. Đất nước của việc làm và ngành công nghiệp
  12. Quốc gia làm việc và trình độ học vấn
  13. Quốc gia làm việc và kinh nghiệm làm việc
  14. Quy mô công ty và ngôn ngữ lập trình
  15. Quy mô công ty và xếp hạng trường đại học

Lưu ý của tác giả. Nếu bạn quan tâm đến việc theo đuổi sự nghiệp trong lĩnh vực khoa học dữ liệu, thì bạn chắc chắn sẽ muốn xem hướng dẫn nghề nghiệp về khoa học dữ liệu miễn phí của chúng tôi

1. Tóm lược

Một nhà khoa học dữ liệu điển hình trông như thế nào?

Các nhà khoa học dữ liệu có nhiều hình dạng và kích cỡ, nhưng tất nhiên, sẽ có một mức trung bình. Điều này không có nghĩa là bạn cần phải phù hợp chính xác với hồ sơ này để trở thành nhà khoa học dữ liệu. Thay vào đó, hãy cố gắng tìm thấy chính mình trong dữ liệu

Nam giới thường chiếm ưu thế trong lĩnh vực này, điều này có thể vì nhiều lý do mà tôi sẽ không suy đoán nhưng điều tôi biết là điều này không tự động khiến nam giới trở nên tốt hơn [hoặc kém hơn] trong công việc hoặc nhiều hơn [hoặc ít hơn] khả năng được tuyển dụng

Thông thường, các nhà khoa học dữ liệu nói được hai ngôn ngữ nhưng nếu tiếng Anh là ngôn ngữ thứ nhất hoặc thứ hai của bạn [mà tôi cho rằng bạn hiểu những gì tôi đang nói] thì bạn tốt

Một kết quả thú vị nhưng không bất ngờ là kinh nghiệm trung bình của chức danh nhà khoa học dữ liệu – 2 năm. Thuật ngữ “khoa học dữ liệu” đã xuất hiện không quá 10 năm, vì vậy chúng ta không thể mong đợi các nhà khoa học dữ liệu sẽ lỗi thời trong lĩnh vực của họ

Hơn nữa, khoảng thời gian mà nhà khoa học dữ liệu điển hình đã làm trong bất kỳ công việc nào là 4. 5 năm. Điều này có nghĩa là trung bình phải mất 2. 5 năm để trở thành nhà khoa học dữ liệu

Tuyệt vời. Có vẻ như việc tham gia vào khoa học dữ liệu nhanh hơn nhiều so với các lĩnh vực khác

2. Cấp độ giáo dục

Đối với nhiều người, giáo dục được đặt lên hàng đầu trong suy nghĩ của họ. Bạn có cần bằng tiến sĩ để trở thành nhà khoa học dữ liệu không?

Mặc dù tên gợi ý rằng bạn làm như vậy, nhưng điều này không nhất thiết phải như vậy

Chúng tôi nhận thấy rằng mặc dù một lượng đáng kể các nhà khoa học dữ liệu có bằng Tiến sĩ, nhưng bằng Thạc sĩ là đủ. 48% toàn bộ mẫu có bằng Thạc sĩ. Bằng cử nhân cũng vậy, mặc dù ít phổ biến hơn, nhưng không vắng mặt. Thậm chí có vài người có bằng MBA và người này tốt nghiệp tiến sĩ rồi trở thành nhà khoa học dữ liệu

Chúng ta có thể thấy rằng có bằng tiến sĩ là một lợi thế, nhưng có lẽ có một cách khác để trở thành nhà khoa học dữ liệu… Hãy bắt đầu với tư cách là một thực tập sinh

3. Trình độ học vấn và kinh nghiệm làm việc

Mặc dù chúng tôi không biết tỷ lệ thành công của các thực tập sinh, nhưng chúng tôi biết rằng 18% các nhà khoa học dữ liệu đã đạt đến đỉnh cao chỉ trong vòng hai công việc sau khi hoàn thành khóa thực tập của họ; .

Vì vậy, nếu bạn có bằng Thạc sĩ, việc theo học Tiến sĩ 4 năm có thể không cần thiết như bạn nghĩ. Có lẽ tìm kiếm các vị trí thực tập là bước đi phù hợp với bạn

4. Công việc trước đây

Vì vậy, Thực tập là một lựa chọn, phải không?

Hãy xem biểu đồ này về các chức danh công việc trước đây của các nhà khoa học dữ liệu hiện tại

Vị trí trước đây của những người hiện đang làm Nhà khoa học dữ liệu

Vị trí trước đây của những người hiện đang làm Nhà khoa học dữ liệu

Đến đây rồi, cách tốt nhất để trở thành một nhà khoa học dữ liệu là đã trở thành một. Đó là hạt dẻ đó

“Không thể có kinh nghiệm mà không có việc làm, không thể có việc làm mà không có kinh nghiệm. ”

Tuy nhiên, đừng mất hy vọng, không chỉ có một số cụm công việc lớn mà từ đó chúng tôi có được hầu hết các nhà khoa học dữ liệu. nhà phân tích [nhà phân tích dữ liệu, nhà phân tích BI, bao gồm nhà phân tích kinh doanh], học giả, thực tập sinh, chuyên gia CNTT và chuyên gia tư vấn. Chúng tôi cũng đã xem xét các vị trí trước đây của những người từng là nhà khoa học dữ liệu trước khi nhận vị trí nhà khoa học dữ liệu hiện tại của họ

Vị trí 'trước-trước' của những người có công việc trước đây cũng là Nhà khoa học dữ liệu

Vâng, những gì bạn biết không?

Cấp, nếu bạn đã là một nhà khoa học dữ liệu, bạn có nhiều khả năng tìm được một công việc khoa học dữ liệu hơn. Nhưng nếu bạn đã là một nhà khoa học dữ liệu, tại sao bạn lại đọc bài viết này?

Tôi sẽ cho rằng bạn chưa phải là nhà khoa học dữ liệu, nhưng ngay cả khi bạn là một nhà khoa học dữ liệu, bạn sẽ đến từ một nhóm các vị trí khác nhau - nhà phân tích, học viện, thực tập, CNTT hoặc tư vấn

Có thể suy luận rằng Tiến sĩ có khả năng trải qua học viện, trong khi Thạc sĩ trung bình sẽ trải qua các vị trí phân tích, thực tập sinh hoặc CNTT

Bây giờ chúng ta sẽ lùi lại một bước và nhìn vào bức tranh toàn cảnh và xem liệu có bất kỳ mẫu nào khi chúng ta xem các vị trí 'trước-trước' của cả nhóm không

Điều có vẻ thú vị đối với chúng tôi là CNTT phổ biến hơn là tư vấn, chẳng hạn. Vì vậy, kiến ​​thức lập trình vững chắc có vẻ như là thứ đáng để tìm hiểu. Có lẽ giáo dục không phải là một ý tưởng tồi

suy nghĩ của bạn về điều đó là gì?

Đúng rồi. Tôi không nên hỏi bạn, tôi nên hỏi dữ liệu

5. Bằng cấp học thuật

Vì vậy, hãy hỏi dữ liệu

Chúng tôi đã thiết lập cách 'nhà khoa học dữ liệu trung bình' đạt được danh hiệu và loại bằng cấp mà họ đạt được. Bây giờ sẽ là hợp lý nếu kiểm tra chính xác những gì họ đã học ở trường đại học

Có nghĩa là có rất ít hoặc không có 'giáo dục khoa học dữ liệu' chính thức; . 5 năm trước, có vẻ như họ không học khoa học dữ liệu ở trường đại học vì đơn giản là nghề này quá mới

Trong mẫu của chúng tôi, chúng tôi có hơn 500 bằng cấp học thuật. Tất nhiên, chúng tôi phải nhóm chúng lại theo một cách nào đó. Chúng tôi xác định được 7 cụm. Chúng không hoàn toàn khác nhau, nhưng chúng ta có thể nói. họ đủ khác nhau

Các cụm là

  • Kinh tế và Khoa học xã hội
  • Thống kê và Toán học
  • Khoa học tự nhiên [Vật lý, Hóa học, Sinh học]
  • Phân tích và Khoa học Dữ liệu [bao gồm Học máy]
  • Khoa học máy tính [không bao gồm Học máy]
  • Kỹ thuật

Và dĩ nhiên…

  • Khác

Vì vậy, những phát hiện là gì?

Như bạn có thể thấy, không có một lĩnh vực nào nổi bật như một lĩnh vực thành công hơn những lĩnh vực khác. Đây là một tin tốt, có vẻ như hầu hết mọi bằng cấp đều có thể đưa bạn trở thành một nhà khoa học dữ liệu. Chỉ cần chắc chắn rằng nó về cơ bản là định lượng. Bằng sân khấu âm nhạc có thể không mang lại lợi ích cho bạn nhiều như bằng thống kê

Sự tập trung lớn nhất của các nhà khoa học dữ liệu có bằng cấp từ cụm khoa học máy tính [tuy nhiên, đáng chú ý là chúng tôi đã đưa Học máy vào cụm Khoa học dữ liệu, thay vì Khoa học máy tính. Nếu chúng tôi làm khác đi, Khoa học Máy tính sẽ có tỷ trọng cao hơn]

Theo logic, những người về nhì là các nhà toán học và thống kê. Một định nghĩa phổ biến về công việc của nhà khoa học dữ liệu là

'Nhà khoa học dữ liệu là một nhà thống kê giỏi hơn hầu hết các lập trình viên và là một lập trình viên giỏi hơn hầu hết các nhà thống kê'

Câu trích dẫn này có thể khá sát với định nghĩa thực sự của nghề

Nhưng mà…

Đừng nản lòng nếu bạn là sinh viên chuyên ngành kinh doanh hoặc kinh tế. Cụm “Kinh tế và Khoa học xã hội” đang giữ vững phong độ của riêng mình. Chúng tôi đã lường trước được sự hiện diện mạnh mẽ trong lĩnh vực này, nhưng không nhiều. Vì vậy, làm thế nào về chúng ta điều chỉnh định nghĩa một chút

'Một nhà khoa học dữ liệu là một nhà thống kê và kinh tế giỏi hơn hầu hết các lập trình viên, một lập trình viên và nhà kinh tế giỏi hơn hầu hết các nhà thống kê, và một nhà thống kê và lập trình giỏi hơn hầu hết các nhà kinh tế'

Tại sao cụm khoa học dữ liệu không có thứ hạng cao hơn?

Mặc dù cụm 'Khoa học dữ liệu và phân tích' bị tụt lại ở mức 10% trong mẫu của chúng tôi, nhưng đây là một lĩnh vực tương đối mới, vì vậy nó đang bắt kịp. Điều này có thể khó khăn khi các trường đại học chưa sẵn sàng đáp ứng nhu cầu thị trường việc làm cao đối với các nhà khoa học dữ liệu hiện đang diễn ra. Do đó, dữ liệu này có thể trông rất khác trong 10 năm nữa

Bây giờ tôi đã cho bạn thấy dữ liệu về 'làm thế nào' [các vị trí trước đây và kinh nghiệm liên quan] và 'cái gì' [thành tích học tập và lĩnh vực nghiên cứu]

Bây giờ là lúc cho 'ở đâu'

6. xếp hạng đại học

Vì vậy, các nhà khoa học dữ liệu đã tốt nghiệp từ đâu?

Chúng tôi đã sử dụng 'Xếp hạng các trường đại học trên thế giới của Times Higher Education' để tìm vị trí của các trường đại học dành cho các nhà khoa học dữ liệu của chúng tôi. Có vẻ như các trường đại học tốt hơn thực sự đang tạo ra nhiều nhà khoa học dữ liệu hơn, giống như hầu hết các công việc được trả lương cao. Vì vậy, lấy tất cả các trường đại học trong bảng xếp hạng của Times, chúng tôi nhận thấy xu hướng dự đoán

Khi bạn đọc sơ đồ, hãy nhớ rằng các cụm có kích thước khác nhau

Có một chi tiết hấp dẫn mặc dù. 25% các nhà khoa học dữ liệu đến từ các trường đại học thậm chí không được xếp hạng bởi Times. Con số đó gần bằng số người đến từ 50 trường đại học hàng đầu

Một kết quả bất ngờ và hấp dẫn khác. Khoa học dữ liệu không bao giờ làm chúng ta ngạc nhiên

Cleary, đại học quan trọng nhưng không quá mức. Đối với ngành học của bằng cấp của bạn, nơi bạn tốt nghiệp có tác động nhưng không nhiều bằng một số ngành nghề. Lấy ví dụ về ngân hàng đầu tư, việc có sinh viên tốt nghiệp từ các trường đại học không được xếp hạng làm việc trong lĩnh vực này thực tế là chưa từng có.

Các nhà khoa học dữ liệu dường như có khả năng tham gia công việc dựa trên kiến ​​thức của họ, thay vì tín hiệu giáo dục của họ đang gửi đi. Lý thuyết tín hiệu quá dài

Vì vậy, không chỉ bằng cấp của nhà khoa học dữ liệu trung bình là 'thứ gì đó định lượng', mà thứ hạng của trường đại học của họ cũng 'đâu đó'

Đây là một tin tuyệt vời cho đến nay đối với các nhà khoa học dữ liệu đầy tham vọng như bạn

7. Tự chuẩn bị và các khóa học trực tuyến

Với các nhà khoa học dữ liệu đến từ rất nhiều nền tảng khác nhau, làm thế quái nào mà họ có được kiến ​​thức để thực hiện công việc?

Vâng, đó là những gì chúng tôi tự hỏi, quá

Họ chắc chắn đã dành thời gian để tự chuẩn bị, nhưng làm thế nào để đo lường điều này hơi có vấn đề; . Chúng tôi cho rằng một người sẽ và không thể đăng chứng chỉ khóa học trực tuyến nếu họ chưa hoàn thành nó

Tuy nhiên, nó có thể không cung cấp kết quả cuối cùng;

Ít nhất 40% đã đăng một hoặc nhiều khóa học trực tuyến

Còn tổng số chứng chỉ thì sao? . Có trung vị là 0, chế độ là 0, nhưng giá trị trung bình là 3. 3 chứng chỉ. Từ điều này, chúng ta có thể suy luận rằng một số nhà khoa học dữ liệu phụ thuộc rất nhiều vào giáo dục ngoại khóa, trong khi những người khác thì không

Chúng ta có thể làm gì với thông tin này sau đó?

Chúng tôi có thể thấy một số kết quả thú vị nếu chúng tôi kiểm tra xem ai dựa vào các khóa học trực tuyến và ai không. Thật hợp lý khi các nhà khoa học dữ liệu đã học tại các trường đại học được xếp hạng cao hơn sẽ ít sẵn sàng tham gia một khóa học trực tuyến hơn, phải không?

8. Các khóa học trực tuyến và xếp hạng đại học

Sử dụng cùng một thứ hạng như trước đây, chúng tôi hình dung mối quan hệ thú vị này

 

Như chúng tôi đã nói, 40% mẫu của chúng tôi cho thấy họ đã tham gia các khóa học trực tuyến và hãy nhớ rằng các cụm xếp hạng trường đại học mà bạn thấy không có cùng quy mô nên khả năng so sánh có phần hạn chế. Thật hữu ích khi so sánh chúng với mức trung bình, mặc dù

Hãy xem xét chúng lần lượt

Những nhà khoa học dữ liệu tốt nghiệp từ các trường đại học xếp hạng cao hơn dường như không mong muốn hoặc cần nhiều bằng cấp bổ sung đó. Điều thú vị là những người tốt nghiệp từ các trường đại học hạng hai [thứ 51-100 trong bảng xếp hạng] thậm chí còn ít có khả năng tham gia học thêm

Cái nhìn sâu sắc nhất mà chúng tôi nhận được là các nhà khoa học dữ liệu từ các trường đại học được xếp hạng thấp nhất và những người đến từ các trường hoàn toàn không được xếp hạng đều cao hơn đáng kể so với mức trung bình về việc tham gia các khóa học trực tuyến

Bây giờ chúng tôi đã hiểu rõ về cách sinh viên tốt nghiệp có được các kỹ năng để trở thành nhà khoa học dữ liệu. Nhưng làm thế nào điều này chuyển sang thế giới thực?

9. Kỹ năng lập trình

Chúng tôi đã lưu ý 3 xác nhận hàng đầu liên quan đến khoa học dữ liệu mà các nhà khoa học dữ liệu có trong hồ sơ của họ. Rõ ràng là họ thích thể hiện ngôn ngữ lập trình của mình

Vậy cái nào nổi bật?

R, Python và SQL

Điều này lặp lại tất cả các nghiên cứu khác ngoài kia. Nhưng nghiên cứu xác nhận là đáng tin cậy, vì vậy đây là kết quả của bạn

Tương tự như những gì những người khác trước chúng tôi đã tìm thấy, R và Python là những ngôn ngữ được sử dụng phổ biến nhất. Theo thống kê, dựa trên mẫu của chúng tôi, chúng được sử dụng như nhau bởi chỉ hơn 50% các nhà khoa học dữ liệu. Chúng tôi không có một mẫu đủ lớn để nói rằng cái này tốt hơn cái kia hoặc mức độ sử dụng của từng cái, nhưng chúng là những kỹ năng phổ biến nhất cần có

Ngôn ngữ lập trình phổ biến thứ 3 là SQL. Xử lý cơ sở dữ liệu là một phần thiết yếu trong công việc của nhà khoa học dữ liệu, vì vậy không ngạc nhiên khi 40% chuyên gia trong mẫu của chúng tôi 'nói' SQL

Vì đó là những kỹ năng mà chúng ta đang nói đến, sẽ rất hữu ích nếu bạn tìm hiểu sâu hơn một chút. MATLAB, Java và C/C++ là những ngôn ngữ tiếp theo trong dòng

Thông báo quan điểm cá nhân. – MATLAB chủ yếu được sử dụng bởi các thế hệ cũ và các học giả; . R và Python đã vượt lên dẫn trước. Việc sử dụng MATLAB có thể sẽ còn giảm hơn nữa, trong khi Python dự kiến ​​sẽ tăng trong những năm tới

Cuối cùng, Java và C/C++ chắc chắn được thúc đẩy bởi các chuyên gia CNTT. Hầu hết các chuyên gia học viết mã và hướng tới sự nghiệp khoa học dữ liệu thường sẽ chọn Python và R. Phần thưởng để đầu tư thời gian của bạn vào Java và C/C++ dường như không xứng đáng trong tình hình hiện tại

Bây giờ chúng ta sẽ nói về các yếu tố ảnh hưởng tùy thuộc vào vị trí của bạn khi bạn trở thành nhà khoa học dữ liệu

Bạn có thể nghĩ rằng nơi bạn làm việc không tạo ra nhiều khác biệt nhưng hãy để tôi cho bạn xem kết quả và sau đó bạn có thể quyết định

Nếu bạn quan tâm đến việc học Python, đây là một số bài viết tuyệt vời để bắt đầu. Giới thiệu về Lập trình với Python, Hàm Python cho người mới bắt đầu, Cú pháp Python cơ bản – Giới thiệu về Cú pháp và Toán tử

10. Đất nước của việc làm và kỹ năng lập trình

Trong nghiên cứu của mình, chúng tôi đã xem xét quốc gia làm việc hiện tại của nhà khoa học dữ liệu chứ không phải quốc gia xuất xứ của họ

Chúng tôi đã chia mẫu thành bốn vùng. Hoa Kỳ, Vương quốc Anh, Ấn Độ và các quốc gia khác, do phương pháp lấy mẫu mà chúng tôi đã sử dụng [xem bên dưới]

Vì thế? . GDP càng cao, các công cụ khoa học dữ liệu họ sử dụng càng hiện đại

Ở Mỹ, các nhà khoa học dữ liệu chủ yếu dựa vào R, Python và SQL. Chỉ 30% nhà khoa học dữ liệu sử dụng các công cụ như MATLAB, SAS, SPSS, Scala, v.v. Những kết quả này song song chặt chẽ với phát hiện chung về vấn đề này

Ở Anh, mọi thứ hoạt động hơi khác một chút. 40% bộ kỹ năng của nhà khoa học dữ liệu Vương quốc Anh là do các công cụ khác. Vì vậy, các ngôn ngữ mã hóa truyền thống như Java, C/C++ và MATLAB vẫn đứng vững. Python, R và SQL vẫn dẫn đầu nhưng với biên độ hẹp hơn

Cuối cùng, ở Ấn Độ, SQL là kỹ năng số một. Tương tự như Vương quốc Anh, những người làm việc ở Ấn Độ ít dựa vào R và Python hơn, và nhiều hơn vào các ngôn ngữ truyền thống. Bây giờ, tại sao lại như vậy?

11. Đất nước của việc làm và ngành công nghiệp

Các quốc gia khác nhau có đặc sản khác nhau, phải không?

 

Chà, ngành công nghiệp chắc chắn giải thích phần lớn sự thay đổi

Những người được tuyển dụng ở Ấn Độ chủ yếu làm việc trong lĩnh vực Công nghệ/CNTT. Sự hiện diện của các cựu chuyên gia CNTT và sinh viên tốt nghiệp CS là rất đáng kể, và đương nhiên, họ có quyền truy cập vào rất nhiều ngôn ngữ mã hóa mà các nhà toán học hoặc nhà kinh tế thực sự không có thời gian để học

Ở Hoa Kỳ, mẫu gần như được chia đều giữa các cụm công nghệ và cụm công nghiệp [công nghiệp liên quan đến bán lẻ, năng lượng, FMCG, v.v. ]

Tình hình ở Anh cũng tương tự, nhưng lớn hơn một chút là ngành Tài chính. Chà, London là một trong những trung tâm tài chính mạnh nhất thế giới vào lúc này. Thật hợp lý khi người Anh đặt cược vào tài chính dựa trên dữ liệu

Tuy nhiên, trong lĩnh vực tài chính, kiến ​​thức lập trình cần thiết hơi khác so với bộ kỹ năng thông thường của nhà khoa học dữ liệu. Các ngôn ngữ như Java và C/C++ có giá trị hơn

Quay trở lại biểu đồ trước đó [và xem xét dữ liệu không có trong biểu đồ], các nhà khoa học dữ liệu có trụ sở tại Vương quốc Anh đã báo cáo ồ ạt MATLAB và LaTeX là “các kỹ năng nổi bật & xác nhận” của họ

Tại sao bạn lại coi LaTeX là một trong 3 kỹ năng hàng đầu của mình? . Có lẽ có một mối tương quan được tìm thấy ở đây…

12. Quốc gia làm việc và trình độ học vấn

Và thực sự, có - Vương quốc Anh là nhà tuyển dụng tiến sĩ số 1. Nhớ mức trung bình? . Làm cho mức trung bình 37% đó ở Vương quốc Anh. Cạnh tranh gay gắt, Châu Âu

Hoa Kỳ và 'Những người khác' có mức trung bình phản ánh kết quả chung mà chúng tôi đã tìm thấy trước đó. Tuy nhiên, ở Ấn Độ, mọi thứ trông rất khác, không cần bằng tiến sĩ đâu các bạn ạ. Ngay cả bằng Cử nhân cũng có thể là đủ

Có vẻ như để trở thành một nhà khoa học dữ liệu ở Ấn Độ đòi hỏi trình độ học vấn thấp hơn. Nhưng làm thế nào điều đó dịch khi nói đến kinh nghiệm làm việc thực tế?

13. Quốc gia làm việc và kinh nghiệm làm việc

Vị trí nào dẫn đến sự phát triển nghề nghiệp nhanh nhất?

Có vẻ như Ấn Độ và Vương quốc Anh là những nơi phù hợp ngay bây giờ. Với 22% các nhà khoa học dữ liệu chỉ có 0-12 tháng kinh nghiệm trước đó

Nhưng hãy nhớ Vương quốc Anh cũng là câu lạc bộ tiến sĩ. Các nhà khoa học dữ liệu không có nhiều kinh nghiệm, nhưng họ có thể có rất nhiều ấn phẩm…

Ở Mỹ, lĩnh vực này trông trưởng thành hơn. Bạn làm việc chăm chỉ trong một khoảng thời gian dài hơn và sau đó bạn trở thành một nhà khoa học dữ liệu. Ngay cả khi không có bằng tiến sĩ

Nói về 'trưởng thành', chúng tôi quyết định so sánh các công ty khổng lồ trong danh sách Fortune 500 với các công ty khác [công ty mới thành lập hoặc doanh nghiệp vừa và nhỏ và các công ty lớn không thuộc F500]

14. Quy mô công ty và ngôn ngữ lập trình

Về ngôn ngữ mã hóa, F500 bị tụt lại phía sau

không ngạc nhiên

Các công ty trong danh sách Fortune 500 phụ thuộc rất nhiều vào các ngôn ngữ công ty đã được thiết lập như SAS và miễn cưỡng áp dụng R và Python

Quan trọng nhất, họ không sử dụng SQL nhiều vì Hadoop tỏ ra hữu ích hơn đối với họ. Và logic như vậy. Dữ liệu lớn là vua ở đó

Tất cả những thông tin này có lẽ đã khiến bạn phải suy nghĩ. Bạn có thể trở thành một nhà khoa học dữ liệu trong một công ty F500 với trình độ học vấn của bạn cho đến nay không?

15. Quy mô công ty và xếp hạng trường đại học

Đáng chú ý, xếp hạng trường đại học không tạo ra sự khác biệt khi nói đến nhà tuyển dụng của nhà khoa học dữ liệu

Các nhà khoa học dữ liệu là cần thiết ở khắp mọi nơi. Trong các công ty F500 và trong các công ty khởi nghiệp công nghệ

Lưu ý của tác giả. Bạn muốn biết những công ty hàng đầu nào đang tìm kiếm các nhà khoa học dữ liệu?

Bằng cách nhìn vào biểu đồ này, tôi thầm tin rằng các kỹ năng cá nhân và sự chuẩn bị cho bản thân là những yếu tố mạnh nhất để trở thành một nhà khoa học dữ liệu thành công

Bạn đã đi đến cuối bài viết. Xin chúc mừng. Vì vậy, với một mức độ chắc chắn nhất định, tôi có thể cho rằng bạn muốn trở thành một nhà khoa học dữ liệu. Sau tất cả dữ liệu chúng tôi đã cho bạn xem, bạn cảm thấy rằng mình có thể trở thành một nhà khoa học dữ liệu xuất sắc. Và bạn biết những gì?

Một điều nữa

Hãy để chúng tôi cung cấp một số thông tin chi tiết về cách chúng tôi thực hiện nghiên cứu sâu rộng này…

Chúng tôi đã tiến hành nghiên cứu của riêng mình về chủ đề. Nghiên cứu của chúng tôi liên quan đến 1.001 hồ sơ LinkedIn của các nhà khoa học dữ liệu. Mẫu khá lớn được chia thành hai nhóm tùy thuộc vào việc người đó có được Công ty Fortune 500 tuyển dụng hay không [các nhóm gần như bằng nhau]. Bằng cách này, chúng tôi có thể so sánh các công ty F500 và không thuộc F500. Hơn nữa, mẫu liên quan đến các nhà khoa học dữ liệu làm việc ở Hoa Kỳ [40%], Vương quốc Anh [30%], Ấn Độ [15%] và khác [15%]. Do đó, dữ liệu được thu thập từ các nhà khoa học dữ liệu với nhiều nền tảng khác nhau để hạn chế sai lệch. Hạn ngạch quốc gia được chọn theo cách của họ theo nghiên cứu sơ bộ về các quốc gia phổ biến nhất về khoa học dữ liệu, nơi thông tin được công khai

Vì vậy, trước khi bạn đi, hãy chọn cách tốt nhất để bắt đầu [hoặc tiếp tục] hành trình của mình. Hãy để chúng tôi chỉ nói, chúc may mắn

Sẵn sàng để thực hiện bước đầu tiên hướng tới sự nghiệp trong khoa học dữ liệu?

Xem toàn bộ Chương trình Khoa học Dữ liệu ngay hôm nay. Chúng tôi cũng cung cấp phiên bản xem trước miễn phí của Chương trình Khoa học Dữ liệu. Bạn sẽ nhận được miễn phí 12 giờ nội dung từ cơ bản đến nâng cao. Đó là một cách tuyệt vời để xem liệu chương trình có phù hợp với bạn hay không

Python có đủ để trở thành nhà khoa học dữ liệu không?

Nhu cầu đối với cả nhà khoa học dữ liệu và phân tích dữ liệu sẽ tăng hơn 1000% trong vài năm tới; . Cho dù bạn muốn trở thành một nhà phân tích dữ liệu hay có bước nhảy vọt trở thành nhà khoa học dữ liệu, thì việc học và thành thạo Python là điều bắt buộc .

Python chỉ tốt cho khoa học dữ liệu?

Python trước hết là ngôn ngữ lập trình đa năng. Nó không được thiết kế đặc biệt dành cho khoa học dữ liệu và phân tích. Tuy nhiên, nó đang chứng tỏ là ngôn ngữ hữu ích nhất cho khoa học dữ liệu trong tương lai gần .

Tôi có thể trở thành nhà phân tích dữ liệu chỉ với Python không?

Lập trình Python . Trong nhiều trường hợp, những thứ như Excel không thể đối phó với lượng lớn dữ liệu mà doanh nghiệp có sẵn cho họ. Đây là lý do tại sao lập trình bằng Python là một kỹ năng quan trọng đối với Nhà phân tích dữ liệu .

Tôi có thể trở thành một nhà khoa học dữ liệu mà không cần toán học không?

Nghề khoa học dữ liệu yêu cầu nghiên cứu toán học vì các thuật toán máy học và việc thực hiện phân tích cũng như khám phá thông tin chi tiết từ dữ liệu đều yêu cầu toán học. Mặc dù toán học sẽ không phải là yêu cầu duy nhất cho con đường học vấn và sự nghiệp của bạn trong khoa học dữ liệu, nhưng nó thường là một trong những yêu cầu quan trọng nhất.

Chủ Đề