C++ hoặc Java cho khoa học dữ liệu

Khoa học dữ liệu là một lĩnh vực thú vị để làm việc, kết hợp các kỹ năng thống kê và định lượng nâng cao với khả năng lập trình trong thế giới thực. Có nhiều ngôn ngữ lập trình tiềm năng mà nhà khoa học dữ liệu đầy tham vọng có thể cân nhắc chuyên sâu vào

Trong khi không có câu trả lời chính xác, có một số điều cần xem xét. Thành công của bạn với tư cách là một nhà khoa học dữ liệu sẽ phụ thuộc vào nhiều điểm, bao gồm

độ đặc hiệu

Khi nói đến khoa học dữ liệu nâng cao, bạn sẽ chỉ phát minh lại bánh xe mỗi lần. Học cách làm chủ các gói và mô-đun khác nhau được cung cấp bằng ngôn ngữ bạn đã chọn. Mức độ khả thi của điều này tùy thuộc vào gói dành riêng cho miền nào có sẵn cho bạn ngay từ đầu

tổng quát

Một nhà khoa học dữ liệu hàng đầu sẽ có kỹ năng lập trình toàn diện tốt cũng như khả năng xử lý các con số. Phần lớn công việc hàng ngày trong khoa học dữ liệu xoay quanh việc tìm nguồn cung ứng và xử lý dữ liệu thô hoặc 'làm sạch dữ liệu'. Đối với điều này, không có gói học máy ưa thích nào sẽ giúp được

Năng suất

Trong thế giới khoa học dữ liệu thương mại thường có nhịp độ nhanh, có nhiều điều cần nói để hoàn thành công việc một cách nhanh chóng. Tuy nhiên, đây chính là nguyên nhân khiến nợ kỹ thuật len ​​lỏi vào — và chỉ với những thông lệ hợp lý thì điều này mới có thể được giảm thiểu

Hiệu suất

Trong một số trường hợp, điều quan trọng là phải tối ưu hóa hiệu suất mã của bạn, đặc biệt là khi xử lý khối lượng lớn dữ liệu quan trọng cho nhiệm vụ. Các ngôn ngữ được biên dịch thường nhanh hơn nhiều so với các ngôn ngữ được giải thích; . Sự đánh đổi rõ ràng là chống lại năng suất

Ở một mức độ nào đó, chúng có thể được coi là một cặp trục (Tính tổng quát-Tính cụ thể, Hiệu suất-Năng suất). Mỗi ngôn ngữ dưới đây nằm ở đâu đó trên các quang phổ này

Với những nguyên tắc cốt lõi này, chúng ta hãy xem xét một số ngôn ngữ phổ biến hơn được sử dụng trong khoa học dữ liệu. Phần tiếp theo là sự kết hợp giữa nghiên cứu và kinh nghiệm cá nhân của tôi, bạn bè và đồng nghiệp — nhưng không có nghĩa là chắc chắn. Theo thứ tự phổ biến, ở đây đi

R

Những gì bạn cần biết

Được phát hành vào năm 1995 với tư cách là hậu duệ trực tiếp của ngôn ngữ lập trình S cũ hơn, R đã phát triển từ sức mạnh này sang sức mạnh khác. Được viết bằng C, Fortran và chính nó, dự án hiện được hỗ trợ bởi R Foundation for Statistical Computing

Giấy phép

Miễn phí

ưu

  • Phạm vi tuyệt vời của các gói nguồn mở, chất lượng cao, dành riêng cho miền. R có một gói cho hầu hết mọi ứng dụng định lượng và thống kê có thể tưởng tượng được. Điều này bao gồm các mạng thần kinh, hồi quy phi tuyến tính, phát sinh loài, âm mưu nâng cao và nhiều thứ khác
  • Cài đặt cơ sở đi kèm với các chức năng và phương pháp thống kê tích hợp sẵn rất toàn diện. R cũng xử lý đại số ma trận đặc biệt tốt
  • Trực quan hóa dữ liệu là một thế mạnh chính với việc sử dụng các thư viện như ggplot2

Nhược điểm

  • Hiệu suất. Không có hai cách về nó, R không phải là ngôn ngữ nhanh
  • đặc thù tên miền. R là tuyệt vời cho mục đích thống kê và khoa học dữ liệu. Nhưng ít hơn cho lập trình mục đích chung
  • kỳ quặc. R có một vài tính năng khác thường có thể thu hút các lập trình viên có kinh nghiệm với các ngôn ngữ khác. Ví dụ. lập chỉ mục từ 1, sử dụng nhiều toán tử gán, cấu trúc dữ liệu độc đáo

Bản án - "tuyệt vời ở những gì nó được thiết kế cho"

R là một ngôn ngữ mạnh mẽ vượt trội trong rất nhiều ứng dụng trực quan hóa dữ liệu và thống kê, và là nguồn mở cho phép cộng đồng những người đóng góp rất tích cực. Sự nổi tiếng ngày càng tăng gần đây của nó là một minh chứng cho thấy hiệu quả của nó đối với những gì nó làm.

con trăn

Những gì bạn cần biết

Guido van Rossum đã giới thiệu Python vào năm 1991. Kể từ đó, nó đã trở thành một ngôn ngữ có mục đích chung cực kỳ phổ biến và được sử dụng rộng rãi trong cộng đồng khoa học dữ liệu. Các phiên bản chính hiện nay là 3. 6 và 2. 7

Giấy phép

Miễn phí

ưu

  • Python là một ngôn ngữ lập trình mục đích chung rất phổ biến. Nó có một loạt các mô-đun được xây dựng có mục đích và hỗ trợ cộng đồng. Nhiều dịch vụ trực tuyến cung cấp API Python
  • Python là một ngôn ngữ dễ học. Rào cản gia nhập thấp làm cho nó trở thành ngôn ngữ đầu tiên lý tưởng cho những người mới lập trình
  • Các gói như gấu trúc, scikit-learning và Tensorflow làm cho Python trở thành một lựa chọn chắc chắn cho các ứng dụng học máy nâng cao

Nhược điểm

  • loại an toàn. Python là một ngôn ngữ được gõ động, có nghĩa là bạn phải thể hiện sự cẩn thận. Các lỗi loại (chẳng hạn như chuyển một Chuỗi dưới dạng đối số cho một phương thức mong đợi một Số nguyên) sẽ xảy ra theo thời gian
  • Đối với các mục đích phân tích dữ liệu và thống kê cụ thể, phạm vi gói rộng lớn của R giúp nó có lợi thế hơn một chút so với Python. Đối với các ngôn ngữ có mục đích chung, có các lựa chọn thay thế nhanh hơn và an toàn hơn cho Python

Phán quyết - “xuất sắc toàn diện”

Python là một lựa chọn ngôn ngữ rất tốt cho khoa học dữ liệu và không chỉ ở cấp độ đầu vào. Phần lớn quy trình khoa học dữ liệu xoay quanh quy trình ETL (trích xuất-chuyển đổi-tải). Điều này làm cho tính tổng quát của Python phù hợp một cách lý tưởng. Các thư viện như Tensorflow của Google làm cho Python trở thành một ngôn ngữ rất thú vị để sử dụng cho máy học

SQL

Những gì bạn cần biết

SQL ('Ngôn ngữ truy vấn có cấu trúc') xác định, quản lý và truy vấn cơ sở dữ liệu quan hệ. Ngôn ngữ này xuất hiện vào năm 1974 và kể từ đó đã trải qua nhiều lần triển khai, nhưng các nguyên tắc cốt lõi vẫn giữ nguyên

Giấy phép

Khác nhau - một số triển khai là miễn phí, một số khác là độc quyền

ưu

  • Rất hiệu quả trong việc truy vấn, cập nhật và thao tác cơ sở dữ liệu quan hệ
  • Cú pháp khai báo làm cho SQL trở thành một ngôn ngữ rất dễ đọc. Không có sự mơ hồ về những gì SELECT name FROM users WHERE age > 18 phải làm
  • SQL rất được sử dụng trong nhiều ứng dụng, khiến nó trở thành một ngôn ngữ rất hữu ích để làm quen. Các mô-đun như SQLAlchemy giúp việc tích hợp SQL với các ngôn ngữ khác trở nên đơn giản

Nhược điểm

  • Khả năng phân tích của SQL khá hạn chế — ngoài việc tập hợp và tính tổng, đếm và tính trung bình dữ liệu, các tùy chọn của bạn bị hạn chế
  • Đối với các lập trình viên đến từ một nền tảng bắt buộc, cú pháp khai báo của SQL có thể đưa ra một đường cong học tập
  • Có nhiều triển khai SQL khác nhau như PostgreSQL, SQLite, MariaDB. Tất cả đều đủ khác biệt để khiến khả năng tương tác trở thành vấn đề đau đầu

Phán quyết - “vượt thời gian và hiệu quả”

SQL hữu ích hơn với tư cách là ngôn ngữ xử lý dữ liệu hơn là công cụ phân tích nâng cao. Tuy nhiên, rất nhiều quy trình của khoa học dữ liệu phụ thuộc vào ETL, tuổi thọ và hiệu quả của SQL là bằng chứng cho thấy đó là một ngôn ngữ rất hữu ích cho nhà khoa học dữ liệu hiện đại.

Java

Những gì bạn cần biết

Java là một ngôn ngữ có mục đích chung, cực kỳ phổ biến chạy trên Máy ảo Java (JVM). Đó là một hệ thống điện toán trừu tượng cho phép tính di động liền mạch giữa các nền tảng. Hiện đang được hỗ trợ bởi Tập đoàn Oracle

Giấy phép

Phiên bản 8 — Miễn phí. Phiên bản kế thừa, độc quyền

ưu

  • phổ biến. Nhiều hệ thống và ứng dụng hiện đại được xây dựng dựa trên Java back-end. Khả năng tích hợp các phương pháp khoa học dữ liệu trực tiếp vào cơ sở mã hiện có là một khả năng mạnh mẽ cần có
  • gõ mạnh. Java không phải là vô nghĩa khi nói đến việc đảm bảo an toàn cho kiểu. Đối với các ứng dụng dữ liệu lớn quan trọng, điều này là vô giá
  • Java là một ngôn ngữ được biên dịch, có mục đích chung, hiệu suất cao. Điều này làm cho nó phù hợp để viết mã sản xuất ETL hiệu quả và các thuật toán học máy chuyên sâu về tính toán

Nhược điểm

  • Đối với các phân tích đặc biệt và các ứng dụng thống kê chuyên dụng hơn, tính chi tiết của Java khiến nó không phải là lựa chọn đầu tiên. Các ngôn ngữ kịch bản được nhập động như R và Python cho năng suất cao hơn nhiều
  • So với các ngôn ngữ dành riêng cho miền như R, không có nhiều thư viện có sẵn cho các phương pháp thống kê nâng cao trong Java

Phán quyết - “một ứng cử viên nặng ký cho khoa học dữ liệu”

Có rất nhiều điều để nói về việc học Java như một ngôn ngữ khoa học dữ liệu được lựa chọn đầu tiên. Nhiều công ty sẽ đánh giá cao khả năng tích hợp liền mạch mã sản xuất khoa học dữ liệu trực tiếp vào cơ sở mã hiện có của họ và bạn sẽ thấy hiệu suất và an toàn loại của Java là những lợi thế thực sự

Tuy nhiên, bạn sẽ không có nhiều gói thống kê dành riêng cho các ngôn ngữ khác. Điều đó nói rằng, chắc chắn là một điều cần xem xét - đặc biệt nếu bạn đã biết một trong R và/hoặc Python

Scala

Những gì bạn cần biết

Được phát triển bởi Martin Odersky và phát hành năm 2004, Scala là một ngôn ngữ chạy trên JVM. Nó là một ngôn ngữ đa mô hình, cho phép cả cách tiếp cận hướng đối tượng và chức năng. Khung điện toán cụm Apache Spark được viết bằng Scala

Giấy phép

Miễn phí

ưu

  • Scala + Spark = Điện toán cụm hiệu năng cao. Scala là lựa chọn ngôn ngữ lý tưởng cho những người làm việc với tập dữ liệu khối lượng lớn
  • đa mô hình. Các lập trình viên Scala có thể có cả hai thế giới tốt nhất. Cả hai mô hình lập trình hướng đối tượng và chức năng đều có sẵn cho họ
  • Scala được biên dịch thành Java bytecode và chạy trên JVM. Điều này cho phép khả năng tương tác với chính ngôn ngữ Java, biến Scala trở thành ngôn ngữ có mục đích chung rất mạnh mẽ, đồng thời cũng rất phù hợp với khoa học dữ liệu

Nhược điểm

  • Scala không phải là một ngôn ngữ đơn giản để thiết lập và chạy nếu bạn mới bắt đầu. Cách tốt nhất của bạn là tải xuống sbt và thiết lập một IDE chẳng hạn như Eclipse hoặc IntelliJ với một trình cắm thêm Scala cụ thể
  • Hệ thống cú pháp và kiểu thường được mô tả là phức tạp. Điều này tạo ra một đường cong học tập dốc cho những người đến từ các ngôn ngữ động như Python

Bản án - "hoàn hảo, cho dữ liệu lớn phù hợp"

Khi nói đến việc sử dụng điện toán cụm để làm việc với Dữ liệu lớn, thì Scala + Spark là những giải pháp tuyệt vời. Nếu bạn có kinh nghiệm với Java và các ngôn ngữ gõ tĩnh khác, bạn cũng sẽ đánh giá cao các tính năng này của Scala

Tuy nhiên, nếu ứng dụng của bạn không xử lý khối lượng dữ liệu chứng minh độ phức tạp gia tăng của Scala, thì bạn có thể sẽ thấy năng suất của mình cao hơn nhiều khi sử dụng các ngôn ngữ khác như R hoặc Python

Julia

Những gì bạn cần biết

Ra mắt cách đây hơn 5 năm, Julia đã tạo được ấn tượng trong thế giới điện toán số. Hồ sơ của nó đã được nâng lên nhờ được một số tổ chức lớn bao gồm nhiều tổ chức trong ngành tài chính áp dụng sớm

Giấy phép

Miễn phí

ưu

  • Julia là một ngôn ngữ được biên dịch JIT ('just-in-time'), cho phép nó mang lại hiệu suất tốt. Nó cũng cung cấp tính đơn giản, khả năng gõ động và viết kịch bản của một ngôn ngữ được giải thích như Python
  • Julia được thiết kế có mục đích để phân tích số. Nó cũng có khả năng lập trình cho mục đích chung
  • khả năng đọc. Nhiều người dùng ngôn ngữ cho rằng đây là một lợi thế chính

Nhược điểm

  • Trưởng thành. Là một ngôn ngữ mới, một số người dùng Julia gặp phải tình trạng không ổn định khi sử dụng các gói. Nhưng bản thân ngôn ngữ cốt lõi được cho là đủ ổn định để sử dụng trong sản xuất
  • Các gói hạn chế là một hệ quả khác của sự trẻ trung của ngôn ngữ và cộng đồng phát triển nhỏ. Không giống như R và Python lâu đời, Julia không có lựa chọn gói (chưa)

Phán quyết - “một cho tương lai”

Vấn đề chính với Julia là một vấn đề không thể đổ lỗi cho. Là một ngôn ngữ được phát triển gần đây, nó không hoàn thiện hoặc sẵn sàng sản xuất như các ngôn ngữ thay thế chính Python và R

Tuy nhiên, nếu bạn sẵn sàng kiên nhẫn, thì có mọi lý do để chú ý khi ngôn ngữ này phát triển trong những năm tới

MATLAB

Những gì bạn cần biết

MATLAB là một ngôn ngữ tính toán số đã được thiết lập được sử dụng trong toàn bộ học viện và ngành công nghiệp. Nó được phát triển và cấp phép bởi MathWorks, một công ty được thành lập vào năm 1984 để thương mại hóa phần mềm

Giấy phép

Độc quyền — giá cả khác nhau tùy thuộc vào trường hợp sử dụng của bạn

ưu

  • Được thiết kế cho tính toán số. MATLAB rất thích hợp cho các ứng dụng định lượng với các yêu cầu toán học phức tạp như xử lý tín hiệu, biến đổi Fourier, đại số ma trận và xử lý ảnh
  • Trực quan hóa dữ liệu. MATLAB có một số khả năng vẽ đồ thị sẵn có tuyệt vời
  • MATLAB thường được giảng dạy như một phần của nhiều khóa học đại học về các môn định lượng như Vật lý, Kỹ thuật và Toán ứng dụng. Kết quả là, nó được sử dụng rộng rãi trong các lĩnh vực này

Nhược điểm

  • giấy phép độc quyền. Tùy thuộc vào trường hợp sử dụng của bạn (học thuật, cá nhân hoặc doanh nghiệp), bạn có thể phải bỏ ra một giấy phép đắt tiền. Có những lựa chọn thay thế miễn phí có sẵn như Octave. Đây là điều bạn nên cân nhắc thực sự
  • MATLAB không phải là một lựa chọn rõ ràng cho lập trình mục đích chung

Phán quyết - “tốt nhất cho các ứng dụng chuyên sâu về toán học”

MATLAB được sử dụng rộng rãi trong nhiều lĩnh vực định lượng và số trong toàn ngành và học viện khiến nó trở thành một lựa chọn nghiêm túc cho khoa học dữ liệu

Trường hợp sử dụng rõ ràng sẽ là khi ứng dụng hoặc vai trò hàng ngày của bạn yêu cầu chức năng toán học nâng cao, chuyên sâu. Thật vậy, MATLAB được thiết kế đặc biệt cho việc này

Những ngôn ngữ khác

Có những ngôn ngữ chính thống khác có thể được các nhà khoa học dữ liệu quan tâm hoặc không. Phần này cung cấp một cái nhìn tổng quan nhanh… tất nhiên là có nhiều chỗ để tranh luận

C++

C ++ không phải là một lựa chọn phổ biến cho khoa học dữ liệu, mặc dù nó có hiệu suất nhanh như chớp và mức độ phổ biến rộng rãi. Lý do đơn giản có thể là một câu hỏi về năng suất so với hiệu suất

Như một người dùng Quora đặt nó

“Nếu bạn đang viết mã để thực hiện một số phân tích đặc biệt có thể sẽ chỉ được chạy một lần, bạn sẽ dành 30 phút để viết một chương trình sẽ chạy trong 10 giây hay 10 phút để viết một chương trình sẽ chạy trong 1

Anh chàng có lý. Tuy nhiên, đối với hiệu suất ở cấp độ sản xuất nghiêm túc, C ++ sẽ là một lựa chọn tuyệt vời để triển khai các thuật toán học máy được tối ưu hóa ở cấp độ thấp

Phán quyết - “không dành cho công việc hàng ngày, nhưng nếu hiệu suất là rất quan trọng…”

JavaScript

Với sự gia tăng của Node. js trong những năm gần đây, JavaScript ngày càng trở thành một ngôn ngữ phía máy chủ nghiêm túc. Tuy nhiên, việc sử dụng nó trong các lĩnh vực khoa học dữ liệu và máy học đã bị giới hạn cho đến nay (mặc dù kiểm tra brain. js và khớp thần kinh. js. ). Nó mắc phải những nhược điểm sau

  • Trò chơi muộn (Nút. js chỉ mới 8 tuổi. ), Ý nghĩa…
  • Có rất ít thư viện và mô-đun khoa học dữ liệu có liên quan. Điều này có nghĩa là không có lợi ích hoặc động lượng chủ đạo thực sự
  • Hiệu suất khôn ngoan, Node. js nhanh. Nhưng JavaScript với tư cách là một ngôn ngữ không phải không có những lời chỉ trích

Điểm mạnh của nút là ở I/O không đồng bộ, việc sử dụng rộng rãi của nó và sự tồn tại của các ngôn ngữ biên dịch thành JavaScript. Vì vậy, có thể hình dung rằng một khung hữu ích cho khoa học dữ liệu và xử lý ETL thời gian thực có thể kết hợp với nhau

Câu hỏi quan trọng là liệu điều này có cung cấp bất cứ điều gì khác với những gì đã tồn tại hay không

Phán quyết - “còn nhiều việc phải làm trước khi JavaScript có thể được coi là ngôn ngữ khoa học dữ liệu nghiêm túc”

perl

Perl được biết đến như một 'con dao của quân đội Thụy Sĩ trong các ngôn ngữ lập trình', do tính linh hoạt của nó như một ngôn ngữ kịch bản có mục đích chung. Nó có nhiều điểm chung với Python, là một ngôn ngữ kịch bản được gõ động. Tuy nhiên, nó chưa thấy bất cứ điều gì giống như sự phổ biến của Python trong lĩnh vực khoa học dữ liệu

Điều này hơi ngạc nhiên vì nó được sử dụng trong các lĩnh vực định lượng như tin sinh học. Perl có một số nhược điểm chính khi nói đến khoa học dữ liệu. Nó không nổi bật nhanh và cú pháp của nó nổi tiếng là không thân thiện. Không có cùng một động lực hướng tới việc phát triển các thư viện dành riêng cho khoa học dữ liệu. Và trong bất kỳ lĩnh vực nào, động lực là chìa khóa

Phán quyết - “một ngôn ngữ kịch bản có mục đích chung hữu ích, nhưng nó không mang lại lợi thế thực sự cho CV khoa học dữ liệu của bạn”

hồng ngọc

Ruby là một mục đích chung khác, ngôn ngữ diễn giải được gõ động. Tuy nhiên, nó cũng chưa thấy sự áp dụng tương tự đối với khoa học dữ liệu như Python

Điều này có vẻ đáng ngạc nhiên, nhưng có thể là kết quả của sự thống trị của Python trong giới học thuật và hiệu ứng phản hồi tích cực. Càng nhiều người sử dụng Python, càng có nhiều mô-đun và khung được phát triển và càng có nhiều người chuyển sang Python

Dự án SciRuby tồn tại để mang lại chức năng tính toán khoa học, chẳng hạn như đại số ma trận, cho Ruby. Nhưng trước mắt Python vẫn dẫn đầu

Phán quyết - “chưa phải là một lựa chọn rõ ràng cho khoa học dữ liệu, nhưng sẽ không gây hại cho CV”

Phần kết luận

Chà, bạn đã có nó — một hướng dẫn nhanh về những ngôn ngữ cần xem xét cho khoa học dữ liệu. Chìa khóa ở đây là hiểu các yêu cầu sử dụng của bạn về tính tổng quát và tính cụ thể, cũng như phong cách phát triển ưa thích cá nhân của bạn về hiệu suất so với năng suất

Tôi thường xuyên sử dụng R, Python và SQL vì vai trò hiện tại của tôi chủ yếu tập trung vào việc phát triển các quy trình ETL và đường dẫn dữ liệu hiện có. Các ngôn ngữ này mang lại sự cân bằng phù hợp giữa tính tổng quát và năng suất để thực hiện công việc, với tùy chọn sử dụng các gói thống kê nâng cao hơn của R khi cần

Tuy nhiên — bạn có thể đã có một số kinh nghiệm với Java. Hoặc bạn có thể muốn sử dụng Scala cho dữ liệu lớn. Hoặc, có lẽ bạn muốn tham gia vào dự án Julia

Có thể bạn đã học MATLAB ở trường đại học, hoặc muốn cho SciRuby một cơ hội? . Nếu vậy, vui lòng để lại câu trả lời bên dưới — Tôi rất mong nhận được phản hồi từ bạn

Cảm ơn vì đã đọc

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO

QUẢNG CÁO


C++ hoặc Java cho khoa học dữ liệu
Peter Gleeson

Đọc thêm bài viết


Nếu bài viết này hữu ích, hãy tweet nó

Học cách viết mã miễn phí. Chương trình giảng dạy mã nguồn mở của freeCodeCamp đã giúp hơn 40.000 người có được việc làm với tư cách là nhà phát triển. Bắt đầu

C có hữu ích cho khoa học dữ liệu không?

C và C++ đang tỏ ra hiệu quả khi nói đến các ứng dụng khoa học dữ liệu . Thế giới khoa học dữ liệu thường nằm trong các ngôn ngữ lập trình khai báo, cấp cao. Python là một ví dụ như vậy trong số các ngôn ngữ lập trình khác nhau, được sử dụng rộng rãi trong khoa học dữ liệu.

Ngôn ngữ nào là tốt nhất cho khoa học dữ liệu?

Python là một trong những ngôn ngữ mã hóa phổ biến nhất được sử dụng trong khoa học dữ liệu do tính linh hoạt và số lượng thư viện khoa học dữ liệu có sẵn. R cũng là một ngôn ngữ lập trình khoa học dữ liệu tốt vì nó hoạt động với nhiều nền tảng và có một thư viện đồ sộ.

C hay Java hữu ích hơn?

Mọi người đều nhất trí rằng Java dễ học hơn vì cú pháp của nó gần với ngôn ngữ tự nhiên hơn C. Hơn nữa, Java đã có sẵn nhiều tính năng để sử dụng, bao gồm đồ họa và âm thanh. Ngôn ngữ Java là ngôn ngữ phổ biến và được sử dụng nhiều thứ ba trên thế giới vào tháng 7 năm 2022, theo chỉ số Tiobe.

Tôi nên học Java hay C++ cho khoa học dữ liệu?

Các công ty doanh nghiệp vẫn sử dụng Java làm ngôn ngữ chính để triển khai các dự án khoa học dữ liệu . Do đó, có Java như một bộ kỹ năng thiết yếu. C/C++ cho các dự án học máy được các tổ chức nghiên cứu hoặc những người đam mê sử dụng.