Hướng dẫn switching from python to r - chuyển từ python sang r

[Hoặc, tại sao tôi ước tôi đọc các tài liệu]

Sau nhiều, nhiều chiến đấu với nó, tuần trước tôi cuối cùng đã quyết định đã đến lúc ngừng làm việc hoàn toàn bằng Python, và tìm ra điều vô nghĩa này mà tôi tiếp tục nghe. Có những bài viết vô tận về điều nào là tốt nhất, vì vậy tôi đã giành được lại ở đây-đủ để nói rằng bạn có thể làm mọi thứ trong một trong hai-nhưng có một vài điều mà tôi ước tôi đã học được trước khi tôi bắt đầu. Thay vào đó, những gì tôi đã làm là lặn trong đầu trước, và viết một số mã rất, rất lộn xộn để khám phá cách trộm cắp và cướp đã thay đổi dưới sự khóa chặt Covid ở London.

Với ý nghĩ đó, đây là 5 điều tôi ước mình biết trước khi bắt đầu mã hóa. Hy vọng rằng, bạn sẽ thấy nó hữu ích và không thất vọng với một số trong số này như tôi đã làm.

Ảnh của Kelly Sikkema trên unplash

1. Python là rộng, r là tập trung vào ” - vì vậy hãy sử dụng các công cụ cốt lõi và đừng lo lắng về nó

Python là tất cả mọi thứ đối với tất cả đàn ông - đó là một hệ sinh thái ngổn ngang của một ngôn ngữ, có thể làm mọi thứ từ đào tạo mạng lưới thần kinh của bạn đến lưu trữ trang web của bạn để cung cấp năng lượng cho robot của bạn.

R không phải là như vậy. Mặc dù nó có thể xây dựng trang web của bạn với việc xô đẩy phù hợp, nhưng nó là một công cụ để nghiên cứu và phân tích trước tiên và điều đó có nghĩa là rất nhiều tùy chọn bạn phải đối mặt khi khám phá Python aren có mặt trong R. Đó là một phước lành. Bạn sẽ sử dụng các công cụ giống như mọi người khác và chúng chỉ hoạt động.

Bạn đã thấy bao nhiêu bài viết vô tận hỏi Python IDE tốt nhất là gì? Cho dù bạn nên sử dụng Conda hay Pip? Lõi Anaconda hay Forge Forge? Có một triệu câu hỏi, và hiếm khi là một câu trả lời đúng của người Viking, bởi vì nó phụ thuộc vào những gì bạn đang làm.

Trong R, không có gì trong số đó: Bạn sẽ tải xuống R phát ra từ hộp [với một ngoại lệ mà tôi sẽ chạm vào sau] và bạn sẽ chạy R Studio. Mọi thứ sẽ làm việc, và nó sẽ *tuyệt vời *. Khi bạn nhập thư viện - có một giao diện đồ họa và mọi thứ - bạn sẽ nhập toàn cầu. 90% thời gian, bạn sẽ ổn.

R Notebook Làm cho kết hợp mã và trực quan đẹp dễ dàng [hình ảnh của tác giả]

Bộ công cụ cốt lõi trong R được duy trì tích cực, miễn phí, được xây dựng cho nghiên cứu và tuyệt vời. Bắt đầu từ đó là tốt.

2. Bạn có thể google bất cứ điều gì trong Python - bạn có thể cần phải đi tìm kiếm rộng hơn một chút cho R. Hãy đọc các tài liệu.

Nếu bạn bất cứ điều gì giống như tôi, bạn sẽ làm rất nhiều chức năng Google-ing mà bạn biết nên tồn tại, nhưng bạn có thể hoàn toàn nhớ mã. Việc loại bỏ chỉ hàng đầu tiên được lặp lại hàng, loại bỏ khoảng trống màu trắng khỏi tên cột, bạn biết, những thứ bạn có thể chỉ nên tìm ra, nhưng nó dễ dàng hơn khi chỉ lấy một số mã nhanh từ bài đăng Stack Overflow đầu tiên. Trong Python, sẽ có 100 bài viết phù hợp với nhu cầu chính xác của bạn. Có thể không có 100 trong R, và đôi khi bạn có thể không tìm thấy bất kỳ điều gì.

Thật khó để đo lường điều này - sau tất cả, R có gần gấp đôi số câu hỏi về Stack Overflow như Pandas - nhưng tôi thấy nhanh chóng nhận được câu trả lời không chính thức khó hơn nhiều so với tôi mong đợi. Điều này cũng đúng với các hướng dẫn: Có rất nhiều bài viết trung bình đi bộ cho bạn qua các khu rừng ngẫu nhiên ở Python, và ít hơn nhiều trong R [mặc dù điều đó một phần cho thấy các chữ cái đơn tìm kiếm khó khăn như thế nào].

Tôi nghi ngờ điều này phản ánh cách mọi người học: R được dạy bởi các học giả và thống kê, trong khi gấu trúc được chọn bởi các loại hacker-wannabe bán lập trình như tôi [không có ý định cho cả hai nhóm dự định]. Sau này sống trên Google, người trước có thư viện, lớp học và sách giáo khoa.

Tin tốt là những cuốn sách giáo khoa thường miễn phí, trực tuyến và được quản lý và quản lý tốt - trên thực tế, thậm chí còn có cả các lớp với nội dung của chúng và một số chức năng như các hướng dẫn tương tác. Vì vậy, hãy dành một giờ, chạy qua một hướng dẫn và xem xét đọc một cuốn sách thực tế trước khi lặn vào các câu hỏi tràn chồng. Bạn có thể không hối tiếc. Tôi đã để lại một danh sách các tài nguyên tuyệt vời dưới đây.

3. Ồ vâng, Tidyverse

Tôi biết, tôi biết rằng tôi đã nói rằng bạn sẽ cần phải lo lắng về các công cụ, nhưng tôi đã nói với một lời nói dối nhỏ bé, tuổi teen: Tidyverse là ngoại lệ chứng minh quy tắc này.

Tidyverse là một hệ sinh thái của các thư viện được quản lý tốt, được bảo trì tốt trong khoa học dữ liệu và thao tác trong R. Thực tế là, nếu bạn đang học R ở bất cứ đâu, có lẽ bạn đã học Tidyverse-các công cụ R nổi tiếng nhất như GGPLOT2 , làm cho việc điều khiển dữ liệu và trực quan tuyệt đẹp trở thành một làn gió thực sự, tất cả đều gọn gàng, vì vậy đừng lo lắng quá nhiều. Nếu bạn đến từ Python, bạn có thể tự hỏi liệu nó có hay không, tất cả đều đáng để học hỏi về điều đó. Tidyverse là tuyệt vời, nó rất cần thiết, và dù sao bạn cũng có thể học nó.

4. Notebook vẫn còn tuyệt vời, nhưng chúng có một chút khác biệt

Hãy nhớ làm thế nào tôi đã nói với bạn rằng bạn yêu Rstudio? Nếu bạn làm việc trong Jupyter Notebooks, thì điều đó thậm chí còn đúng hơn, bởi vì R Markdown là tuyệt vời, và với một chút điều chỉnh, Rstudio là một đối thủ cạnh tranh tuyệt vời với Jupyter Lab.

Khi bạn đã yêu cầu Rstudio mở một cuốn sổ tay và đặt bản xem trước trong cửa sổ, bạn có thể tìm thấy một giao diện mà rất quen thuộc. Bạn có thể viết ghi chú bằng Markdown, thêm hình ảnh, phương trình, thực hiện trên mỗi ô, cho hoặc nhận bất cứ điều gì bạn làm trong Jupyter dịch tốt. Bạn thậm chí có thể phù hợp với một trình xem tài liệu thuận tiện trong đó [mà tôi đề xuất].

Có một vài sự khác biệt khiến một số làm quen. R chấp nhận vô số các định dạng và một số sẽ kết nối tài liệu của bạn với nhau ở cuối - chơi xung quanh với các tùy chọn, nhưng HTML_NOTEbook mặc định có thể sẽ ổn. Mã thực thi cũng được xóa dễ dàng hơn tôi, điều đó, điều đó cần một số người quen. Tùy thuộc vào nhu cầu của bạn, bạn có thể muốn khám phá các tùy chọn bộ đệm.

Theo một số cách, nó cũng tốt hơn rất nhiều. R Markdown giúp việc ẩn các bit cụ thể của một ô, thêm một bảng nội dung và tạo ra các tài liệu HTML hoặc PDF khá đẹp. Thậm chí còn có một số chức năng tốt cho bảng điều khiển và trang web.

Một lần nữa, r thưởng một chút kiên nhẫn cho những thứ này. Đọc tài liệu Rmarkdown, tìm hiểu về các tùy chọn fancier và thưởng thức sổ ghi chép vinh quang của bạn. Thêm một bảng nội dung và một số tài liệu tham khảo. Nó thật dễ thương.

5. Nếu bạn chỉ đi sâu vào, điều đó cũng tốt

Mặc dù tất cả các niggles tôi gặp phải, r và gấu trúc rất giống nhau từ quan điểm chức năng và cấu trúc. Đánh ctrl+shift+enter so với ctrl+enter sẽ không bao giờ ngừng làm tôi bối rối, và khi tôi tìm thấy người quyết định%>% Thậm chí có nghĩa là - nhưng nếu bạn thoải mái trong Python, tất cả các quy trình công việc và nguyên tắc cơ bản mà bạn biết sẽ dịch preetty tốt khi họ không đọc, hãy đọc các tài liệu.

Hy vọng, ít nhất một số trong số này là hữu ích! Tôi chắc chắn đã giành được sự hoán đổi theo R cho việc viết dữ liệu hàng ngày, nhưng nó rất thú vị khi học một bộ công cụ gần như tôi cảm thấy không còn xa lạ nữa. Cầu mong máy tính xách tay của bạn đan nhanh hơn tôi đã làm!

Tôi đã tổng hợp một số tài nguyên tôi phát hiện ra và dựa vào bên dưới. Nếu bạn thấy chúng là hữu ích, vui lòng kiểm tra các tác giả/mua sách của họ/gửi cho họ một email hay - họ tất cả đều vô giá.

R khó học sau Python?

Cả Python và R đều được coi là ngôn ngữ khá dễ dàng để học. Python ban đầu được thiết kế để phát triển phần mềm. Nếu bạn có kinh nghiệm trước đây với Java hoặc C ++, bạn có thể chọn Python một cách tự nhiên hơn R. Nếu bạn có nền tảng về số liệu thống kê, mặt khác, R có thể dễ dàng hơn một chút.. Python was originally designed for software development. If you have previous experience with Java or C++, you may be able to pick up Python more naturally than R. If you have a background in statistics, on the other hand, R could be a bit easier.

Tôi có thể sử dụng R thay vì Python không?

Python vs R: So sánh đầy đủ Python phù hợp hơn cho việc học máy, học sâu và các ứng dụng web quy mô lớn.R phù hợp cho việc học thống kê có các thư viện mạnh mẽ cho thử nghiệm và thăm dò dữ liệu.Python có rất nhiều thư viện.Tuy nhiên, nó có thể phức tạp để hiểu tất cả chúng.R is suitable for statistical learning having powerful libraries for data experiment and exploration. Python has a lot of libraries. However, it can be complex to understand all of them.

R tốt hơn Python ở bất cứ điều gì?

Vì nhiều người sử dụng R để phân tích thống kê và số, nó cung cấp hỗ trợ và thư viện tốt hơn Python.it provides better support and libraries than Python.

Tôi có nên học R nếu tôi biết Python?

Trong bối cảnh khoa học dữ liệu y sinh, hãy học Python trước, sau đó tìm hiểu đủ R để có thể hoàn thành phân tích của bạn, trừ khi phòng thí nghiệm mà bạn phụ thuộc R, trong trường hợp đó học R và điền vào các khoảng trống với đủPython cho mục đích kịch bản dễ dàng hơn.Nếu bạn học cả hai, bạn có thể R mã vào Python bằng RPY.learn Python first, then learn enough R to be able to get your analysis done, unless the lab that you're in is R-dependent, in which case learn R and fill in the gaps with enough Python for easier scripting purposes. If you learn both, you can R code into Python using rpy.

Bài Viết Liên Quan

Chủ Đề