Hướng dẫn python vs r for quantitative finance - python vs r cho tài chính định lượng

Hầu hết các nhà khoa học dữ liệu nghiêm túc & nbsp; thích r hơn python, nhưng nếu bạn muốn làm việc trong khoa học dữ liệu hoặc học máy trong một ngân hàng đầu tư, có lẽ bạn sẽ phải đặt một phần của mình sang một bên. Thay vào đó, các ngân hàng sử dụng Python áp đảo.

"Python được ưu tiên cho R ở các ngân hàng vì một số lý do", người đứng đầu khoa học dữ liệu có trụ sở tại New York tại một ngân hàng hàng đầu nói. "Có sự sẵn có lớn hơn của các gói học máy như sklearn trong python; đó là & nbsp; tốt hơn cho các nhiệm vụ lập trình chung và được sản xuất dễ dàng hơn; cộng với & nbsp; Python tốt hơn để làm sạch dữ liệu (như Perl đã từng) và để phân tích văn bản." & NBSP;

Vì lý do này, ông cho biết các ngân hàng đã chuyển phân tích dữ liệu của họ sang Python gần như hoàn toàn. Có một vài ngoại lệ: một số công việc sử dụng R, nhưng đối với hầu hết các python chiếm phần lớn.

Tuy nhiên, R vẫn có người hâm mộ. Jeffrey Ryan, cựu ngôi sao Quant tại Citadel là một người đề xuất lớn của R và điều hành một hội nghị thường niên về R về tài chính (bị hủy bỏ trong năm nay do Covid-19). "R được thiết kế để tập trung vào dữ liệu và được nhà nghiên cứu xây dựng," Ryan nói. "Trong khi Python đồng chọn khung dữ liệu và chuỗi thời gian của R, thông qua Pandas [Thư viện phần mềm nguồn mở để thao tác dữ liệu trong Python được xây dựng bởi Wes McKinney, một nhà phát triển phần mềm cũ tại Two Sigma.]"

R vẫn được sử dụng trong công việc thống kê và nghiên cứu, Ryan nói. Để so sánh, Python là công cụ của "phân tích dữ liệu phổ biến" và dễ sử dụng mà không cần học thống kê. "Python đã tìm thấy một đối tượng hoàn toàn mới của các lập trình viên vào đúng thời điểm chính xác trong lịch sử," Ryan phản ánh. "Khi các lập trình viên (nhiều hơn các nhà thống kê) muốn làm việc với dữ liệu, Python & NBSP; có sự hấp dẫn của một ngôn ngữ duy nhất" làm tất cả " - ngay cả khi về mặt kỹ thuật không có gì trong thiết kế." & NBSP;

Với tầm quan trọng của dữ liệu trong các dịch vụ tài chính, có thể cho rằng các ngân hàng sẽ ủng hộ ngôn ngữ có khả năng hơn, ngay cả khi nó & nbsp; không cần nỗ lực thêm để làm chủ. Tuy nhiên, Graham Giller, Giám đốc điều hành tại Giller Investments và cựu Trưởng phòng Nghiên cứu Khoa học Dữ liệu tại JPMorgan và Deutsche Bank, cho biết các ngân hàng đã giải quyết Python trên R vì các bộ phận CNTT của các ngân hàng & NBSP; Rất nhiều về dữ liệu.

"Cá nhân tôi thích R rất nhiều," Giller. & Nbsp; "r là & nbsp; nhiều hơn một công cụ cho các nhà thống kê chuyên nghiệp, có nghĩa là những người quan tâm đến suy luận về dữ liệu, thay vì các nhà khoa học máy tính & nbsp; những người quan tâm đến mã." Vì các nhà khoa học máy tính trong các ngân hàng đã đạt được lực kéo, Giller nói rằng các ngân hàng đã "thay thế các câu hỏi bằng các chuyên gia CNTT hoặc với những người thích sâu sắc muốn trở thành chuyên gia" và họ đã mang theo Python. & NBSP;

Đối với các nhà toán học thuần túy trong tài chính, tất cả đều hơi bực bội. Pandas được xây dựng ở mặt sau của R, nhưng đã mang theo một cuộc sống của riêng mình. "Pandas bắt đầu như một cách để mang lại một môi trường giống như Python," Giller nói, quan sát rằng Pandas có thể "chậm và không hiệu quả" bằng cách so sánh.

Hầu hết mọi người không quan tâm đến điều này mặc dù: Càng sử dụng Python và Pandas, họ càng có nhiều trường hợp sử dụng. "R có cơ sở người dùng tương đối nhỏ hơn Python & nbsp; tại thời điểm này," Ryan. & NBSP; "Điều này & nbsp; lần lượt có nghĩa là rất nhiều công cụ bắt đầu được tạo ra xung quanh Python và dữ liệu, và nó được xây dựng dựa trên thành công của nó."

Có một câu chuyện bí mật, tiền boa hoặc nhận xét mà bạn muốn chia sẻ? Liên hệ: & nbsp; & nbsp; trong trường hợp đầu tiên. WhatsApp/Tín hiệu/Telegram cũng có sẵn. in the first instance. Whatsapp/Signal/Telegram also available.

Chịu đựng chúng tôi nếu bạn để lại một bình luận ở cuối bài viết này: Tất cả các bình luận của chúng tôi đều được kiểm duyệt bởi con người. Đôi khi những người này có thể ngủ, hoặc tránh xa bàn làm việc của họ, vì vậy có thể mất một thời gian để nhận xét của bạn xuất hiện. Cuối cùng, nó sẽ - trừ khi nó gây khó chịu hoặc phỉ báng (trong trường hợp đó, nó đã thắng.)

Ảnh bởi & nbsp; Vitaly Vlasov & nbsp; từ & nbsp; pexelsVitaly Vlasov from Pexels

$ \ beingroup $

Đối với các nhiệm vụ được liệt kê, cả Python và R đều hoạt động rất tốt. Có một số gói trong Python không phải trong R và ngược lại. Giải pháp của tôi cho điều này là chỉ cần gọi R từ Python. Điều này cho phép tốt nhất của cả hai thế giới.

Tôi cần đưa ra quyết định liên quan đến kiến ​​trúc của một tập hợp con của khung mô hình hóa của tôi và cần một số đầu vào về tình cảm hiện tại của các câu hỏi khác.

Tôi cũng phải thừa nhận rằng các đặt phòng ban đầu của tôi liên quan đến hiệu suất thông qua Python chủ yếu bị lỗi thời vì một số gói sử dụng nhiều việc triển khai C dưới mui xe và tôi đã thấy các triển khai rõ ràng vượt trội so với mã ngôn ngữ OOP được viết một cách hiệu quả.

Bạn có thể vui lòng bình luận về những gì bạn đang sử dụng? Tôi không hỏi ý kiến ​​cho dù bạn nghĩ rằng một người tốt hơn hay tồi tệ hơn cho các nhiệm vụ dưới đây nhưng cụ thể là lý do tại sao bạn sử dụng R hay Python và liệu bạn thậm chí còn đặt chúng trong cùng một danh mục để thực hiện, trong số những người khác, các nhiệm vụ sau:

  • Có được, lưu trữ, duy trì, đọc, chuỗi thời gian sạch sẽ
  • Thực hiện thống kê cơ bản về chuỗi thời gian, các mô hình thống kê nâng cao như phân tích hồi quy đa biến, ...
  • Thực hiện các tính toán toán học (Fourier Transforms, PDE Solver, PCA, ...)
  • Trực quan hóa dữ liệu (tĩnh và động)
  • Định giá các dẫn xuất (ứng dụng các mô hình giá như mô hình lãi suất)
  • kết nối kết nối (với excel, máy chủ, ui, ...)
  • (Thêm tháng 1 năm 2016): Khả năng thiết kế, thực hiện và đào tạo các mạng học tập sâu.

Chỉnh sửa Tôi nghĩ rằng liên kết sau có thể thêm giá trị mặc dù ngày hơi [2013] (vì một số lý do tối nghĩa mà thảo luận cũng đã bị đóng ...) Python-for-data-phân tích I thought the following link might add more value though its slightly dated [2013] (for some obscure reason that discussion was also closed...): https://softwareengineering.stackexchange.com/questions/181342/r-vs-python-for-data-analysis

Bạn cũng có thể tìm kiếm một số bài đăng trên trang web R-Bloggers giải quyết hiệu quả tính toán giữa các gói R và Python. Như đã được giải quyết trong một số câu trả lời, một khía cạnh là cắt tỉa dữ liệu, chuẩn bị và thiết lập dữ liệu đầu vào. Một phần khác của phương trình là hiệu quả tính toán khi thực sự thực hiện các tính toán thống kê và toán học.

Cập nhật (tháng 1 năm 2016)

Tôi muốn cung cấp một bản cập nhật cho câu hỏi này bây giờ rằng các mạng học tập AI/Deep đang rất tích cực theo đuổi tại các ngân hàng và các quỹ phòng hộ. Tôi đã dành một lượng thời gian tốt để đi sâu vào việc học sâu và thực hiện các thí nghiệm và làm việc với các thư viện như Theano, Torch và Caffe. Điều nổi bật so với công việc và cuộc trò chuyện của riêng tôi với những người khác là rất nhiều thư viện đó được sử dụng thông qua Python và hầu hết các nhà nghiên cứu trong không gian này không sử dụng R trong lĩnh vực cụ thể này. Bây giờ, điều này vẫn tạo thành một phần nhỏ của công việc số lượng được thực hiện trong các dịch vụ tài chính nhưng tôi vẫn muốn chỉ ra nó khi nó chạm trực tiếp vào câu hỏi tôi đã hỏi. Tôi đã thêm khía cạnh này của nghiên cứu lượng tử để phản ánh xu hướng hiện tại.

Khi được hỏi ngày 19 tháng 5 năm 2015 lúc 7:36May 19, 2015 at 7:36

Hướng dẫn python vs r for quantitative finance - python vs r cho tài chính định lượng

$ \ endgroup $

19

$ \ beingroup $

Thỏa thuận của tôi là HFT, vì vậy điều tôi quan tâm là

  1. đọc/tải dữ liệu từ tệp hoặc db một cách nhanh chóng trong bộ nhớ
  2. Thực hiện các hoạt động xả dữ liệu rất hiệu quả (nhóm, biến đổi)
  3. Dễ dàng trực quan hóa dữ liệu

Tôi nghĩ là khá rõ ràng rằng 3. Đi đến R, Đồ họa và GGPLOT2 và những người khác cho phép bạn vẽ bất cứ thứ gì từ đầu với ít nỗ lực.

Khoảng 1. và 2. Tôi ngạc nhiên khi đọc bài viết trước để thấy rằng mọi người đang ủng hộ Python dựa trên gấu trúc và không ai trích dẫn dữ liệu. Dữ liệu. triệu hàng. Từ băng ghế này, bạn có thể thấy dữ liệu đó. Có thể nhanh hơn nhiều thời gian so với gấu trúc và ổn định hơn nhiều (gấu trúc có xu hướng bị sập trên các bảng lớn)

Thí dụ

R) library(data.table)
R) DT = data.table(x=rnorm(2e7),y=rnorm(2e7),z=sample(letters,2e7,replace=T))
R) tables()
     NAME       NROW NCOL  MB COLS  KEY
[1,] DT   20,000,000    3 458 x,y,z    
Total: 458MB
R) system.time(DT[,.(sum(x),mean(y)),.(z)])
   user  system elapsed 
  0.226   0.037   0.264 

R)setkey(DT,z)
R)system.time(DT[,.(sum(x),mean(y)),.(z)])
  user  system elapsed 
  0.118   0.022   0.140 

Sau đó, có tốc độ, vì tôi làm việc trong HFT, cả R và Python đều không thể được sử dụng trong sản xuất. Nhưng gói RCPP cho phép bạn viết mã C ++ hiệu quả và tích hợp nó vào R tầm thường (theo nghĩa đen là thêm 2 dòng). Tôi nghi ngờ R đang mờ dần, với số lượng gói mới được tạo mỗi ngày và động lực mà ngôn ngữ có ...

Chỉnh sửa 2018-07

Một vài năm sau tôi ngạc nhiên bởi cách hệ sinh thái R đã phát triển. Đối với tính toán trong bộ nhớ, bạn có được các công cụ chưa từng có, từ FST để đọc/ghi nhị phân nhanh, nĩa hoặc song song cụm trong một lớp lót. Tích hợp C ++ là cực kỳ dễ dàng với RCPP. Bạn nhận được đồ họa tương tác với các tác phẩm kinh điển như các tính năng âm mưu, điên rồ như ggplotly (chỉ làm cho GGPLOT2 tương tác của bạn). Để thử Python với gấu trúc, tôi thực sự không hiểu làm thế nào thậm chí có thể có một trận đấu. Cú pháp là cồng kềnh và hiệu suất kém, tôi phải quá quen với tôi đoán. Một điều khác thực sự thiếu trong Python là lập trình xả rác, không có gì gần với Rmarkdown (điều tốt nhất tôi có thể tìm thấy ở Python là Jupyter nhưng điều đó thậm chí còn đến gần). Với tất cả sự ồn ào xung quanh cuộc chiến tranh Langage R vs Python, tôi nhận ra rằng đại đa số mọi người chỉ đơn giản là không hiểu biết, họ không biết dữ liệu nào. Nó không liên quan gì đến dữ liệu. Hoàn toàn hỗ trợ Tensorflow và Keras .... Để kết luận, tôi nghĩ rằng cả hai công cụ đều có thể làm mọi thứ và có vẻ như Python Langage có PR rất tốt ...

Đã trả lời ngày 28 tháng 5 năm 2015 lúc 19:55May 28, 2015 at 19:55

StatQuantStatquantstatquant

1.2581 Huy hiệu vàng9 Huy hiệu bạc15 Huy hiệu đồng1 gold badge9 silver badges15 bronze badges

$ \ endgroup $

35

$ \ beingroup $

Thay vì những dự đoán hoang dã về tương lai của R/Python trong cộng đồng, ở đây một số sự thật:

Truy vấn sau đây trên StackExchange Data Explorer đếm số lượng câu hỏi có thẻ hoặc . Nếu bạn cuộn xuống một trong ba trang web được cung cấp bên dưới, bạn có thể thấy biểu đồ với dữ liệu hàng tháng. Bạn cũng có thể dễ dàng chạy truy vấn này trên cơ sở dữ liệu cho các trang web khác (chỉ cần truy cập "chuyển đổi trang web" ngay bên dưới truy vấn).

Số liệu thống kê http://data.stackexchange.com/stats/query/350129/r-versus-python-gags#graph

Stack http://data.stackexchange.com/stackoverflow/query/350129/r-versus-python-gags#graph

Quant http://data.stackexchange.com/quant/query/350129/r-versus-python-gags#graph

Kết quả:

  • Nói một cách tuyệt đối, R có nhiều lượt truy cập hơn cho cả stats.stackexchange.comquant.stackexchange.com (sau này có rất ít điểm dữ liệu). Python có nhiều lượt truy cập hơn cho stackoverflow.com.

  • Theo thuật ngữ tương đối, khoảng cách giữa R và Python đang đóng lại cho stackoverflow.com (tỷ lệ khoảng 1 đến 3 tại thời điểm này). Tỷ lệ giữa các thẻ R và Python trên stats.stackexchange.com ít nhiều ổn định kể từ giữa/cuối năm 2013 (khoảng một yếu tố 10 hoặc một chút ở trên).

Tôi thực sự nghĩ rằng các số liệu thống kê thẻ trong vũ trụ Stackexchange là một chỉ số tốt về lợi ích hiện tại trong một ngôn ngữ lập trình cụ thể - có lẽ thậm chí còn nhiều hơn đối với sự phổ biến trong tương lai của nó.

Tất cả trong tất cả, tôi tự tin rằng dữ liệu hiện tại tạo ra một trường hợp mạnh mẽ chống lại giả thuyết của Matt Wolf rằng "R có thể bị lỗi thời trong 3-4 năm". ;)


Cập nhật: Vì vậy, bây giờ đã 6 tháng kể từ câu trả lời ban đầu của tôi. Chúng tôi vẫn phải đợi thêm 2,5-3,5 năm nữa để chắc chắn xem R có trở nên lỗi thời hay không. :) Trong khi đó, một sự bổ sung nhanh chóng do nhận xét của Matt Wolf. Dưới đây là các biến thể của các truy vấn trên cung cấp cho bạn các tỷ lệ thẻ (đó là những gì tôi đã đề cập trong điểm thứ hai của câu trả lời của tôi). Tất cả các tỷ lệ là thẻ Python chia cho các thẻ R.

số liệu thống kê

http://data.stackexchange.com/stats/query/421036/r-versus-python-tags-quotient-py-r#graph

Tôi không thấy một xu hướng rõ ràng ở đây. Tỷ lệ PY/R là khoảng 0,07 (mặc dù đã tăng lên 0,095 vào tháng 11). Kể từ giữa năm 2013, tỷ lệ thay đổi từ 0,04 đến 0,11. Vì vậy, tôi sẽ gọi nó tương đối ổn định.

VÌ THẾ

http://data.stackexchange.com/stackoverflow/query/421032/r-versus-python-tags-quotient-py-r#graph

Thực sự có một xu hướng ngắn hạn có lợi cho Python kể từ ngày 15 tháng 7 (tỷ lệ PY/R đã tăng từ 3,1 đến 3,5). Vì vậy, tuyên bố rằng "R đang thu hẹp khoảng cách tỷ lệ PY/R" có thể được gọi là lỗi thời vào lúc này.

Quan

http://data.stackexchange.com/quant/query/421042/r-versus-python-tags-quotient-py-r#graph

Vẫn còn rất ồn ào. Python dường như đã bắt kịp một chút trong vài tháng qua. Nhưng khó có thể nói với dữ liệu nhỏ đó.

Đã trả lời ngày 14 tháng 8 năm 2015 lúc 21:59Aug 14, 2015 at 21:59

cryo111cryo111cryo111

4814 Huy hiệu bạc5 Huy hiệu Đồng4 silver badges5 bronze badges

$ \ endgroup $

8

$ \ beingroup $

Thay vì những dự đoán hoang dã về tương lai của R/Python trong cộng đồng, ở đây một số sự thật:

Truy vấn sau đây trên StackExchange Data Explorer đếm số lượng câu hỏi có thẻ hoặc . Nếu bạn cuộn xuống một trong ba trang web được cung cấp bên dưới, bạn có thể thấy biểu đồ với dữ liệu hàng tháng. Bạn cũng có thể dễ dàng chạy truy vấn này trên cơ sở dữ liệu cho các trang web khác (chỉ cần truy cập "chuyển đổi trang web" ngay bên dưới truy vấn).$\mathbb{P}$ area, with some excursions into $\mathbb{Q}$). I tried Python but it didn't work for me. I think the main reasons I will stick with R are:

  • Số liệu thống kê http://data.stackexchange.com/stats/query/350129/r-versus-python-gags#graph
  • Stack http://data.stackexchange.com/stackoverflow/query/350129/r-versus-python-gags#graph
  • Quant http://data.stackexchange.com/quant/query/350129/r-versus-python-gags#graph
  • Kết quả:

Nói một cách tuyệt đối, R có nhiều lượt truy cập hơn cho cả stats.stackexchange.comquant.stackexchange.com (sau này có rất ít điểm dữ liệu). Python có nhiều lượt truy cập hơn cho stackoverflow.com.

Theo thuật ngữ tương đối, khoảng cách giữa R và Python đang đóng lại cho stackoverflow.com (tỷ lệ khoảng 1 đến 3 tại thời điểm này). Tỷ lệ giữa các thẻ R và Python trên stats.stackexchange.com ít nhiều ổn định kể từ giữa/cuối năm 2013 (khoảng một yếu tố 10 hoặc một chút ở trên).
I also wrote a blog post with additional points about why R is better suited for data science than Python: http://blog.ephorie.de/why-r-for-data-science-and-not-python

Tôi thực sự nghĩ rằng các số liệu thống kê thẻ trong vũ trụ Stackexchange là một chỉ số tốt về lợi ích hiện tại trong một ngôn ngữ lập trình cụ thể - có lẽ thậm chí còn nhiều hơn đối với sự phổ biến trong tương lai của nó.May 19, 2015 at 11:27

Tất cả trong tất cả, tôi tự tin rằng dữ liệu hiện tại tạo ra một trường hợp mạnh mẽ chống lại giả thuyết của Matt Wolf rằng "R có thể bị lỗi thời trong 3-4 năm". ;)vonjd

Cập nhật: Vì vậy, bây giờ đã 6 tháng kể từ câu trả lời ban đầu của tôi. Chúng tôi vẫn phải đợi thêm 2,5-3,5 năm nữa để chắc chắn xem R có trở nên lỗi thời hay không. :) Trong khi đó, một sự bổ sung nhanh chóng do nhận xét của Matt Wolf. Dưới đây là các biến thể của các truy vấn trên cung cấp cho bạn các tỷ lệ thẻ (đó là những gì tôi đã đề cập trong điểm thứ hai của câu trả lời của tôi). Tất cả các tỷ lệ là thẻ Python chia cho các thẻ R.10 gold badges98 silver badges161 bronze badges

$ \ endgroup $

8

$ \ beingroup $

Tôi đã sử dụng cả R và Python với gấu trúc trong một công việc tài chính định lượng chuyên nghiệp để thực hiện cả các dự án quy mô lớn và nhỏ. Tôi thực sự sẽ giới thiệu Python với gấu trúc qua R cho hầu hết các dự án mới trong lĩnh vực này, đặc biệt là trong phân tích chuỗi thời gian.

Mặc dù tôi không tranh chấp vonjd ở chỗ bạn sẽ tìm thấy nhiều thư viện hơn trong R với các thuật toán trên các mép chảy máu của nghiên cứu thống kê, các thư viện trong Python rất mạnh mẽ và được đưa ra trong khu vực đó. Ngoài ra, tôi tìm thấy trong công việc của mình và công việc của các đồng nghiệp rằng chúng tôi đang lấy các thư viện từ kỹ thuật điện, tầm nhìn máy tính, dữ liệu lớn và nhiều hơn nữa. Những người trong các lĩnh vực này chủ yếu có các thư viện trong Python, không phải R.

Tuy nhiên, lợi thế chính của Python so với R trong lĩnh vực này là quy trình làm việc. Quy trình làm việc với R có xu hướng là bạn đã sử dụng Perl/Python để làm sạch dữ liệu, cơ sở dữ liệu chuẩn bị vì R quá chậm chạp đối với các bộ dữ liệu phức tạp lớn mặc dù điều này đang trở nên tốt hơn. Sau đó, bạn xây dựng mô hình thống kê trong R tận dụng các thư viện của nó. Sau đó, mô hình R đã được viết lại trong C cho tốc độ, điều khiển, giao diện, song song hóa và xử lý lỗi để sản xuất.

Python có thể xử lý quy trình làm việc đầy đủ này bắt đầu để kết thúc. Tất cả các bước kết nối giữa các dự án nghiên cứu chính là mạnh mẽ hơn nhiều và rất nhiều thời gian được lưu trong sự phát triển khi sử dụng cùng một ngôn ngữ trong suốt. Ngoài ra, với Pandas, phần thậm chí phần nghiên cứu cốt lõi và xử lý dữ liệu giờ đây dễ dàng hơn và sạch hơn theo quan điểm của tôi.

Nói chung, nếu bạn chỉ tập trung vào nghiên cứu chuỗi thời gian khai thác/khai thác dữ liệu tiên tiến thì R và Python với gấu trúc có thể hoán đổi cho nhau ít nhất là cho đến nay. Tuy nhiên, có vẻ như từ câu hỏi của bạn rằng bạn cũng đang lo lắng về sự kết nối và kiến ​​trúc cho Python đó là vượt trội hơn nhiều.

Chỉnh sửa cho năm 2018: Thật đáng kinh ngạc khi nhận được dữ liệu trong Python ngày nay dễ dàng hơn bao nhiêu so với khi tôi lần đầu tiên viết bài này. Hãy thử Anaconda cho những người muốn kiểm tra Python/Pandas mà không có bất kỳ sự ồn ào nào.

Đã trả lời ngày 20 tháng 5 năm 2015 lúc 21:08May 20, 2015 at 21:08

Rhaskettrhaskettrhaskett

1.5611 Huy hiệu vàng9 Huy hiệu bạc20 Huy hiệu đồng 201 gold badge9 silver badges20 bronze badges

$ \ endgroup $

4

$ \ beingroup $

Tôi đã sử dụng cả R và Python với gấu trúc trong một công việc tài chính định lượng chuyên nghiệp để thực hiện cả các dự án quy mô lớn và nhỏ. Tôi thực sự sẽ giới thiệu Python với gấu trúc qua R cho hầu hết các dự án mới trong lĩnh vực này, đặc biệt là trong phân tích chuỗi thời gian.

  1. Mặc dù tôi không tranh chấp vonjd ở chỗ bạn sẽ tìm thấy nhiều thư viện hơn trong R với các thuật toán trên các mép chảy máu của nghiên cứu thống kê, các thư viện trong Python rất mạnh mẽ và được đưa ra trong khu vực đó. Ngoài ra, tôi tìm thấy trong công việc của mình và công việc của các đồng nghiệp rằng chúng tôi đang lấy các thư viện từ kỹ thuật điện, tầm nhìn máy tính, dữ liệu lớn và nhiều hơn nữa. Những người trong các lĩnh vực này chủ yếu có các thư viện trong Python, không phải R.

  2. Tuy nhiên, lợi thế chính của Python so với R trong lĩnh vực này là quy trình làm việc. Quy trình làm việc với R có xu hướng là bạn đã sử dụng Perl/Python để làm sạch dữ liệu, cơ sở dữ liệu chuẩn bị vì R quá chậm chạp đối với các bộ dữ liệu phức tạp lớn mặc dù điều này đang trở nên tốt hơn. Sau đó, bạn xây dựng mô hình thống kê trong R tận dụng các thư viện của nó. Sau đó, mô hình R đã được viết lại trong C cho tốc độ, điều khiển, giao diện, song song hóa và xử lý lỗi để sản xuất.

Python có thể xử lý quy trình làm việc đầy đủ này bắt đầu để kết thúc. Tất cả các bước kết nối giữa các dự án nghiên cứu chính là mạnh mẽ hơn nhiều và rất nhiều thời gian được lưu trong sự phát triển khi sử dụng cùng một ngôn ngữ trong suốt. Ngoài ra, với Pandas, phần thậm chí phần nghiên cứu cốt lõi và xử lý dữ liệu giờ đây dễ dàng hơn và sạch hơn theo quan điểm của tôi.

Nói chung, nếu bạn chỉ tập trung vào nghiên cứu chuỗi thời gian khai thác/khai thác dữ liệu tiên tiến thì R và Python với gấu trúc có thể hoán đổi cho nhau ít nhất là cho đến nay. Tuy nhiên, có vẻ như từ câu hỏi của bạn rằng bạn cũng đang lo lắng về sự kết nối và kiến ​​trúc cho Python đó là vượt trội hơn nhiều.

Chỉnh sửa cho năm 2018: Thật đáng kinh ngạc khi nhận được dữ liệu trong Python ngày nay dễ dàng hơn bao nhiêu so với khi tôi lần đầu tiên viết bài này. Hãy thử Anaconda cho những người muốn kiểm tra Python/Pandas mà không có bất kỳ sự ồn ào nào.

Đã trả lời ngày 20 tháng 5 năm 2015 lúc 21:08

Rhaskettrhaskett

1.5611 Huy hiệu vàng9 Huy hiệu bạc20 Huy hiệu đồng 20

Để phân tích dữ liệu, đặc biệt đối với dự án phân tích dữ liệu lớn, hầu hết các quỹ phòng hộ số lượng hàng đầu và rất nhiều ngân hàng đang sử dụng Python (qua R) vì một vài lý do nhưng nhiều lý do vẫn có các bit và phần R cho các gói cụ thể hoặc các chức năng (tôi làm việc tại một ngân hàng và giao diện với khá nhiều quỹ phòng hộ số lượng về phân tích dữ liệu):

Python 2 trước đó đã từng có nhiều vấn đề tương thích ngược, nhưng Python 3 ổn định hơn giữa các phiên bản. Ngay cả các phiên bản gấu trúc vì 0,13 cũng rất ổn định giữa các phiên bản. Không ai muốn sử dụng một ngôn ngữ mà họ phải xem lại và viết lại các mã quan trọng đôi khi trong tương lai.

Mọi người cần cùng một mã để chạy trên cả Linux và Windows. Cài đặt, biên dịch các gói trong Python có thể là một siêu đau, cho dù là Linux hay Windows. Rất nhiều người không muốn thực hiện bất kỳ dự án mới nào trong Python 2 vì đôi khi trong tương lai, người ta sẽ cần phải chuyển đến Python 3 và họ bị mắc kẹt trong một thời gian dài. Cũng trong một thời gian, Python 3 chỉ có sẵn với Winpython Distro và Winpython chỉ làm việc trên Windows. Anaconda, nơi đang dẫn đầu Python Disto cho Linux (& Mac), đã đưa ra sự hỗ trợ của Python 3 vào năm 2014, sau đó đã gây ra một cuộc di cư lớn.

Tôi có các dự án trong R mất 4 giờ để chạy mỗi ngày (qua đêm). Bây giờ, trong Python, họ mất tổng cộng 20 phút (với ít sử dụng mã Cython hơn nhiều so với mã RCPP trong R). Đó là sự khác biệt tốc độ cho bạn.

Để trả lời câu hỏi của bạn:

  • Có được, lưu trữ, duy trì, đọc, chuỗi thời gian sạch sẽ: Python tốt hơn

  • Thực hiện thống kê cơ bản về chuỗi thời gian, các mô hình thống kê nâng cao như phân tích hồi quy đa biến, v.v.: Cả Python và R

  • Thực hiện các tính toán toán học (biến đổi Fourier, bộ giải PDE, PCA) trực quan hóa dữ liệu (tĩnh và động): cả Python và R

    • Định giá các dẫn xuất (ứng dụng các mô hình giá như mô hình lãi suất): cả Python và R

    • kết nối kết nối (với excel, máy chủ, ui): Python tốt hơn

Đã trả lời ngày 24 tháng 5 năm 2015 lúc 6:32May 24, 2015 at 6:32

udayudayuday

7823 Huy hiệu bạc9 Huy hiệu Đồng3 silver badges9 bronze badges

$ \ endgroup $

5

$ \ beingroup $

Đối với các nhiệm vụ được liệt kê, cả Python và R đều hoạt động rất tốt. Có một số gói trong Python không phải trong R và ngược lại. Giải pháp của tôi cho điều này là chỉ cần gọi R từ Python. Điều này cho phép tốt nhất của cả hai thế giới.

Nó cũng quan trọng cần lưu ý rằng tôi không viết bất kỳ mã R nào ngoài việc gọi thư viện R từ Python.

Gọi Python từ R cũng không hoạt động như nhau trên tất cả các hệ điều hành chính.

Đã trả lời ngày 24 tháng 5 năm 2015 lúc 12:52May 24, 2015 at 12:52

PycthonpycthonpyCthon

2.0692 Huy hiệu vàng18 Huy hiệu bạc35 Huy hiệu Đồng2 gold badges18 silver badges35 bronze badges

$ \ endgroup $

$ \ beingroup $

Đối với các nhiệm vụ được liệt kê, cả Python và R đều hoạt động rất tốt. Có một số gói trong Python không phải trong R và ngược lại. Giải pháp của tôi cho điều này là chỉ cần gọi R từ Python. Điều này cho phép tốt nhất của cả hai thế giới.

Nó cũng quan trọng cần lưu ý rằng tôi không viết bất kỳ mã R nào ngoài việc gọi thư viện R từ Python.

Gọi Python từ R cũng không hoạt động như nhau trên tất cả các hệ điều hành chính.

  1. Đã trả lời ngày 24 tháng 5 năm 2015 lúc 12:52
  2. Pycthonpycthon
  3. 2.0692 Huy hiệu vàng18 Huy hiệu bạc35 Huy hiệu Đồng
  4. Ngoài ra trong trường tần số / tần số trung bình cao ở đây.
  5. Tôi đã nhận được sự đồng thuận "hỗn hợp" liên quan đến việc sử dụng R và tỷ lệ lưu hành của nó trong lĩnh vực này (cụ thể là HFT). Nói chuyện với một người làm việc trong ngành công nghiệp tùy chọn vốn chủ sở hữu tại một công ty độc quyền tương đối nhỏ ở San Francisco, tôi được cho biết: "R là một ngôn ngữ di sản".
  6. Tuy nhiên, nói chuyện với một người trước đây đang lãnh đạo một nhóm HFT tại Goldman Sachs, tôi được cho biết đó vẫn là ngôn ngữ tốt nhất để phân tích chuỗi thời gian, thống kê và đặc biệt là các dự án nhạy cảm về độ trễ. Đối với các thư viện, những điều sau đây đã được đề cập:

Quantmod (xem Quantmod)

Caret (xem CARET)

Sở thú (xem sở thú)Jun 11, 2018 at 19:55

Hướng dẫn python vs r for quantitative finance - python vs r cho tài chính định lượng

XTS (xem XTS)Theodore

HighFrequency (xem HighFrequency: Công cụ phân tích dữ liệu tần số cao)1 gold badge15 silver badges35 bronze badges

$ \ endgroup $

3

$ \ beingroup $

Đối với các nhiệm vụ được liệt kê, cả Python và R đều hoạt động rất tốt. Có một số gói trong Python không phải trong R và ngược lại. Giải pháp của tôi cho điều này là chỉ cần gọi R từ Python. Điều này cho phép tốt nhất của cả hai thế giới.

Nó cũng quan trọng cần lưu ý rằng tôi không viết bất kỳ mã R nào ngoài việc gọi thư viện R từ Python.Aug 13, 2015 at 3:14

Gọi Python từ R cũng không hoạt động như nhau trên tất cả các hệ điều hành chính.wsw

Đã trả lời ngày 24 tháng 5 năm 2015 lúc 12:5210 silver badges9 bronze badges

$ \ endgroup $

1

R hay Python có tốt hơn cho tài chính không?

Đối với khoa học dữ liệu thuần túy, r vẫn có một lợi thế nhẹ so với Python, mặc dù khoảng cách đã thu hẹp đáng kể. Tuy nhiên, các ứng dụng rộng hơn của Python làm cho nó trở thành lựa chọn toàn diện tốt hơn. Nếu bạn đang bắt đầu sự nghiệp thì việc học Python cũng sẽ cung cấp cho bạn nhiều lựa chọn hơn trong tương lai.R still has a slight edge over Python, although the gap has closed significantly. Nevertheless, the wider applications of Python make it the better all-round choice. If you're at the start of your career then learning Python will also give you more options in the future.

Quants có sử dụng R hay Python không?

Python, Matlab và R cả ba chủ yếu được sử dụng để tạo mẫu các mô hình lượng tử, đặc biệt là trong các quỹ phòng hộ và các nhóm giao dịch lượng tử trong các ngân hàng.Các nhà giao dịch/nhà nghiên cứu lượng tử viết mã nguyên mẫu của họ bằng các ngôn ngữ này. All three are mainly used for prototyping quant models, especially in hedge funds and quant trading groups within banks. Quant traders/researchers write their prototype code in these languages.

Python có được sử dụng trong tài chính định lượng không?

Ngôn ngữ Python được sử dụng rộng rãi trong các giải pháp tài chính định lượng phức tạp trong đó các bộ dữ liệu lớn được xử lý và phân tích.Các thư viện nguồn mở về vấn đề này rất hữu ích giúp đơn giản hóa quy trình và giúp trực quan hóa dữ liệu. where large datasets are processed and analyzed. Open-source libraries in this regard are much useful that simplifies the process and helps in data visualization.

R có được sử dụng trong tài chính số lượng không?

Sự cần thiết của R Có rất nhiều gói thống kê có thể được sử dụng để giải quyết các vấn đề trong tài chính định lượng.Nhưng R không phải là một gói thống kê nhưng nó là một ngôn ngữ.R là một ngôn ngữ linh hoạt và mạnh mẽ để đạt được phân tích chất lượng cao.R is not a statistical package but it is a language. R is a flexible and powerful language for achieving high-quality analysis.