Hướng dẫn stock market prediction using svm python github - dự đoán thị trường chứng khoán bằng svm python github

Dự đoán cổ phiếu SVM

Hỗ trợ dự đoán thị trường chứng khoán máy vector

Hướng dẫn stock market prediction using svm python github - dự đoán thị trường chứng khoán bằng svm python github

Để biết thêm thông tin về các mô hình SVM, bạn có thể đọc bài đăng tuyệt vời này của Savan Patel trên Medium.com. Liên kết để tìm hiểu thêm: https://medium.com/machine-learning-101/ch CHƯƠNG-2-SVM-SUPPORT-Vector-Machine-Theory-F0812effc72

Cổ phiếu được một số người tin rằng có các mẫu có thể được xác định với việc học máy lặp lại theo thời gian khi phù hợp với một vector. Tôi đã sử dụng một vectơ hỗ trợ để dự báo giá cổ phiếu đã điều chỉnh giá gần trong tương lai cho một thị trường mới nổi

Tôi đã sử dụng một cổ phiếu có tên là ISCTR.IS trong BIST 100. Dữ liệu tôi đã sử dụng được lấy từ Yahoo Finance

Bất kỳ cổ phiếu nào theo định dạng dữ liệu tương tự cũng có thể được sử dụng để thay thế cổ phiếu được sử dụng trong bản demo

Đây là liên kết đến Yahoo Finance nếu bạn muốn tải xuống dữ liệu: https://finance.yahoo.com/quote/isctr.is?p=isctr.is&.tsrc=fin-srch

Các bước

  • Nhập vào phụ thuộc
  • Tải dữ liệu các tính năng đào tạo
  • Biến dữ liệu thành khung dữ liệu gấu trúc và hiển thị
  • Thay thế các chuỗi trong cột Thal bằng các số tương ứng
  • Biến các tính năng thành mảng numpy
  • Kiểm tra hình dạng
  • Chia mô hình
  • Xây dựng mô hình
  • Biên dịch
  • Phù hợp và đào tạo
  • Hãy đánh giá mô hình của chúng tôi với chức năng tổn thất và độ chính xác

Phụ thuộc

  • Numpy
  • Matplotlib (nếu bạn muốn hiển thị xu hướng, tôi đặt một # để giúp với tốc độ xử lý)
  • Scikit học
  • Keras
  • Tensorflow
  • môn Toán
  • Gấu trúc

Stock-Forecast

Cùng với việc so sánh các thuật toán học máy khác nhau

hướng dẫn cài đặt

Các gói sau cần được cài đặt trước khi Numpy, matplotlib, Scikit learn (hướng dẫn chi tiết trong các thư mục riêng lẻ)

Nội dung của Rep / Danh sách các tệp

Hồi quy tuyến tính - Sử dụng LR để dự đoán giá cổ phiếu (để so sánh) SVM - Sử dụng SVM trên cùng một dữ liệu để dự đoán bộ dữ liệu giá cổ phiếu - Mã để lấy dữ liệu bằng CSV, Pandas, v.v.

mô tả dự án

Đây là một công cụ phân tích dữ liệu dựa trên Python (chỉ dành cho dự báo chứng khoán) được phát triển dưới dạng năm cuối B.E. Dự án tại Viện Công nghệ Don Bosco, Batch 2017.

Hướng dẫn dự án: Giáo sư Anagha Shastri Các thành viên nhóm dự án: Anjali Singh, Divya Kumar, Kevin John, Nelson Morris.

Dự đoán cổ phiếu

Mô hình phân loại để dự đoán xu hướng thị trường chứng khoán, dựa trên các kỹ thuật học máy, chẳng hạn như cây cực kỳ ngẫu nhiên, K-MEAN, máy vector hỗ trợ và xác thực chéo K-Fold.

Mã hóa được trình bày như một phần của Dự án Capstone trong Kỹ thuật tính toán của Đại học Liên bang de Juiz de Fora

Trình bày vấn đề & nbsp; & nbsp; | & nbsp; & nbsp; Phụ thuộc & nbsp; & nbsp; | & nbsp; & nbsp; Cách chạy & nbsp; & nbsp; | & nbsp; & nbsp; Công nghệ & nbsp; & nbsp; | & nbsp; & nbsp; Tài liệu tham khảo & nbsp; & nbsp; | & nbsp; & nbsp; Tín dụng & nbsp; & nbsp;

Trình bày vấn đề

Dự án này nhằm mục đích chứng minh một ứng dụng của các phương pháp học máy trong việc dự đoán dao động của thị trường chứng khoán. Các kỹ thuật khác nhau sẽ được sử dụng để tạo ra một mô hình mạnh mẽ hơn và cải thiện độ chính xác dự đoán.

Đường ống và mô tả ngắn về các phương pháp được sử dụng như sau:

  1. Dữ liệu có được: Có được giá trị lịch sử cổ phiếu bằng cách sử dụng máy bay pandas. Acquire stock history value using pandas-datareader.

  2. Chuẩn bị dữ liệu: Loại bỏ dữ liệu thiếu và không cần thiết bằng gấu trúc. Remove missing and unecessary data using pandas.

  3. Áp dụng các chỉ số: Áp dụng các chỉ số tài chính trong dữ liệu được thu thập bằng gấu trúc. Apply financial indicators in data collected using pandas.

  4. Lựa chọn tính năng: Cây cực kỳ ngẫu nhiên

    Phương pháp được giám sát được sử dụng để giải quyết các vấn đề phân loại và hồi quy. Đó là một biến thể của các khu rừng ngẫu nhiên cổ điển, bổ sung thêm ngẫu nhiên trong phân vùng nút và lựa chọn các bộ đào tạo. Những thay đổi này làm giảm sự thiên vị và phương sai của mô hình, đề xuất để giảm bớt các vấn đề về thiếu hụt và quá mức, tương ứng.

    Trong vấn đề hiện tại, phương pháp này đã được sử dụng làm bộ chọn tính năng, đo lường tầm quan trọng của từng chỉ số tài chính trong dự đoán.

  5. Phân cụm: K-MEANS

    Phương pháp không được sử dụng trong phân vùng hoặc phân cụm, tổ chức các yếu tố của một tập hợp thành các nhóm (cụm) để các yếu tố giống nhau. Số lượng cụm phải được xác định ban đầu và điều này trở thành điểm bắt đầu của phương thức.

    Phương pháp này được sử dụng để phân cụm dữ liệu và giảm số lượng vectơ hỗ trợ trong bước tiếp theo.

  6. Phân loại: Máy hỗ trợ máy vector

    Phương pháp được giám sát được sử dụng để giải quyết các vấn đề phân loại và hồi quy với dữ liệu tuyến tính hoặc phi tuyến. Các phương pháp này nhằm mục đích tìm thấy siêu phẳng ngăn cách các mẫu đào tạo của vấn đề trong các lớp tương ứng của chúng.

    Đây là bước chính của đường ống này, nơi dữ liệu được phân loại là viết tắt của dao động cổ phiếu hướng lên hoặc xuống.

  7. Điều chỉnh tham số: Xác thực chéo K gấp K

    Cuối cùng, chúng ta cần một phương pháp để đánh giá các tham số của mô hình đã chọn và cho biết sự kết hợp tốt nhất của chúng là gì.

    Phương pháp này phân chia ngẫu nhiên tập dữ liệu trong các tập hợp K. Trong mỗi lần lặp, một bộ được sử dụng để kiểm tra và các bộ K-1 còn lại được sử dụng để đào tạo, có thể đo độ chính xác và điều chỉnh các tham số.

Phụ thuộc

Ngoài ra, tất nhiên, Python, bạn sẽ cần thư viện Numpy cho các hoạt động số, thư viện matplotlib để vẽ, gấu trúc và pandas-datareader để đối phó với các bộ dữ liệu và scikit-e-learn để thực hiện chính thuật toán học máy.

Bạn có thể cài đặt tất cả các phụ thuộc với lệnh sau:

pip3 install numpy matplotlib pandas pandas-datareader scikit-learn

🏃 Cách chạy

Sau khi cài đặt phụ thuộc, hãy mở thiết bị đầu cuối của bạn trong thư mục bạn muốn sao chép dự án:

git clone https://github.com/LorranSutter/PredictStock-SVM.git

Đầu tiên, bạn sẽ cần phải có được dữ liệu cổ phiếu. Lệnh sau sử dụng tệp db/nasdaq.csv làm tham chiếu để liệt kê tất cả các cổ phiếu để lấy dữ liệu. Tuy nhiên, nếu bạn không muốn lấy dữ liệu từ tất cả các cổ phiếu có sẵn, chỉ cần thay đổi tệp xóa các cổ phiếu không mong muốn.

Sau khi có được dữ liệu cổ phiếu, kết quả sẽ được lưu trữ trong thư mục DB/Stocks. Sau đó, bạn có thể chạy mã chính thay đổi trình đánh dấu biến bên trong mã với trình đánh dấu mong muốn.

Công nghệ

  • Python-Ngôn ngữ lập trình đa năng, được giải thích, cấp cao
  • Pandas - Công cụ phân tích dữ liệu và thao tác
  • Pandas DataReader - Truy cập dữ liệu cho gấu trúc
  • Sklearn - Thư viện học máy
  • Numpy-Gói xử lý mảng đa năng
  • Matplotlib - Thư viện âm mưu cho Python

Tài liệu tham khảo chính

  • Vo, v .; Luo, J .; Vo, B. Phân tích xu hướng chuỗi thời gian dựa trên K-MEANS và MÁY Vector hỗ trợ. câu 35, tr. 111 bóng127, 1 2016
  • Lee, M.-C. Sử dụng máy vector hỗ trợ với phương pháp lựa chọn tính năng lai cho dự đoán xu hướng chứng khoán. Hệ thống chuyên gia với các ứng dụng, câu 36, n. 8, p. 10896-10904, 2009. ISSN 0957-4174
  • Xu, Y .; Li, z .; Luo, L. Một nghiên cứu về lựa chọn tính năng để dự đoán xu hướng của giá giao dịch chứng khoán. Tháng 6 năm 2013
  • Lima, M. L. UM Modelo Para Predição de Bolsa de Valores Baseado Em Mineração de Opinião, 2016. Luận án

Tín dụng

Cảm ơn các chỉ số thực hiện của Bruno Franca pandasimpl.py