Hướng dẫn stock market prediction using svm python github - dự đoán thị trường chứng khoán bằng svm python github
Hỗ trợ dự đoán thị trường chứng khoán máy vector Để biết thêm thông tin về các mô hình SVM, bạn có thể đọc bài đăng tuyệt vời này của Savan Patel trên Medium.com. Liên kết để tìm hiểu thêm: https://medium.com/machine-learning-101/ch CHƯƠNG-2-SVM-SUPPORT-Vector-Machine-Theory-F0812effc72 Cổ phiếu được một số người tin rằng có các mẫu có thể được xác định với việc học máy lặp lại theo thời gian khi phù hợp với một vector. Tôi đã sử dụng một vectơ hỗ trợ để dự báo giá cổ phiếu đã điều chỉnh giá gần trong tương lai cho một thị trường mới nổi Tôi đã sử dụng một cổ phiếu có tên là ISCTR.IS trong BIST 100. Dữ liệu tôi đã sử dụng được lấy từ Yahoo Finance Bất kỳ cổ phiếu nào theo định dạng dữ liệu tương tự cũng có thể được sử dụng để thay thế cổ phiếu được sử dụng trong bản demo Đây là liên kết đến Yahoo Finance nếu bạn muốn tải xuống dữ liệu: https://finance.yahoo.com/quote/isctr.is?p=isctr.is&.tsrc=fin-srch Các bước
Phụ thuộc
Cùng với việc so sánh các thuật toán học máy khác nhau Các gói sau cần được cài đặt trước khi Numpy, matplotlib, Scikit learn (hướng dẫn chi tiết trong các thư mục riêng lẻ) Hồi quy tuyến tính - Sử dụng LR để dự đoán giá cổ phiếu (để so sánh) SVM - Sử dụng SVM trên cùng một dữ liệu để dự đoán bộ dữ liệu giá cổ phiếu - Mã để lấy dữ liệu bằng CSV, Pandas, v.v. mô tả dự ánĐây là một công cụ phân tích dữ liệu dựa trên Python (chỉ dành cho dự báo chứng khoán) được phát triển dưới dạng năm cuối B.E. Dự án tại Viện Công nghệ Don Bosco, Batch 2017. Hướng dẫn dự án: Giáo sư Anagha Shastri Các thành viên nhóm dự án: Anjali Singh, Divya Kumar, Kevin John, Nelson Morris. Mô hình phân loại để dự đoán xu hướng thị trường chứng khoán, dựa trên các kỹ thuật học máy, chẳng hạn như cây cực kỳ ngẫu nhiên, K-MEAN, máy vector hỗ trợ và xác thực chéo K-Fold. Mã hóa được trình bày như một phần của Dự án Capstone trong Kỹ thuật tính toán của Đại học Liên bang de Juiz de Fora Trình bày vấn đề & nbsp; & nbsp; | & nbsp; & nbsp; Phụ thuộc & nbsp; & nbsp; | & nbsp; & nbsp; Cách chạy & nbsp; & nbsp; | & nbsp; & nbsp; Công nghệ & nbsp; & nbsp; | & nbsp; & nbsp; Tài liệu tham khảo & nbsp; & nbsp; | & nbsp; & nbsp; Tín dụng & nbsp; & nbsp; Dự án này nhằm mục đích chứng minh một ứng dụng của các phương pháp học máy trong việc dự đoán dao động của thị trường chứng khoán. Các kỹ thuật khác nhau sẽ được sử dụng để tạo ra một mô hình mạnh mẽ hơn và cải thiện độ chính xác dự đoán. Đường ống và mô tả ngắn về các phương pháp được sử dụng như sau: Dữ liệu có được: Có được giá trị lịch sử cổ phiếu bằng cách sử dụng máy bay pandas. Acquire stock history value using pandas-datareader. Chuẩn bị dữ liệu: Loại bỏ dữ liệu thiếu và không cần thiết bằng gấu trúc. Remove missing and unecessary data using pandas. Áp dụng các chỉ số: Áp dụng các chỉ số tài chính trong dữ liệu được thu thập bằng gấu trúc. Apply financial indicators in data collected using pandas. Lựa chọn tính năng: Cây cực kỳ ngẫu nhiên Phương pháp được giám sát được sử dụng để giải quyết các vấn đề phân loại và hồi quy. Đó là một biến thể của các khu rừng ngẫu nhiên cổ điển, bổ sung thêm ngẫu nhiên trong phân vùng nút và lựa chọn các bộ đào tạo. Những thay đổi này làm giảm sự thiên vị và phương sai của mô hình, đề xuất để giảm bớt các vấn đề về thiếu hụt và quá mức, tương ứng. Trong vấn đề hiện tại, phương pháp này đã được sử dụng làm bộ chọn tính năng, đo lường tầm quan trọng của từng chỉ số tài chính trong dự đoán. Phân cụm: K-MEANS Phương pháp không được sử dụng trong phân vùng hoặc phân cụm, tổ chức các yếu tố của một tập hợp thành các nhóm (cụm) để các yếu tố giống nhau. Số lượng cụm phải được xác định ban đầu và điều này trở thành điểm bắt đầu của phương thức. Phương pháp này được sử dụng để phân cụm dữ liệu và giảm số lượng vectơ hỗ trợ trong bước tiếp theo. Phân loại: Máy hỗ trợ máy vector Phương pháp được giám sát được sử dụng để giải quyết các vấn đề phân loại và hồi quy với dữ liệu tuyến tính hoặc phi tuyến. Các phương pháp này nhằm mục đích tìm thấy siêu phẳng ngăn cách các mẫu đào tạo của vấn đề trong các lớp tương ứng của chúng. Đây là bước chính của đường ống này, nơi dữ liệu được phân loại là viết tắt của dao động cổ phiếu hướng lên hoặc xuống. Điều chỉnh tham số: Xác thực chéo K gấp K Cuối cùng, chúng ta cần một phương pháp để đánh giá các tham số của mô hình đã chọn và cho biết sự kết hợp tốt nhất của chúng là gì. Phương pháp này phân chia ngẫu nhiên tập dữ liệu trong các tập hợp K. Trong mỗi lần lặp, một bộ được sử dụng để kiểm tra và các bộ K-1 còn lại được sử dụng để đào tạo, có thể đo độ chính xác và điều chỉnh các tham số. Phụ thuộcNgoài ra, tất nhiên, Python, bạn sẽ cần thư viện Numpy cho các hoạt động số, thư viện matplotlib để vẽ, gấu trúc và pandas-datareader để đối phó với các bộ dữ liệu và scikit-e-learn để thực hiện chính thuật toán học máy. Bạn có thể cài đặt tất cả các phụ thuộc với lệnh sau: pip3 install numpy matplotlib pandas pandas-datareader scikit-learn 🏃 Cách chạySau khi cài đặt phụ thuộc, hãy mở thiết bị đầu cuối của bạn trong thư mục bạn muốn sao chép dự án: git clone https://github.com/LorranSutter/PredictStock-SVM.git Đầu tiên, bạn sẽ cần phải có được dữ liệu cổ phiếu. Lệnh sau sử dụng tệp db/nasdaq.csv làm tham chiếu để liệt kê tất cả các cổ phiếu để lấy dữ liệu. Tuy nhiên, nếu bạn không muốn lấy dữ liệu từ tất cả các cổ phiếu có sẵn, chỉ cần thay đổi tệp xóa các cổ phiếu không mong muốn. Sau khi có được dữ liệu cổ phiếu, kết quả sẽ được lưu trữ trong thư mục DB/Stocks. Sau đó, bạn có thể chạy mã chính thay đổi trình đánh dấu biến bên trong mã với trình đánh dấu mong muốn. Công nghệ
Tài liệu tham khảo chính
Tín dụngCảm ơn các chỉ số thực hiện của Bruno Franca pandasimpl.py |