Hướng dẫn introduction to machine learning with python oreilly - giới thiệu về học máy với python oreilly

Mô tả cuốn sách

Học máy đã trở thành một phần không thể thiếu của nhiều ứng dụng thương mại và các dự án nghiên cứu, nhưng lĩnh vực này không dành riêng cho các công ty lớn với các nhóm nghiên cứu rộng rãi. Nếu bạn sử dụng Python, ngay cả khi mới bắt đầu, cuốn sách này sẽ dạy bạn những cách thiết thực để xây dựng các giải pháp học máy của riêng bạn. Với tất cả các dữ liệu có sẵn ngày hôm nay, các ứng dụng học máy chỉ bị giới hạn bởi trí tưởng tượng của bạn.

Bạn sẽ học các bước cần thiết để tạo ra một ứng dụng học máy thành công với Python và thư viện Scikit-Learn. Các tác giả Andreas Müller và Sarah Guido tập trung vào các khía cạnh thực tế của việc sử dụng các thuật toán học máy, thay vì toán học đằng sau chúng. Sự quen thuộc với các thư viện Numpy và Matplotlib sẽ giúp bạn nhận được nhiều hơn từ cuốn sách này.

Với cuốn sách này, bạn sẽ học:

  • Các khái niệm và ứng dụng cơ bản của học máy
  • Ưu điểm và thiếu sót của thuật toán học máy được sử dụng rộng rãi
  • Cách biểu diễn dữ liệu được xử lý bằng máy học, bao gồm cả các khía cạnh dữ liệu để tập trung vào
  • Các phương pháp nâng cao để đánh giá mô hình và điều chỉnh tham số
  • Khái niệm về đường ống để chuỗi mô hình và đóng gói quy trình làm việc của bạn
  • Phương pháp làm việc với dữ liệu văn bản, bao gồm các kỹ thuật xử lý cụ thể văn bản
  • Đề xuất cải thiện kỹ năng học máy và khoa học dữ liệu của bạn

Bản quyền © 2017 Sarah Guido, Andreas Müller. Đã đăng ký Bản quyền.

In ở Hoa Kỳ.

Được xuất bản bởi O hèReilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472.O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472.

Sách O hèReilly có thể được mua để sử dụng quảng cáo giáo dục, kinh doanh hoặc bán hàng. Phiên bản trực tuyến cũng có sẵn cho hầu hết các tiêu đề [//orilly.com/safari]. Để biết thêm thông tin, liên hệ với bộ phận bán hàng của công ty/tổ chức: 800-998-9938 hoặc..

  • Biên tập viên: Dawn Schanafelt Dawn Schanafelt
  • Biên tập sản xuất: Kristen Brown Kristen Brown
  • Copyeditor: Rachel Head Rachel Head
  • Người đọc thử: Jasmine Kwityn Jasmine Kwityn
  • Chỉ số: Judy McConville Judy McConville
  • Nhà thiết kế nội thất: David Futato David Futato
  • Nhà thiết kế bìa: Karen Montgomery Karen Montgomery
  • Illustrator: Rebecca Demarest Rebecca Demarest
  • Tháng 10 năm 2016: Phiên bản đầu tiên First Edition

Lịch sử sửa đổi cho phiên bản đầu tiên

  • 2016-09-22: Bản phát hành đầu tiên First Release
  • 2017-01-13: Bản phát hành thứ hai Second Release
  • 2017-06-09: Bản phát hành thứ ba Third Release
  • 2018-10-19: Bản phát hành thứ tư Fourth Release

Xem //orilly.com/catalog/errata.csp?isbn=9781449369415 để biết chi tiết phát hành.

Logo O hèReilly là nhãn hiệu đã đăng ký của O hèReilly Media, Inc. Giới thiệu về học máy với Python, hình ảnh bìa và trang phục thương mại liên quan là nhãn hiệu của O KhănReilly Media, Inc.

Mặc dù nhà xuất bản và các tác giả đã sử dụng các nỗ lực đức tin tốt để đảm bảo rằng thông tin và hướng dẫn có trong tác phẩm này là chính xác, nhà xuất bản và các tác giả từ chối mọi trách nhiệm về lỗi hoặc thiếu sót, bao gồm cả ...

Học máy đã trở thành một phần không thể thiếu của nhiều ứng dụng thương mại và các dự án nghiên cứu, nhưng lĩnh vực này không dành riêng cho các công ty lớn với các nhóm nghiên cứu rộng rãi. Nếu bạn sử dụng Python, ngay cả khi mới bắt đầu, cuốn sách này sẽ dạy bạn những cách thiết thực để xây dựng các giải pháp học máy của riêng bạn. Với tất cả các dữ liệu có sẵn ngày hôm nay, các ứng dụng học máy chỉ bị giới hạn bởi trí tưởng tượng của bạn.

Bạn sẽ học các bước cần thiết để tạo ra một ứng dụng học máy thành công với Python và thư viện Scikit-Learn. Các tác giả Andreas Müller và Sarah Guido tập trung vào các khía cạnh thực tế của việc sử dụng các thuật toán học máy, thay vì toán học đằng sau chúng. Sự quen thuộc với các thư viện Numpy và Matplotlib sẽ giúp bạn nhận được nhiều hơn từ cuốn sách này.

Với cuốn sách này, bạn sẽ học:

  • Các khái niệm và ứng dụng cơ bản của học máy
  • Ưu điểm và thiếu sót của thuật toán học máy được sử dụng rộng rãi
  • Cách biểu diễn dữ liệu được xử lý bằng máy học, bao gồm cả các khía cạnh dữ liệu để tập trung vào
  • Các phương pháp nâng cao để đánh giá mô hình và điều chỉnh tham số
  • Khái niệm về đường ống để chuỗi mô hình và đóng gói quy trình làm việc của bạn
  • Phương pháp làm việc với dữ liệu văn bản, bao gồm các kỹ thuật xử lý cụ thể văn bản
  • Đề xuất cải thiện kỹ năng học máy và khoa học dữ liệu của bạn.

Giới thiệu về học máy với Python

Kho lưu trữ này giữ mã cho cuốn sách sắp phát hành "Giới thiệu về học máy với Python" của Andreas Mueller và Sarah Guido. Bạn có thể tìm thấy chi tiết về cuốn sách trên trang web O'Reilly.

Cuốn sách yêu cầu phiên bản ổn định hiện tại của Scikit-Learn, đó là 0,20.0. Hầu hết các cuốn sách cũng có thể được sử dụng với các phiên bản trước của Scikit-learn, mặc dù bạn cần điều chỉnh nhập khẩu cho mọi thứ từ mô-đun model_selection, chủ yếu là cross_val_score, train_test_splitGridSearchCV.

Kho lưu trữ này cung cấp các máy tính xách tay mà từ đó cuốn sách được tạo, cùng với thư viện của các chức năng của người trợ giúp để tạo các số liệu và bộ dữ liệu.

Đối với những người tò mò, bìa mô tả một địa ngục.

Tất cả các bộ dữ liệu được bao gồm trong kho lưu trữ, ngoại trừ bộ dữ liệu ACLIMDB mà bạn có thể tải xuống từ trang của Andrew Maas. Xem cuốn sách để biết chi tiết.

Nếu bạn nhận được ImportError: No module named mglearn, bạn có thể cố gắng cài đặt Mlearn vào môi trường Python của mình bằng lệnh

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
0 trong thiết bị đầu cuối của bạn hoặc
conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
1 trong Notebook Jupyter.

Errata

Xin lưu ý rằng bản in đầu tiên của cuốn sách bị thiếu dòng sau khi liệt kê các bản nhập khẩu giả định:

from IPython.display import display

Vui lòng thêm dòng này nếu bạn thấy lỗi liên quan đến

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
2.

Bản in đầu tiên của cuốn sách đã sử dụng một hàm gọi là

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
3. Điều này đã được đổi tên thành
conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
4 vì sự đổi tên trong Scikit-learn.

Thành lập

Để chạy mã, bạn cần các gói

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
5,
conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
6,
conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
7,
conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
8,
conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz
9 và
pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
0. Một số hình dung của các cây quyết định và cấu trúc mạng lưới thần kinh cũng yêu cầu
pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
1. Chương về xử lý văn bản cũng yêu cầu
pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
2 và
pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
3.

Cách dễ nhất để thiết lập một môi trường là cài đặt Anaconda.

Cài đặt các gói với Conda:

Nếu bạn đã thiết lập môi trường Python và bạn đang sử dụng Trình quản lý gói

pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
4, bạn có thể nhận tất cả các gói bằng cách chạy

conda install numpy scipy scikit-learn matplotlib pandas pillow graphviz python-graphviz

Đối với chương về xử lý văn bản, bạn cũng cần cài đặt

pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
2 và
pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
3:

Cài đặt các gói với PIP

Nếu bạn đã có môi trường Python và đang sử dụng PIP để cài đặt các gói, bạn cần chạy

pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz

Bạn cũng cần cài đặt Graphiz C Library, dễ sử dụng nhất bằng cách sử dụng trình quản lý gói. Nếu bạn đang sử dụng OS X và Homebrew, bạn có thể ____27. Nếu bạn đang ở trên Ubuntu hoặc Debian, bạn có thể ____28. Cài đặt GraphViz trên Windows có thể khó khăn và nên sử dụng Conda / Anaconda. Đối với chương về xử lý văn bản, bạn cũng cần cài đặt

pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
2 và
pip install numpy scipy scikit-learn matplotlib pandas pillow graphviz
3:

Tải xuống mô hình tiếng Anh

Đối với chương xử lý văn bản, bạn cần tải xuống mô hình ngôn ngữ tiếng Anh để sử dụng

python -m spacy download en

Gửi errata

Nếu bạn có Errata cho cuốn sách [E-], vui lòng gửi chúng qua trang web O'Reilly. Bạn có thể gửi các bản sửa lỗi cho mã dưới dạng các yêu cầu kéo ở đây, nhưng tôi đánh giá cao nếu bạn cũng sẽ gửi chúng ở đó, vì kho lưu trữ này không giữ "máy tính xách tay chính".

Bài Viết Liên Quan

Chủ Đề