Ngày nay, Python là một trong những kỹ năng được tìm kiếm nhiều nhất trong thế giới Khoa học dữ liệu và do đó, chúng ta có thể tận dụng sức mạnh này trong Trực quan hóa dữ liệu Tableau của mình. Mặc dù tích hợp không hoàn toàn vượt trội và yêu cầu một số thiết lập ban đầu, nhưng không khó để thiết lập và chạy. Trong bài viết này, chúng tôi sẽ giới thiệu về Python, chỉ cho bạn cách tích hợp Python trong Tableau và quan trọng hơn là để lại cho bạn một ví dụ mà bạn có thể xây dựng trên đó
Ngôn ngữ lập trình Python
Python là một ngôn ngữ lập trình thông dịch, cấp cao, có mục đích chung. Được tạo bởi Guido van Rossum và phát hành lần đầu tiên vào năm 1991, triết lý thiết kế của Python nhấn mạnh khả năng đọc mã với việc sử dụng khoảng trắng đáng chú ý. Cấu trúc ngôn ngữ và cách tiếp cận hướng đối tượng của nó nhằm mục đích giúp các lập trình viên viết mã hợp lý, rõ ràng cho các dự án quy mô lớn và nhỏ
Python đã đạt được rất nhiều sức hút trong thế giới khoa học dữ liệu và hiện có một loạt các thư viện tuyệt vời hỗ trợ các yêu cầu của bạn
LibraryDescripNumPyNumPy là một thư viện dành cho ngôn ngữ lập trình Python, bổ sung hỗ trợ cho các mảng và ma trận lớn, đa chiều, cùng với một bộ sưu tập lớn các hàm toán học cấp cao để hoạt động trên các mảng này. SciPySciPy là một thư viện Python mã nguồn mở và miễn phí được sử dụng cho tính toán khoa học và tính toán kỹ thuật. SciPy chứa các mô-đun để tối ưu hóa, đại số tuyến tính, tích hợp, nội suy, các chức năng đặc biệt, FFT, xử lý tín hiệu và hình ảnh, bộ giải ODE và các nhiệm vụ phổ biến khác trong khoa học và kỹ thuật. PandasPandas là một thư viện phần mềm được viết cho ngôn ngữ lập trình Python để thao tác và phân tích dữ liệu. Cụ thể, nó cung cấp các cấu trúc dữ liệu và hoạt động để thao tác với các bảng số và chuỗi thời gian. Đây là phần mềm miễn phí được phát hành theo giấy phép BSD ba điều khoản. Tên này bắt nguồn từ thuật ngữ "dữ liệu bảng", một thuật ngữ kinh tế lượng cho các tập dữ liệu bao gồm các quan sát trong nhiều khoảng thời gian cho cùng một cá nhân. StatsModelsStatsmodels là gói Python cho phép người dùng khám phá dữ liệu, ước tính các mô hình thống kê và thực hiện các bài kiểm tra thống kê. Một danh sách đầy đủ các thống kê mô tả, kiểm tra thống kê, chức năng vẽ đồ thị và thống kê kết quả có sẵn cho các loại dữ liệu khác nhau và từng công cụ ước tính. Nó bổ sung cho mô-đun thống kê của SciPy. Scikit-LearnScikit-learning [trước đây là scikits. learn] là thư viện máy học phần mềm miễn phí dành cho ngôn ngữ lập trình Python. Nó có các thuật toán phân loại, hồi quy và phân cụm khác nhau bao gồm máy vectơ hỗ trợ, rừng ngẫu nhiên, tăng cường độ dốc, phương tiện k và DBSCAN, đồng thời được thiết kế để tương tác với các thư viện khoa học và số Python NumPy và SciPy. TensorFlowTensorFlow là một thư viện phần mềm mã nguồn mở và miễn phí dành cho luồng dữ liệu và lập trình khả vi trên nhiều tác vụ. Nó là một thư viện toán học tượng trưng và cũng được sử dụng cho các ứng dụng học máy như mạng lưới thần kinh. Nó được sử dụng cho cả nghiên cứu và sản xuất tại Google. NLTKThe Natural Language Toolkit, hay phổ biến hơn là NLTK, là một bộ thư viện và chương trình xử lý ngôn ngữ tự nhiên biểu tượng và thống kê [NLP] cho tiếng Anh được viết bằng ngôn ngữ lập trình Python. Nó được phát triển bởi Steven Bird và Edward Loper tại Khoa Khoa học Máy tính và Thông tin tại Đại học Pennsylvania. NLTK bao gồm các minh họa đồ họa và dữ liệu mẫu. Nó đi kèm với một cuốn sách giải thích các khái niệm cơ bản đằng sau các tác vụ xử lý ngôn ngữ được bộ công cụ hỗ trợ, cùng với một cuốn sách dạy nấu ăn. KerasKeras là một thư viện mạng thần kinh nguồn mở được viết bằng Python. Nó có khả năng chạy trên TensorFlow, Bộ công cụ nhận thức của Microsoft, Theano hoặc PlaidML. Được thiết kế để cho phép thử nghiệm nhanh với các mạng thần kinh sâu, nó tập trung vào tính thân thiện với người dùng, mô-đun và có thể mở rộng. Nó được phát triển như một phần trong nỗ lực nghiên cứu của dự án ONEIROS [Hệ điều hành rô-bốt thông minh thần kinh điện tử kết thúc mở], tác giả và người bảo trì chính của nó là François Chollet, một kỹ sư của Google. Chollet cũng là tác giả của mô hình mạng thần kinh sâu Xception. TheanoTheano là một thư viện Python và trình biên dịch tối ưu hóa để thao tác và đánh giá các biểu thức toán học, đặc biệt là các biểu thức có giá trị ma trận. Trong Theano, các tính toán được thể hiện bằng cú pháp NumPy-esque và được biên dịch để chạy hiệu quả trên kiến trúc CPU hoặc GPU. GensimGensim là một thư viện mã nguồn mở để lập mô hình chủ đề không giám sát và xử lý ngôn ngữ tự nhiên, sử dụng máy học thống kê hiện đại. Gensim được triển khai bằng Python và Cython. Gensim được thiết kế để xử lý các bộ sưu tập văn bản lớn bằng cách sử dụng các thuật toán trực tuyến gia tăng và truyền dữ liệu, giúp phân biệt nó với hầu hết các gói phần mềm học máy khác chỉ nhắm mục tiêu xử lý trong bộ nhớGhi chú. đây là danh sách ngắn các thư viện phổ biến có thể được tận dụng trong mã Python của bạn
TabPy
TabPy [Tableau Python Server] là một triển khai dịch vụ bên ngoài giúp mở rộng khả năng của Tableau bằng cách cho phép người dùng thực thi các tập lệnh Python và các hàm đã lưu thông qua tính toán bảng của Tableau. TabPy cho phép Tableau thực thi mã Python từ xa
Nó có hai thành phần
- Một quy trình được xây dựng trên Tornado, cho phép thực thi mã Python từ xa thông qua một bộ API REST. Mã có thể được thực thi ngay lập tức hoặc được duy trì trong quy trình của máy chủ và được hiển thị dưới dạng điểm cuối REST, sẽ được gọi sau
- Một thư viện công cụ cho phép triển khai các điểm cuối như vậy, dựa trên các hàm của Python
Tableau có thể kết nối với máy chủ TabPy để thực thi mã Python một cách nhanh chóng và hiển thị kết quả trong trực quan hóa Tableau. Người dùng có thể kiểm soát dữ liệu và tham số được gửi đến TabPy bằng cách tương tác với bảng tính Tableau, bảng điều khiển hoặc câu chuyện của họ
Bạn có thể đọc thêm về TabPy trong Kho lưu trữ Github chính thức. https. //github. com/tableau/TabPy
Bắt đầu
Ghi chú. Tôi sẽ chỉ cho bạn cách khởi động và chạy trên Windows, tuy nhiên, các hướng dẫn sẽ không quá khác biệt nếu bạn là người dùng iOS
Để ý. Phần này sẽ được cập nhật do có phiên bản mới của TabPy
Bây giờ phần giới thiệu đã hết, chúng ta hãy bắt đầu bằng cách cài đặt Python, TabPy và tích hợp mọi thứ
Tải xuống và cài đặt Python
- Truy cập https. //www. con trăn. org và tải xuống Python 3. 7. 3
- Sau khi tải xuống, nhấp đúp chuột và cài đặt Python
- Bây giờ chúng tôi sẽ thêm Python vào Đường dẫn của chúng tôi
- Nhấp vào nút Bắt đầu của Windows và nhập sysdm. cpl và nhấp vào nhập;
- Nhấp vào tab Nâng cao
- Nhấp vào Biến môi trường…
- Trong Biến hệ thống, nhấp đúp chuột vào Đường dẫn;
- Trong Chỉnh sửa biến môi trường, nhấp vào Mới và nhập thông tin sau. C. \Users\YourUserName\AppData\Local\Programs\Python\Python37-32
- Tiếp tục nhấp vào Ok để đóng tất cả các cửa sổ cấu hình
- Bây giờ chúng tôi sẽ kiểm tra xem Python đã được thêm vào máy của bạn chưa
- Bấm vào nút bắt đầu của Windows
- Gõ CMD và nhấn enter để mở Command Prompt
- Bây giờ gõ python –version [hai dấu gạch ngang]
- Nếu bạn thấy Python 3. 7. 3 hoặc bất kỳ phiên bản nào bạn đã cài đặt, Python đều hoạt động
Tải xuống và cài đặt TabPy
- Truy cập trang web sau https. //github. com/tableau/TabPy/bản phát hành
- Nhấp vào Mã nguồn [zip] để tải xuống mã TabPy
- Sau khi tệp được tải xuống, hãy giải nén nội dung
- Chuyển đến thư mục này và nhấp đúp chuột vào khởi động. cmd
Nếu mọi việc suôn sẻ, bạn sẽ thấy những điều sau đây
BÀI VIẾT PHỔ BIẾN
Hoạt cảnh QT. Biểu đồ thanh không gian âm
Toàn Hoàng - 20/05/2020 15
Chúng tôi sẽ có và hy vọng học được một kỹ thuật đơn giản và hiệu quả. Trong thủ thuật nhanh Tableau này, chúng ta sẽ hướng dẫn
Tạo biểu đồ đường xếp chồng xoắn ốc trong Tableau
18 Tháng Năm, 2020
Hoạt cảnh QT. Phân trang bảng
13 Tháng Năm, 2020
Tableau Desktop Quiz
2 Tháng Giêng, 2019
Hướng dẫn Biểu đồ Donut đôi, cách đều nhau
14 Tháng Mười Một, 2018
BÀI ĐĂNG NGẪU NHIÊN
Tạo biểu đồ cột xoắn ốc bình phương trong Tableau
Toàn Hoàng - Ngày 9 tháng 3 năm 2020 6
Hai tuần trước, chúng tôi đã phát hành Hướng dẫn biểu đồ cột xoắn ốc trong Tableau bằng cách sử dụng Loại đánh dấu đường. Trong hướng dẫn này, chúng ta sẽ