Tôi có một DataFrame và tôi đang cố gắng biến cột thành một danh sách phân tách dấu phẩy. Mục tiêu cuối cùng là vượt qua danh sách sepla dấu phẩy này dưới dạng danh sách các mục được lọc trong truy vấn SQL.
Làm thế nào để tôi làm điều này?
> import pandas as pd
>
> mydata = [{'id' : 'jack', 'b': 87, 'c': 1000},
> {'id' : 'jill', 'b': 55, 'c':2000}, {'id' : 'july', 'b': 5555, 'c':22000}]
df = pd.DataFrame[mydata]
df
Giải pháp dự kiến - Lưu ý các trích dẫn xung quanh ID vì chúng là chuỗi và các mục trong cột có tiêu đề 'B' vì đó là trường số và cách thức hoạt động của SQL. Cuối cùng tôi sẽ gửi một truy vấn như
select * from mytable where ids in [my_ids] or values in [my_values]:
my_ids = 'jack', 'jill','july'
my_values = 87,55,5555
Tự động gửi vào bảng tạm của bạn
Sử dụng công cụ này để chuyển đổi cột thành danh sách phân tách dấu phẩy
- Sao chép cột văn bản của bạn trong Excel
- Dán cột ở đây [vào hộp văn bản ngoài cùng bên trái]
- Sao chép danh sách phân tách dấu phẩy của bạn với hộp văn bản ngoài cùng bên phải
- Dán danh sách phân tách dấu phẩy của bạn bất cứ nơi nào bạn muốn
Cách sử dụng Bộ phân cách dấu phẩy của chúng tôi: Danh sách chuyển đổi thành CSV
Công cụ phân tách dấu phẩy miễn phí của chúng tôi tự động chuyển đổi một cột thành danh sách dấu phẩy hoặc danh sách thành CSV [các giá trị được phân tách bằng dấu phẩy]. Sao chép cột dữ liệu của bạn và xem chuyển đổi xảy ra. Bạn có thể thực hiện ngược lại và chuyển đổi một danh sách được phân định thành một cột.
Bạn có thể sử dụng công cụ phân tách dấu phẩy của chúng tôi để chuyển đổi danh sách cột thành danh sách giá trị phân tách bằng dấu phẩy [CSV] một cách nhanh chóng và dễ dàng. Chỉ cần làm theo các hướng dẫn này.
Chuyển đổi danh sách thành CSV
- Thay đổi bất kỳ cài đặt nào bạn muốn ở phía bên phải của bộ phân cách dấu phẩy bằng cách chọn cách bạn muốn tách đường ngắt sau khi bạn xóa chúng.
- Danh sách chữ thường: thường xuyên tất cả các mục trong danh sách. Hữu ích nếu bạn có một cột trong đó các chữ cái đầu tiên trong mỗi hàng là vốn và bạn muốn một danh sách được phân tách bằng dấu phẩy mà không có thủ đô. Lowercase all of the items in the list. Helpful if you have a column where the first letters in each row are capital, and you want a comma-separated list without capitals.
- Danh sách ngược: Đảo ngược danh sách mà bạn đã nhập để bạn có thể có các giá trị ngược. Reverse the list that you entered so that you can have the values backwards.
- DELIMITER: DELIMITER là giá trị bạn muốn tách các mục trong danh sách của mình. Bạn có thể chọn từ dấu phẩy [mặc định], dấu phẩy có khoảng trắng sau, không gian và các dấu phẩy khác.The delimiter is the value you want to separate items in your lists. You can choose from commas [the default], commas with spaces after, spaces, and others.
- Xóa các ngắt dòng: & nbsp; Cài đặt này sẽ loại bỏ bất kỳ ngắt dòng bổ sung nào trong trường hợp bạn có hàng trống.This setting will remove any extra line breaks in case you have blank rows.
- Hủy bỏ các đoạn ngắt đoạn: Cài đặt này loại bỏ các đoạn vỡ đoạn là hai hai đường ngắt liên tiếp. This setting removes paragraph breaks which are two two line breaks in a row.
- Xóa không gian bổ sung: Nếu bạn có bất kỳ vấn đề nào với khoảng trắng kép sau khi xóa các dòng, hãy chọn tùy chọn này. If you have any issues with double spaces after removing lines, select this option.
- Dán cột hoặc danh sách dữ liệu của bạn vào hộp văn bản bên trái, nơi nó nói rằng Nhập/nhận dữ liệu cột ở đây
- Bạn có thể thấy danh sách được phân định mới trong hộp văn bản bên phải có nhãn GET GET/ENTER DANH SÁCH DANH SÁCH
- Nó đơn giản mà.
Chuyển đổi CSV thành danh sách
Bạn cũng có thể thực hiện ngược lại: chuyển đổi CSV [hoặc chuỗi được phân định khác] thành một cột văn bản]. Chỉ cần dán chuỗi của bạn vào hộp văn bản bên phải, chọn dấu phân cách và các tùy chọn khác và xem cột/danh sách của bạn trong hộp văn bản bên trái.
Tệp CSV là gì?
CSV là viết tắt của các giá trị phân tách bằng dấu phẩy. Điều đó nói rằng, một tệp CSV là bất kỳ tệp văn bản nào trong đó các ký tự được phân tách bằng dấu phẩy, tạo một loại bảng theo hàng và cột. Các cột được xác định bởi mỗi dấu chấm phẩy [;], trong khi mỗi hàng được xác định bởi một dòng bổ sung trong văn bản. Theo cách này, các tệp CSV có thể được tạo rất dễ dàng [chúng tôi giải thích điều này sau]. Đây là lý do tại sao các tệp .csv được liên kết trực tiếp với việc tạo các bảng nội dung.
Thông thường, cách phổ biến nhất là đọc các tệp CSV từ Excel, vì chương trình [mặc dù không thuộc các phiên bản cũ hơn] tự động xác định các dấu phân cách và hình thành bảng mà không phải làm bất cứ điều gì khác. Có các dấu phân cách khác nhau, được sử dụng ít nhiều thường xuyên tùy thuộc vào khu vực chúng ta đang ở.
Lịch sử CSV ở Mỹ và Châu Âu
Giống như các định dạng phổ biến khác, tệp CSV có một lịch sử lâu dài trong thế giới máy tính. Để khám phá lịch sử của nó, chúng ta phải quay trở lại năm 1972, khi IBM bắt đầu sử dụng một hệ thống tương tự như hiện tại, nhưng thô sơ hơn. Vào thời điểm đó, thẻ nhớ chứa các giá trị khác nhau được phân tách bằng dấu phẩy hoặc khoảng trống đã được sử dụng. Bằng cách đó, các máy tính thời đó có thể đọc dữ liệu một cách chính xác và có trật tự.
Sau đó, và nhờ vào việc mát xa tính toán, loại hệ thống này cuối cùng đã được số hóa. Do đó, dữ liệu được giới thiệu trong một tệp ảo và các thẻ vật lý bị bỏ qua. Định dạng CSV bắt đầu được sử dụng để trao đổi thông tin giữa các cơ sở dữ liệu được lưu trữ trên các máy có các kiến trúc khác nhau. Lý do chính là dữ liệu được lưu trữ không được định dạng và được viết bằng văn bản thuần túy. Nhờ tính năng này, khả năng tương thích của nó được tối đa hóa.
Tuy nhiên, chúng ta phải thực hiện một bước nhảy tạm thời đến năm 2005 để nói về tiêu chuẩn hóa thực sự. Đó là từ năm đó khi định dạng CSV trở thành loại nội dung MIME. Từ năm 2013, một số thiếu sót sẽ được sửa chữa để cải thiện khả năng tương thích của nó. Cho đến nay, hệ thống giá trị phân tách bằng dấu phẩy vẫn thường xuyên được sử dụng, đặc biệt là khi truyền dữ liệu giữa các ứng dụng không tương thích. Tuy nhiên, vẫn còn những xung đột giữa các định dạng thập phân của châu Âu [được sử dụng bằng dấu phẩy] với các dấu phân cách dấu phẩy. Đó là lý do tại sao ở châu Âu, dấu chấm phẩy thường được sử dụng, trong khi ở Hoa Kỳ và các quốc gia nói tiếng Anh khác, dấu phẩy thường được sử dụng, vì nó sử dụng điểm như một định dạng thập phân.
Tại sao sử dụng tệp CSV?
Tóm lại, các tệp CSV được sử dụng để xử lý một lượng lớn dữ liệu ở định dạng lưới, mà không phải chịu bất kỳ chi phí tính toán nào và làm cho mọi người dễ tiếp cận hơn.
Cách chuyển đổi cột thành CSV trong Excel
Để tạo một danh sách được phân tách bằng dấu phẩy Excel, chỉ cần làm theo các hướng dẫn này. Có một số cách để tạo danh sách phân tách bằng dấu phẩy trong Excel. Hãy thử bất cứ ai làm việc cho bạn.
Sử dụng textjoin trong excel
Nếu bạn có Microsoft 365 hoặc Office 2019, bạn đủ may mắn để có thể sử dụng chức năng TextJoin giúp đơn giản hóa các phạm vi liên kết với một dấu phân cách.
Chỉ cần vào đó sau: =TEXTJOIN[delimiter, ignore_empty, text1, [text2], …]
=TEXTJOIN[delimiter, ignore_empty, text1, [text2], …]
Text1 có thể là văn bản hoặc một phạm vi.
Để trình diễn, hãy xem video này dưới đây:
Sử dụng Excel và Notepad ++
- Chuẩn bị sẵn sàng văn bản của bạn trong một cột trong Excel.
- Trong cột bên cạnh cột, bạn muốn chuyển đổi thành chuỗi được phân tách bằng dấu phẩy, nhập tham chiếu ô và [&,,] mà không cần các paratheses. Nếu dữ liệu đầu tiên của bạn nằm trong ô A2, công thức của bạn sẽ trông như thế này: ________ 5
=A2&","
- Sao chép công thức xuống cột.
- Sao chép cột mới này vào Notepad ++.
- Mở cửa sổ tìm kiếm và thay thế bằng cách nhập ctrl+h.
- Chọn “mở rộng” trong chế độ tìm kiếm ”
- Loại đầu tiên trong \ n đến hộp tìm thấy những gì: hộp và không đặt gì vào thay thế với: Nhấn vào Thay thế tất cả.
- Sau đó nhập vào \ r vào hộp tìm thấy: hộp và không đặt gì vào thay thế bằng cách thay thế: và nhấn vào Thay thế tất cả.
- Sao chép chuỗi bất cứ nơi nào bạn muốn.
Sử dụng một mô-đun trong Excel để chuyển đổi cột thành danh sách phân loại bằng dấu phẩy
Một cách tuyệt vời khác để tạo một danh sách phân tách bằng dấu phẩy là tạo ra một công thức có thể tái sử dụng trong Excel với một mô-đun. Một người dùng trên Stack Exchange đã đăng mô -đun tuyệt vời này. Khi bạn tạo nó, bạn sẽ có thể nhập công thức =csvRange[A1:A27]
vào Excel để tạo danh sách phân loại bằng dấu phẩy.
Function csvRange[myRange As Range]
Dim csvRangeOutput
Dim entry as variant
For Each entry In myRange
If Not IsEmpty[entry.Value] Then
csvRangeOutput = csvRangeOutput & entry.Value & ","
End If
Next
csvRange = Left[csvRangeOutput, Len[csvRangeOutput] - 1]
End Function
Cách chuyển đổi danh sách Python thành CSV
Python là một ngôn ngữ phổ biến được sử dụng để thao tác dữ liệu, vì vậy, các nhà phát triển Python muốn chuyển đổi dữ liệu thành định dạng tệp CSV. Có một số cách khác nhau để làm điều này.
1. Sử dụng mô -đun CSV
Bằng cách nhập mô -đun CSV trong Python, bạn có thể dễ dàng ghi danh sách vào các tệp CSV bằng phương thức writerows [].
2. Sử dụng gấu trúc
Pandas là một thư viện Python nguồn mở được sử dụng để phân tích dữ liệu. Các cấu trúc dữ liệu chính được gọi là DataFrame và Pandas giúp dễ dàng ghi các khung dữ liệu vào các tệp CSV bằng phương thức dataFrame.TO_CSV [‘file.csv,].
3. Numpy
Sử dụng thư viện Numpy, bạn có thể lưu các tệp văn bản dưới dạng CSV bằng phương thức numpy.savetxt [‘file.csv, mảng, delimiter = hồi,,].
4. Python I/O
Python I/O có thể được sử dụng để thực hiện cách tạo các tệp CSV của riêng bạn.