Hướng dẫn pandas read excel keep date format - gấu trúc đọc excel giữ định dạng ngày
Python 2.7.10tred gấu trúc 0.17.1-Chức năng read_exceltried pyexcel 0.1.7 + pyexcel-xlsx 0.0.7-function get_records () Khi sử dụng gấu trúc trong Python, có thể đọc các tệp excel (định dạng: XLS, XLSX) và để các cột chứa các giá trị ngày hoặc ngày + thời gian là các chuỗi thay vì tự động chuyển đổi thành các loại Nếu điều này là không thể sử dụng gấu trúc, ai đó có thể đề xuất một phương thức/thư viện thay thế để đọc các tệp XLS, XLSX và để lại các giá trị cột ngày làm chuỗi không? Đối với giải pháp PANDAS, các loại cột
Cố gắng/tiếp cận 1:
Cố gắng/tiếp cận 2:
Và cũng đã thử thư viện PyExcel nhưng nó thực hiện hành vi chuyển đổi tự động tương tự: Cố gắng/tiếp cận 3: IOSTR, byte, Excelfile, xlrd.book, đối tượng đường dẫn hoặc đối tượng giống như tệpstr, bytes, ExcelFile, xlrd.Book, path object, or file-like object Bất kỳ đường dẫn chuỗi hợp lệ đều được chấp nhận. Chuỗi có thể là một url. Các sơ đồ URL hợp lệ bao gồm HTTP, FTP, S3 và Tệp. Đối với URL tệp, một máy chủ được dự kiến. Một tập tin cục bộ có thể là: Nếu bạn muốn vượt qua trong một đối tượng đường dẫn, Pandas chấp nhận bất kỳ Theo đối tượng giống như tệp, chúng tôi đề cập đến các đối tượng bằng phương thức 0) hoặc 1.sheet_namestr, int, danh sách hoặc không có, mặc định 0str, int, list, or None, default 0Chuỗi được sử dụng cho tên trang. Số nguyên được sử dụng trong các vị trí tấm không chỉ số. Danh sách các chuỗi/số nguyên được sử dụng để yêu cầu nhiều tờ. Chỉ định không có để có được tất cả các tờ. Các trường hợp có sẵn:
Hàng (0 chỉ số) để sử dụng cho các nhãn cột của khung dữ liệu được phân tích cú pháp. Nếu một danh sách các số nguyên được thông qua các vị trí hàng, các vị trí hàng sẽ được kết hợp thành một 6. Không sử dụng nếu không có tiêu đề.tên tuổi giống như mặc định, không có gìarray-like,
default NoneDanh sách các tên cột để sử dụng. Nếu tệp không chứa hàng tiêu đề, thì bạn nên chuyển tiêu đề một cách rõ ràng = không có. index_colint, danh sách int, không có mặc địnhint, list of int, default NoneCột (0 chỉ số) để sử dụng làm nhãn hàng của DataFrame. Không có nếu không có cột như vậy. Nếu một danh sách được thông qua, các cột đó sẽ được kết hợp thành 6. Nếu một tập hợp dữ liệu được chọn với 8, index_col dựa trên tập hợp con.UsecolsInt, STR, Danh sách giống như hoặc có thể gọi mặc định khôngint,
str, list-like, or callable default None
Trả về một tập hợp con của các cột theo hành vi ở trên. Squeezebool, mặc định saibool, default FalseNếu dữ liệu được phân tích cú pháp chỉ chứa một cột thì hãy trả về một chuỗi. Kiểu dữ liệu cho dữ liệu hoặc cột. Ví dụ. {‘A, Nếu các bộ chuyển đổi được chỉ định, chúng sẽ được áp dụng thay vì chuyển đổi DTYPE. enginest, mặc định không cóstr, default NoneNếu IO không phải là bộ đệm hoặc đường dẫn, điều này phải được đặt để xác định IO. Các giá trị có thể chấp nhận được là không có ConverterSdict, mặc định không códict, default NoneDiễn ngôn của các chức năng để chuyển đổi các giá trị trong các cột nhất định. Các phím có thể là số nguyên hoặc nhãn cột, các giá trị là các hàm lấy một đối số đầu vào, nội dung ô Excel và trả về nội dung được chuyển đổi. true_valuesList, mặc định không cólist, default NoneGiá trị để xem là đúng. false_valuesList, mặc định không cólist, default NoneGiá trị để coi là sai. skiprowslist-likelist-likeHàng để bỏ qua ở đầu (0 chỉ số). nrowsint, mặc định không cóint, default NoneSố lượng hàng để phân tích cú pháp. Mới trong phiên bản 0.23.0. NA_VALUESSCALAR, STR, DANH SÁCH, HOẶC DINHscalar, str, list-like, or dict, default NoneCác chuỗi bổ sung để nhận ra là NA/NAN. Nếu Dict vượt qua, các giá trị NA mỗi cột cụ thể. Theo mặc định, các giá trị sau được hiểu là nan: '', '#n/a', '#n/a n/a', '#na', '-1.#Ind', '-1.#Qnan', '-Nan', '-nan', '1.#ind', '1.#qnan', '', 'n/a', 'na', 'null', 'nan', 'n/a' , 'nan', 'null'. keep_default_nabool, mặc định đúngbool, default TrueCó hay không bao gồm các giá trị NAN mặc định khi phân tích dữ liệu. Tùy thuộc vào việc NA_Values được thông qua, hành vi như sau:
Lưu ý rằng nếu Na_Filter được truyền dưới dạng sai, các tham số keep_default_na và na_values sẽ bị bỏ qua. Phát hiện các điểm đánh dấu giá trị bị thiếu (chuỗi trống và giá trị của NA_Values). Trong dữ liệu mà không có NAS, việc truyền Na_Filter = Sai có thể cải thiện hiệu suất của việc đọc một tệp lớn. verbosebool, mặc định saibool, default FalseChỉ ra số lượng giá trị Na được đặt trong các cột không phải là số. Parse_datesbool, Danh sách giống như hoặc Dict, mặc định FALSEbool, list-like, or dict, default FalseHành vi như sau:
Nếu một cột hoặc chỉ mục chứa một ngày không thể tách rời, toàn bộ cột hoặc chỉ mục sẽ được trả về không thay đổi dưới dạng kiểu dữ liệu đối tượng. Nếu bạn không muốn phân tích một số ô như ngày, chỉ cần thay đổi loại của chúng trong Excel thành văn bản. Đối với phân tích dữ liệu không chuẩn, sử dụng 0 sau 1.Lưu ý: Một đường dẫn nhanh tồn tại trong các ngày được định dạng ISO8601. date_parserfunction, tùy chọnfunction, optionalChức năng sử dụng để chuyển đổi một chuỗi các cột chuỗi thành một mảng các phiên bản DateTime. Mặc định sử dụng 2 để thực hiện chuyển đổi. Pandas sẽ cố gắng gọi DATE_PARSER theo ba cách khác nhau, tiến sang cách tiếp theo nếu xảy ra ngoại lệ: 1) Truyền một hoặc nhiều mảng (theo định nghĩa của parse_dates) làm đối số; 2) Concatenate (hàng khôn ngoan) Các giá trị chuỗi từ các cột được xác định bởi parse_dates thành một mảng duy nhất và truyền cái đó; và 3) CALL DATE_PARSER một lần cho mỗi hàng bằng một hoặc nhiều chuỗi (tương ứng với các cột được xác định bởi parse_dates) làm đối số.hàng ngàn, mặc định không cóstr, default NoneHàng ngàn phân tách để phân tích các cột chuỗi vào số. Lưu ý rằng tham số này chỉ cần thiết cho các cột được lưu trữ dưới dạng văn bản trong Excel, bất kỳ cột số nào sẽ tự động được phân tích cú pháp, bất kể định dạng hiển thị. bình luận, không có mặc địnhstr, default NoneNhận xét ra phần còn lại của dòng. Chuyển một ký tự hoặc ký tự cho đối số này để chỉ ra nhận xét trong tệp đầu vào. Bất kỳ dữ liệu giữa chuỗi nhận xét và phần cuối của dòng hiện tại đều bị bỏ qua. Skipfooterint, mặc định 0int, default 0Hàng ở cuối để bỏ qua (0 chỉ số). convert_floatbool, mặc định đúngbool, default TrueChuyển đổi phao tích phân sang int (tức là, 1.0 -> 1).Nếu sai, tất cả dữ liệu số sẽ được đọc dưới dạng phao: Excel lưu trữ tất cả các số dưới dạng nổi trong nội bộ. manggle_dupe_colsbool, mặc định đúngbool, default TrueCác cột trùng lặp sẽ được chỉ định là ‘X,‘ X.1 ,,Truyền sai sẽ khiến dữ liệu bị ghi đè nếu có tên trùng lặp trong các cột. **kwdsoptionaloptionalĐối số từ khóa tùy chọn có thể được chuyển đến 3. |