Hướng dẫn bigquery python transaction - giao dịch python bigquery
Bài viết này chứa các ví dụ về cách tạo truy vấn của dữ liệu Analytics mà bạn xuất sang BigQuery. Chúng tôi đã tạo sẵn tập dữ liệu mẫu để bạn có thể thực hành với một số truy vấn trong bài viết này. Nội dung trong bài viết này:: Tối ưu hóa truy vấnMỗi truy vấn bạn chạy đóng góp vào phụ cấp xử lý dữ liệu hàng tháng. Nếu bạn chọn các trường không liên quan, số lượng dữ liệu cần được xử lý sẽ tăng lên. Khi đó, bạn sẽ sử dụng mức dữ liệu được phép hằng tháng nhiều hơn cần thiết. Truy vấn được tối ưu hoá giúp bạn sử dụng mức dữ liệu được phép hằng tháng một cách hiệu quả hơn. Tìm hiểu thêm về mức giá. Chỉ chọn những gì bạn cầnKhi bạn xây dựng truy vấn, hãy chọn các trường có liên quan trong câu lệnh SELECT. Khi không gọi các trường không liên quan, bạn sẽ giảm lượng dữ liệu và thời gian cần để xử lý truy vấn. Ví dụ: tránh sử dụng toán tử ký tự đại diện tránh sử dụng toán tử ký tự đại diện
Cho phép lưu vào bộ nhớ đệmKhi cần thiết, tránh sử dụng các hàm dưới dạng trường. Các hàm (như Hiện tại, chúng tôi không hỗ trợ kết quả được lưu trong bộ nhớ đệm cho các truy vấn dựa trên nhiều bảng sử dụng ký tự đại diện, kể cả khi bạn đã chọn mục Sử dụng kết quả được lưu trong bộ nhớ đệm. Nếu bạn chạy cùng một truy vấn bao gồm ký tự đại diện nhiều lần, thì bạn sẽ thanh toán cho mỗi truy vấn. Tìm hiểu thêm Sử dụng bảng trung gian cho các truy vấn con thường được sử dụngNếu nhận thấy bạn liên tục sử dụng một truy vấn cụ thể dưới dạng truy vấn con, bạn có thể lưu truy vấn đó dưới dạng bảng trung gian bằng cách nhấp vào Lưu dưới dạng bảng phía trên kết quả truy vấn. Sau đó, bạn có thể tham chiếu đến bảng đó trong mục
Gỡ lỗi truy vấnBigQuery gỡ lỗi mã của bạn khi bạn tạo mã. Trong cửa sổ cấu trúc, phần gỡ lỗi được biểu thị ngay bên dưới truy vấn. Việc gỡ lỗi cũng có sẵn thông qua API với cờ dryRun. Truy vấn hợp lệ có chỉ báo màu xanh lá cây mà bạn có thể nhấp vào để xem lượng dữ liệu được xử lý theo truy vấn. Tính năng này cung cấp cho bạn cơ hội để tối ưu hóa dữ liệu trước khi chạy truy vấn để bạn có thể tránh việc xử lý dữ liệu không cần thiết. Truy vấn không hợp lệ có chỉ báo màu đỏ mà bạn có thể nhấp vào để xem thông tin về lỗi, đồng thời tìm dòng và cột nơi xảy ra lỗi. Trong ví dụ bên dưới, câu lệnh GROUP BY trống và lỗi được xác định chính xác. Mẹo và phương pháp hay nhấtSử dụng tập dữ liệu mẫuCác ví dụ sau sử dụng tập dữ liệu mẫu của Google Analytics. Để sử dụng các truy vấn về dữ liệu của riêng bạn, chỉ cần thay thế tên dự án và tập dữ liệu trong các ví dụ bằng tên dự án và tập dữ liệu của riêng bạn. Sử dụng SQL chuẩn so với SQL cũBigQuery hỗ trợ hai phương ngữ SQL:
Bài viết về Cách di chuyển sang SQL chuẩn giải thích sự khác biệt giữa hai phương ngữ. SQL chuẩn hiện là phương ngữ SQL ưa thích để truy vấn dữ liệu được lưu trữ trong BigQuery. Hãy xem bài viết về Cách bật SQL chuẩn để biết thông tin về cách bật SQL chuẩn trong CLI, API, giao diện người dùng BigQuery hoặc bất kỳ giao diện nào bạn đang sử dụng. Cách dễ nhất để bắt đầu là thêm nhận xét "standardSQL" vào đầu các truy vấn SQL chuẩn của bạn như được trình bày trong các ví dụ sau. Khi bạn sử dụng SQL cũ, dữ liệu Google Analytics 360 sẽ được chuyển qua một bảng mới hằng ngày. Để truy vấn nhiều bảng cùng một lúc, bạn có thể phân tách tên các bảng bằng dấu phẩy, sử dụng hàm ký tự đại diện bảng Truy vấn nhiều bảngCác ví dụ sau đây thể hiện các truy vấn SQL chuẩn và SQL cũ cho cùng một dữ liệu. 3 ngàySQL chuẩn
SQL cũ
1095 ngày quaSQL chuẩn
SQL cũ
1095 ngày quaSQL chuẩn
SQL cũ
1095 ngày quaSQL chuẩn
SQL cũ
1095 ngày quaSQL chuẩn
SQL cũ
1095 ngày quaSQL chuẩn
SQL cũ
3 ngày sử dụng tên bảng được phân tách bằng dấu phẩy
1095 ngày qua1095 ngày qua sử dụng _TABLE_SUFFIX SQL chuẩn
SQL cũ
SELECT field1, field2 FROM [table name];136 tháng qua SQL chuẩn
SQL cũ
36 tháng qua sử dụng TABLE_DATE_RANGE
SQL chuẩn
SQL cũ
SQL chuẩn
SQL cũ
Phạm vi ngày cụ thểPhạm vi ngày cụ thể sử dụng _TABLE_SUFFIX SQL chuẩn
SQL cũ
SELECT field1, field2 FROM [table name];7Dữ liệu 3 năm qua cộng với dữ liệu hôm nay (trong ngày) SQL chuẩn
SQL cũ
SELECT field1, field2 FROM [table name];8Dữ liệu 3 năm qua cộng với dữ liệu hôm nay (trong ngày) sử dụng nhiều TABLE_DATE_RANGE SQL chuẩn
SQL cũ
Phần này giải thích cách xây dựng các truy vấn cơ bản bằng cách sử dụng chỉ số và thứ nguyên từ dữ liệu Analytics mẫu. Nhiều thứ nguyên tùy chỉnh ở cấp lần truy cập hoặc phiên
Trong mỗi truy vấn: Câu lệnh Hàm
Ví dụ về truy vấn nâng caoBây giờ bạn đã quen thuộc với các truy vấn đơn giản, bạn có thể tạo truy vấn bằng cách sử dụng các hàm và tính năng nâng cao khả dụng trong BigQuery. Sản phẩm được mua bởi khách hàng đã mua sản phẩm A (Thương mại điện tử cổ điển)Dưới đây là tập lệnh sườn cho câu hỏi: Khách hàng đã mua sản phẩm A mua những sản phẩm nào khác?
Các quy tắc (câu lệnh Dưới đây là ví dụ về truy vấn Nếu khách hàng mua Bút Brighton Metallic - Một bộ 4 bút, thì (các) sản phẩm khác mà họ đã mua là gì?
Trong Dremel/BigQuery, việc sử dụng Sản phẩm được mua bởi khách hàng đã mua sản phẩm A (Thương mại điện tử nâng cao)Điều này tương tự với truy vấn sườn trước đó nhưng hoạt động cho Thương mại điện tử nâng cao. Bạn có thể sử dụng
Số lượt tương tác trung bình của người dùng trước khi mua hàngĐây là ví dụ về một truy vấn chứa lệnh Bên dưới là tập lệnh sườn cho câu hỏi: Số lượt tương tác trung bình với người dùng trước khi mua hàng là bao nhiêu?
Dưới đây là ví dụ về truy vấn Vào ngày 10 tháng 9 năm 2013, số lần tương tác của người dùng trung bình trước khi mua hàng là bao nhiêu?
Tỷ lệ phần trăm hàng đã bán trên mỗi sản phẩmĐây là ví dụ về truy vấn không chỉ phụ thuộc vào dữ liệu Analytics, mà còn phụ thuộc vào dữ liệu không phải của Analytics. Bằng cách kết hợp cả hai tập dữ liệu, bạn có thể bắt đầu hiểu hành vi của người dùng ở cấp được phân đoạn nhiều hơn. Bạn có thể nhập dữ liệu không phải của Analytics vào BigQuery, nhưng lưu ý rằng điều này sẽ góp phần vào chi phí lưu trữ dữ liệu hàng tháng của bạn. Bên dưới là tập lệnh sườn cho câu hỏi: Tỷ lệ phần trăm hàng đã bán trên mỗi sản phẩm là bao nhiêu?
Trong truy vấn này, nhiều biến có tên tập dữ liệu kèm theo biến dưới dạng tiền số (ví dụ: Dưới đây là ví dụ về truy vấn Tỷ lệ phần trăm hàng đã bán trên mỗi sản phẩm vào ngày 28 tháng 7 năm 2013 là bao nhiêu?
Khả năng sinh lời của mỗi sản phẩmBên dưới là tập lệnh sườn cho câu hỏi: Khả năng sinh lời của mỗi sản phẩm là gì?
Dưới đây là ví dụ về truy vấn Khả năng sinh lời của mỗi sản phẩm vào ngày 28 tháng 7 năm 2013 là bao nhiêu?
Lợi nhuận được tính bằng cách tìm ra chênh lệch giữa giá sản phẩm được bán và chi phí sản xuất sản phẩm. Thông tin này được lưu trên tập dữ liệu không phải của GA. Khả năng sinh lời thực tế của mỗi sản phẩm (có tính đến tiền hoàn lại)Bên dưới là tập lệnh sườn cho câu hỏi: Khả năng sinh lời thực tế của mỗi sản phẩm là bao nhiêu?
Để biết thêm thông tin về truy vấn, vui lòng xem phần về khả năng sinh lời của từng sản phẩm. Dưới đây là ví dụ về truy vấn sau Khả năng sinh lời thực tế của mỗi sản phẩm vào ngày 28 tháng 7 năm 2013 là bao nhiêu?
Lợi nhuận thực tế sẽ tính đến khả năng sinh lời của sản phẩm sau khi xét đến sản phẩm được hoàn tiền lại. Để tính tổng doanh thu hoàn loại cho một sản phẩm: tổng doanh thu hoàn lại cho một sản phẩm = ( giá của sản phẩm + giá vận chuyển trả lại cho sản phẩm ) * số lượng sản phẩm bị trả lại Thông tin này có hữu ích không? Chúng tôi có thể cải thiện trang này bằng cách nào? |