Hướng dẫn how do you convert data to log in python? - làm thế nào để bạn chuyển đổi dữ liệu để đăng nhập python?

Tôi đang viết một chức năng lớp trợ giúp để chuyển đổi nhật ký. Nó cần phải:

  1. Áp dụng nhật ký cho mỗi biến cột.
  2. Đặt tên cho biến mới được tạo này, "log_varable". Chẳng hạn, đối với biến 'INQCNT06', tôi cần tạo một biến mới có tên là "log_inqcnt06".
  3. Do log (biến_value +1) cho các giá trị trong các cột DF [biến] bằng không hoặc thiếu, để tránh được trả về "-inf".
  4. Tìm chỉ số của biến ban đầu.
  5. Thêm indexplus vào chỉ mục của biến ban đầu và biến nó thành chỉ mục cho "log_varable".

Làm thế nào tôi sẽ làm log(variable_value +1) cho các giá trị thiếu hoặc không? Tôi tìm thấy các giá trị bằng cách sử dụng isnull(), tôi có thể sử dụng hàm where.isnull() bằng cách nào đó không?

Tôi cũng gặp khó khăn trong việc thêm chỉ mục biến ban đầu vào indexPlus và gán nó cho index log_varable.

Đây là mã của tôi:

def add_log_transform(df, variable, indexplus = 1):
        print df[variable].isnull()
        log_variable = (np.log(df[variable]))
def main():
    variables_needs_tranform = ['DerogCnt', 'CollectCnt', 'InqCnt06', 'InqTimeLast', 'InqFinanceCnt24', 'TLTimeFirst', 'TLTimeLast', 'TLCnt03', 'TLCnt12', 'TLCnt24', 'TLCnt', 'TLSum', 'TLMaxSum', 'TLDel60Cnt', 'TLBadCnt24', 'TL75UtilCnt', 'TL50UtilCnt', 'TLBalHCPct', 'TLSatPct', 'TLDel3060Cnt24', 'TLDel90Cnt24', 'TLDel60CntAll', 'TLBadDerogCnt', 'TLDel60Cnt24', 'TLOpen24Pct']
util.add_log_transform(df, variables_needs_tranform, indexplus = 1)

if __name__ == "__main__":
        main()

Đây là một mẫu của DF của tôi.

    DerogCnt  CollectCnt  InqCnt06  InqTimeLast  InqFinanceCnt24  TLTimeFirst  \
0          1           1         7            1                4          125   
1          1           1         2            1                0          252   
2          0           0         1            1                4          254   
3          0           0         6            3                6          154   
4          0           0         1            0                1          311   
5          1           1         1            1                2          200   
6          2           0         3            1                2          137   
7          0           0         3            2                1          267   
8          0           0         0           16                3          359   
9          1           1         1            6                3          141   
10         0           0         1            4                1          487   
11         0           0         4            1                4           78   
12         3           3         4            0                5          117   
13         2           2         1            0                4          101   
14         1           1         2            1                8          260   
15         0           0         5            1                6          295   
16         0           0         0          NaN                0          223   
17        15           9         3            1                3           14   
18         0           0         3            2                7          345   
19         0           0         4            4                5          145   
20         0           0         3            1                3          222   
21         0           0         1            5                1          354   
22         8           8         0            8                2          111   
23         0           0         1            1                3           56   
24         8           5         6            1               10           16   

TLTimeLast  TLCnt03  TLCnt12  TLCnt24     ...       TL75UtilCnt  \

0            3        1        3        5     ...                 3   
1           18        0        0        2     ...                 1   
2           12        0        1        2     ...                 3   
3            3        1        9       11     ...                 4   
4           17        0        0        1     ...                 2   
5            7        0        1        2     ...                 1   
6           12        0        1        2     ...                 2   
7            2        3        6        8     ...                 1   
8           23        0        0        1     ...                 0   
9            8        0        1        4     ...                 7   
10          12        0        1        6     ...                 9   
11           4        0        7       10     ...                 1   
12          27        0        0        0     ...                 3   
13          12        0        1        1     ...                 3   
14          16        0        0        2     ...                 2   
15           8        0        4       11     ...                 9   
16          18        0        0        1     ...                 2   
17          14        0        0        1     ...                 1   
18           2        2        2        4     ...                 3   
19           3        1        2        2     ...                 2   
20          22        0        0        1     ...                 1   
21           7        0        2       10     ...                 4   
22          24        0        0        1     ...                 0   
23          40        0        0        0     ...                 0   
24           4        0        2        4     ...                 2   

TL50UtilCnt  TLBalHCPct  TLSatPct  TLDel3060Cnt24  TLDel90Cnt24  \
0             4        0.85      0.67               0             0   
1             2        0.48      0.30               0             1   
2             3        0.84      0.67               0             1   
3             5        0.73      0.76               0             1   
4             3        0.88      0.63               0             0   
5             1        0.13      0.25               1             1   
6             2        0.70      0.64               0             0   
7             1        0.47      0.42               0             1   
8             2        0.41      0.69               0             0   
9             7        0.84      0.67               0             0   
10           10        0.77      0.82               0             0   
11            2        0.79      0.74               0             0   
12            3        0.92      0.21               2             3   
13            4        0.90      0.22               3             0   
14            3        0.80      0.35               0             1   
15           12        0.47      0.73               0             0   
16            4        0.89      0.57               3             0   
17            1        0.80      0.00               0             0   
18            3        0.86      0.52               0             0   
19            3        0.59      0.41               0             2   
20            2        0.25      0.62               2             0   
21            5        0.36      0.65               0             1   
22            0        0.38      0.40               0             0   
23            0        0.28      0.20               3             1   
24            3        0.91      0.25               1             1   

TLDel60CntAll  TLBadDerogCnt  TLDel60Cnt24  TLOpen24Pct  

0               1              0             0         0.71  
1               4              2             1         0.50  
2               1              1             1         0.33  
3               1              1             1         1.22  
4               1              0             0         0.20  
5               3              1             1         0.67  
6               0              2             0         0.40  
7               2              1             1         2.00  
8               2              0             0         0.17  
9               0              1             0         0.44  
10              0              0             0         0.46  
11              0              0             0         1.67  
12              7              4             4         0.00  
13              4              1             2         0.17  
14              1              1             1         0.67  
15              0              0             0         0.28  
16              5              0             2         0.17  
17              0             12             0         1.00  
18              0              0             0         0.67  
19              7              2             2         0.25  
20              3              0             1         0.10  
21              1              1             1         0.53  
22              0              4             0         0.50  
23              4              1             3         0.00  
24              1              7             1         1.33  

Làm cách nào để chuyển đổi một biến thành nhật ký trong Python?

Ví dụ: np.log (x) sẽ ghi lại biến đổi x trong python.np. log(x) will log transform the variable x in Python.

Việc sử dụng chuyển đổi nhật ký trong Python là gì?

Nhật ký: Chuyển đổi nhật ký giúp giảm độ lệch khi bạn có dữ liệu sai lệch.helps reducing skewness when you have skewed data.

Làm thế nào để bạn chuyển đổi dữ liệu trong Python?

Cách tiếp cận 2: Sử dụng chức năng biến đổi của Python..
Bước 1: Nhập thư viện.#Thư viện quan sát.Nhập GANDAS dưới dạng PD.Nhập ngẫu nhiên.....
Bước 2: Tạo DataFrame.Dữ liệu = pd.DataFrame ({'c': [ngẫu nhiên. ....
Bước 3: Sử dụng quy trình hợp nhất.%% timeit.dữ liệu.....
Bước 4: Sử dụng hàm biến đổi.%% timeit.Dữ liệu ['N3'] = Dữ liệu ..

Tại sao chúng ta chuyển đổi dữ liệu thành nhật ký?

Việc chuyển đổi nhật ký, được cho là, phổ biến nhất trong số các loại biến đổi khác nhau được sử dụng để chuyển đổi dữ liệu bị lệch thành xấp xỉ phù hợp với tính quy tắc.Nếu dữ liệu gốc tuân theo phân phối log-bình thường hoặc xấp xỉ như vậy, thì dữ liệu được chuyển đổi log theo phân phối bình thường hoặc gần bình thường.to transform skewed data to approximately conform to normality. If the original data follows a log-normal distribution or approximately so, then the log-transformed data follows a normal or near normal distribution.