2020年4月12日 星期日

Pandas One hot encoding

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1],
   ['red', 'L', 13.5],
   ['blue', 'XL', 15.3]])
  
df.columns = ['color', 'size', 'prize']
df

[out:]
colorsizeprize
0greenM10.1
1redL13.5
2blueXL15.3
pd.get_dummies(df)
prizecolor_bluecolor_greencolor_redsize_Lsize_Msize_XL
010.1010010
113.5001100
215.3100001