In [1]:
import pandas as pd
import numpy as np
import xgboost as xgb

# 모델 정의 (제공된 모델 파라미터 사용)
model = xgb.XGBClassifier(
    device='cuda',
    tree_method='hist',
    enable_categorical=True,
    eval_metric='aucpr',
    objective='binary:logistic',
    max_depth=3,
    n_estimators=5
)

# 1. 샘플 데이터 X 생성
# 숫자형(수치형) 피처 'age'와 'income'
# 범주형 피처 'city'를 포함합니다.
# enable_categorical=True 설정에 맞춰 'city' 열을 'category' dtype으로 지정합니다.
data = {
    'age': [25, 34, 45, 23, 56],
    'income': [50000, 75000, 120000, 45000, 90000],
    'city': ['Seoul', 'Busan', 'Seoul', 'Jeju', 'Busan']
}
X = pd.DataFrame(data)
X['city'] = X['city'].astype('category')

# 2. 샘플 타겟 데이터 y 생성
# 이진 분류를 위한 레이블 (0 또는 1)
y = np.array([0, 1, 1, 0, 1])

# 3. 모델 학습
# model.fit(X, y)를 사용하여 모델에 데이터 주입
model.fit(X, y)

print("모델 학습이 완료되었습니다.")
print("X (피처 데이터):")
print(X)
print("\ny (타겟 데이터):")
print(y)

모델 학습이 완료되었습니다.
X (피처 데이터):
   age  income   city
0   25   50000  Seoul
1   34   75000  Busan
2   45  120000  Seoul
3   23   45000   Jeju
4   56   90000  Busan

y (타겟 데이터):
[0 1 1 0 1]


In [2]:
model.save_model('xgboost.json')