본문 바로가기

분류 전체보기

(52)
[TestDome] Social Network Social Network JOIN ON에 OR절은 처음 봐서 당황했다. 처음에 JOIN ON A OR B를 A를 기준으로 JOIN한 경우와 B를 기준으로 JOIN한 경우의 합집합으로 생각했다. 그런데 내가 생각한 답이 보기 중에 없는 것이다. 알고 보니 A 조건을 만족하거나 B조건을 만족하는 행만 가져오되, A와 B 조건 모두 만족하는 행이 없어도 LEFT JOIN이라 null값도 결과에 포함시키는 것이었다. 주어진 SQL 쿼리문을 OR 절을 기준으로 나눠서 생각해보자. SELECT * FROM users LEFT JOIN friends ON users.id = friends.user1 WHERE users.sex = 'f'; id name sex user1 user2 3 Mary f null null..
[TestDome] Marketing Costs Marketing Costs 문제에 주어진 표를 보면 과거 마케팅 비용을 얼마 투자했을 때 얼마나 많은 단위가 팔렸는지에 대한 데이터가 있다. 즉, 투자한 마케팅 비용(Marketing expenditure)을 $X$로, 팔린 단위(Units sold)를 $y$로 선형회귀를 학습할 수 있다. 그런데 여기서 함정(?)은 학습한 모델로 $X$를 넣었을 때 $\widehat{y}$을 return하는 것이 아니라 원하는 $\widehat{y}$이 나오려면 $X$ 가 몇이어야 되는지를 묻고 있다. 즉, 문제에서 나온 예시처럼 6만 단위를 팔려면 마케팅 비용은 얼마나 투자해야하는지 return해야 하는 것이다. 선형회귀를 통해 추정된 회귀선은 아래와 같다. $\widehat{unitsSold}= \beta_0 + ..
머신러닝 용어 정리 혼동 행렬 (Confusion Matrix) percision과 recall precision과 recall의 차이는 FP에 focus가 있는지, FN에 focus가 있는지 FP가 가장 위험한 상황이라 이를 줄이고 싶다면 precision이 중요 반대로, FN이 가장 위험한 상황이라 이를 피해야 한다면 recall이 중요 FP (False Positive): positive로 잘못 예측 FN (False Negative): negative로 잘못 예측 precision (정확도, 정밀도) 내가 맞다고 생각한 것 중에 얼마나 맞췄는지 Positive Predictive Value 모델이 Positive로 예측한 샘플 중에서 실제로 Positive인 샘플의 비율을 나타냅니다. 즉, 모델이 얼마나 정확하게 P..
LightGBM 정리 개념 LightGBM은 기존 GBDT (Gradient Boosting Decision Tree)의 한계를 극복하기 위해 만들어진 모델로, 같은 accuracy를 유지하면서 계산 속도는 더 빠르고 메모리 사용량은 더 적은 GBDT이다. GBDT (Gradient Boosting Decision Tree)란? GBDT에서 gradient는 손실 함수의 그래디언트(gradient)가 아니라 예측값과 실제 타깃값의 잔차(residual)를 의미 GBDT는 손실 함수를 최소화하는 모델을 만들기 위해 이러한 잔차를 줄이는 방향으로 모델을 학습 각 트리는 이전 트리가 만든 잔차에 대해 학습하며, 잔차에 대한 예측값의 그래디언트를 기반으로 합니다. cf) boosting은 약한 학습기(분류기/예측기)를 여러 개 연결..
추천 관련 용어 정리 User-Based Recommendation 사용자 간의 유사성을 기반으로 추천을 제공하는 방법 주어진 사용자와 유사한 다른 사용자들의 행동 패턴을 분석하여 추천을 제공 → 사용자 기반 협업 필터링(User-Based Collaborative Filtering)의 한 형태 User representation learning 사용자의 특성과 행동을 나타내는 효과적인 표현을 학습하는 방법 사용자 표현 학습은 사용자의 특성을 숫자로 나타내는 방법을 학습하는 과정을 포함 예를 들어, 소셜 미디어 플랫폼에서는 사용자 표현 학습을 통해 사용자의 관심사를 이해하고, 그에 맞는 콘텐츠를 제안할 수 있습니다. 또는 전자상거래 플랫폼에서는 사용자의 이전 구매 기록과 행동 패턴을 학습하여 적절한 제품을 추천할 수 있습니다..