TIL 40

TIL - 실무에 쓰는 머신러닝 기초 1-4

로지스틱 회귀 선형 회귀처럼 입력값의 선형 결합을 취하지만, 결과를 0~1 사이의 확률로 변환하기 위해 로지스틱 함수를 사용 장점계산이 빠르고 구현이 간단결과 해석이 용이(회귀 계수로 각 변수의 영향도 해석 가능)단점 복잡한 비선형 패턴을 학습하기엔 한계가 있음 SVM데이터를 가장 잘(안전 여유공간을 크게) 구분하는 경계를 찾는 알고리즘 장점차원이 높은 데이터에서도 좋은 성능을 보일 수 있음결정 경계를 명확하게 찾는 경우, 예측 성능이 우수함결정경계란? → SVM이 찾은 최적의 분류선단점파라미터(C, 커널 종류 등)를 적절히 찾아야 하므로 튜닝 비용이 큼대규모 데이터 세트에 대해서는 학습 속도가 느릴 수 있음 산업별 적용 사례금융1. 사기 거래 탐지2. 대출 상환 가능성 예측 헬스케어1. 질병 진단2. ..

TIL 2025.03.18

TIL - 실무에 쓰는 머신러닝 기초 1-3

회귀 분석이란?종속변수(Y)와 하나 이상의 독립변수(X) 간의 관계를 추정하여, 연속형 종속변수를 예측하는 통계/머신러닝 기법 지도학습에서 분류와 회귀의 차이분류: 결과값이 이산형회귀: 결과값이 연속형회귀 모델을 사용하는 이유1. 미래 값 예측2. 인과 관계 해석3. 데이터 기반 의사결정 선형 회귀가정: 독립변수와 종속변수가 선형적으로 관계를 맺고 있다고 가정β0: 절편βi: 각 독립변수의 회귀계수 [학습 과정]1. 가중치 초기화2. 손실함수 설정3. 최적화4. 학습완료 후 새로운 입력 값에 대한 예측 수행 [장단점]장점: 해석이 간단, 구현이 쉬움단점: 데이터가 선형성이 아닐 경우 예측력이 떨어짐  다항 회귀 비선형적인 관계를 다항식 형태로 모델링  주의점 고차항을 무작정 늘리면 훈련 데이터에는 과도하..

TIL 2025.03.17

TIL - 실무에 쓰는 머신러닝 기초 1-2

데이터 전처리란?불필요하거나 손실이 있는 부분을 처리하고 분석 목적에 맞는 형태로 만드는 과정  결측치 처리 기법 1. 삭제: 결측치가 있는 행(row) 또는 열(column)을 제거→ 간단하지만 데이터 손실이 발생→ 결측치가 전체 데이터에서 매우 소수일 때 적합 2. 대체: 평균 또는 중앙값으로 대체>> 수치형 데이터에서 많이 사용, 데이터 분포 왜곡이 비교적 적음: 최빈값으로 대체>> 범주형 데이터에서 사용: 예측 모델로 대체>>회귀/분류 모델을 이용해 결측값을 예측  결측치 처리 코드# 2) 결측치 제거 (결측이 하나라도 있으면 해당 행을 제거)df_drop = df.dropna()df_drop # 3) 평균값으로 대치df_mean = df.copy()df_mean = df_mean.fillna(d..

TIL 2025.03.14

TIL - 실무에 쓰는 머신러닝 기초 1-1

1. 머신러닝이란?컴퓨터가 인간의 개입없이 데이터를 학습해 패턴을 찾아내고, 새로운 데이터에 대해 예측이나 분류를 수행하는 기술 [3대요소]1. 데이터2. 알고리즘3. 컴퓨팅 파워 2. 역할 및 중요성 대규모 데이터를 빠르고 정확하게 분석하여, 복잡한 상관관계를 발견하고 예측 기존 방식으로는 처리하기 어려웠던 빅데이터 활용 가능 [다양한 산업분야에서의 활용] 1. 제조업예측 유지보수품질 관리생산 공정 최적화수요 예측에너지 효율 최적화2. 금융신용 평가위험 관리자산운용 및 투자전략고객 서비스 자동화보험 업무 고도화3. 마케팅고객 세분화 & 페르소나 도출추천 시스템마케팅 캠페인 성과 예측고객 생애 가치 예측4. 헬스케어 5. 자율주행 3. 머신러닝 VS 기존 통계 분석가설 검증 vs 예측 성능 통계 분석가..

TIL 2025.03.12

TIL - 실전 프로젝트

대시보드 import streamlit as stimport numpy as npimport pandas as pdimport datetime# Streamlit 대시보드 UI 설정st.markdown("✨ Chill & NASA RUL 예측 서비스 ✨", unsafe_allow_html=True)# 파일 업로드 기능uploaded_file = st.file_uploader("📂 CSV 파일을 업로드하세요", type=["csv"])if uploaded_file is not None: # 데이터 로드 df = pd.read_csv(uploaded_file) # 온도 및 컷오프 전압 선택 available_temps = df["ambient_temperature"].uniqu..

TIL 2025.03.07

TIL - 실전 프로젝트

제목 없는 프레젠테이션 - Google Slides 성능을 직관적으로 보여줄 수 있는 지표 EOL Rct 완충시 출력량 (추가 계산): 전압, 전류 발열량 (추가 계산) : (최대온도-실험실온도)/시간" data-og-host="docs.google.com" data-og-source-url="https://docs.google.com/presentation/d/1LZvagIqlCJazfs4Sxygo-o0HDf48tX1g9AKOrd_ec_c/edit#slide=id.g332e4ff30fd_0_43" data-og-url="https://docs.google.com/presentation/d/1LZvagIqlCJazfs4Sxygo-o0HDf48tX1g9AKOrd_ec_c/edit?usp=embed_face..

TIL 2025.03.06

TIL - 실전 프로젝트

온도별 방전 종료 전압 그룹 간의 SOH 차분값 차이를 검정 1. 상온일 때 [Kruskal-Wallis Test 결과 해석]Kruskal-Wallis Test statistic = 33.05, p-value = 6.64e-08p-value 즉, SOH 차분값이 방전 종료 전압에 따라 다르게 나타난다는 것을 의미 [사후검정]Dunn's Test (사후검정) 결과 (Bonferroni 보정 적용): 2.7 vs 2.5: p-value = 0.00115 2.7 vs 2.2: p-value = 0.08420 2.5 vs 2.2: p-value = 0.00000 1️⃣ 방전 종료 전압이 2.5V 이하로 낮아지면 SOH 감소율이 급격히 커짐 → 배터리 성능 유지 측면에서 2.7V 유지가 더 유리할 가능성이 큼2️..

TIL 2025.03.04