Overman

고정 헤더 영역

글 제목

메뉴 레이어

Overman

메뉴 리스트

  • 홈
  • 분류 전체보기 (52)
    • 자연어처리 (7)
    • 알고리즘, 자료구조 (14)
    • Django (1)
    • Economic discord bot 만들기 (4)
    • 기술 면접 대비 매일메일 (11)
    • 데이터사이언스 (2)
    • 음성인식 (6)
    • FastAPI (6)
    • 맛집 (1)

검색 레이어

Overman

검색 영역

컨텐츠 검색

데이터사이언스

  • [데이터 사이언스] 6. 예측 모델링 - 정보이론

    2025.05.27 by grizzly

  • [데이터 사이언스] 6. 예측 모델 설계 방법 (1) - 감독 세분화

    2025.05.27 by grizzly

[데이터 사이언스] 6. 예측 모델링 - 정보이론

정보이론과 엔트로피- 2차 세계 대전 당시 클로드 새넌에 의해 발전- 불완전한 통신 채널을 통해 정보를 전송 시, 정보 전송의 효율을 최대화하기 위한 이론(엔트로피)을 개발 정보량 (Quantity of information, I)- 한 사건에서 기대되는 정보량을 어떻게 나타낼 수 있을 지를 생각- 정보량을 수량화하기 위하여 확률(P)과 정보량(I)을 다음의 두 확률 조건의 관점에서 살펴봄 조건 1 : 중요성 (significance)조건 2 : 가법성 (additivity)정보량- 중요성 조건은 어떤 사건의 확률이 높을수록, 이 사건으로부터 알려지는 정보량은 적어짐을 의미- 정보량은 확률 값을 역으로 취해서 얻을 수 있음정보량과 확률의 관점 해당 방식으로는 가법성의 조건이 충족되지 못함을 보인다. (곱..

데이터사이언스 2025. 5. 27. 15:30

[데이터 사이언스] 6. 예측 모델 설계 방법 (1) - 감독 세분화

예측 모델링에는 2가지 종류가 있음1. 분류 모델 (Classification model) - Categorical value 예측 (이진 분류, Y or N)2. 회귀 모델 (Regression model) - Numerical value 예측 (집값, 차값 등등) 설명 모델 : 값을 추정하기 위함이 아닌 어떤 현상이나 절차 전체적으로 알기 쉽게 설명하기 위함 감독 세분화 (Supervised Segmentation): 관심있는 특성 성질을 기준으로 전체 데이터를 그룹으로 나눔 (예측 모델링)ex) 계약 만료 후 해지할 가능성이 있는 고객은?ex) 어떤 고객이 지불 연체? Point1. 타깃 변수의 값을 예측하는 데에 있어, 주요한 영향을 미치는 속성을 찾아내는 일이 중요2. 타깃 변수를 기준으로 전체..

데이터사이언스 2025. 5. 27. 15:11

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
Overman © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바