Overman

고정 헤더 영역

글 제목

메뉴 레이어

Overman

메뉴 리스트

  • 홈
  • 분류 전체보기 (92)
    • 맛집 (1)
    • 자격증 (1)
    • 영화 (1)
    • 프로그램 검증 (0)
    • 딥러닝 (21)
      • 자연어처리_학술대회 (9)
      • 데이터사이언스 (2)
      • 음성인식 (6)
      • Dacon (3)
      • 졸업프로젝트_챗봇파트 (1)
    • 알고리즘, 백엔드 (68)
      • 알고리즘, 자료구조 (14)
      • Django (1)
      • 기술 면접 대비 매일메일 (32)
      • FastAPI (6)
      • Economic discord bot 만들기 (4)
      • Serendi (11)
    • 오픈소스 (0)

검색 레이어

Overman

검색 영역

컨텐츠 검색

전체 글

  • [데이터 사이언스] 6. 예측 모델링 - 정보이론

    2025.05.27 by grizzly

  • [데이터 사이언스] 6. 예측 모델 설계 방법 (1) - 감독 세분화

    2025.05.27 by grizzly

  • [매일메일] REST란 무엇인가

    2025.04.29 by grizzly

  • [매일메일] 로드 밸런싱에 대해서 설명해주세요.

    2025.04.28 by grizzly

  • [프로젝트] 음성인식 프로젝트 #1 딥러닝 모델

    2025.04.17 by grizzly

  • [FastAPI] FastAPI 내부 코드 확인하기 (FastAPI 클래스 생성자 메소드 debug 인자)

    2025.04.17 by grizzly

  • [프로젝트] .gitignore과 requirement.txt 추가 및 docker 연동 (+로드 밸런싱 신기하다)

    2025.04.16 by grizzly

  • [FastAPI] (STT 기능 API 만들기)음성인식 데이터 처리 (WAV to PCM) #1

    2025.04.16 by grizzly

[데이터 사이언스] 6. 예측 모델링 - 정보이론

정보이론과 엔트로피- 2차 세계 대전 당시 클로드 새넌에 의해 발전- 불완전한 통신 채널을 통해 정보를 전송 시, 정보 전송의 효율을 최대화하기 위한 이론(엔트로피)을 개발 정보량 (Quantity of information, I)- 한 사건에서 기대되는 정보량을 어떻게 나타낼 수 있을 지를 생각- 정보량을 수량화하기 위하여 확률(P)과 정보량(I)을 다음의 두 확률 조건의 관점에서 살펴봄 조건 1 : 중요성 (significance)조건 2 : 가법성 (additivity)정보량- 중요성 조건은 어떤 사건의 확률이 높을수록, 이 사건으로부터 알려지는 정보량은 적어짐을 의미- 정보량은 확률 값을 역으로 취해서 얻을 수 있음정보량과 확률의 관점 해당 방식으로는 가법성의 조건이 충족되지 못함을 보인다. (곱..

딥러닝/데이터사이언스 2025. 5. 27. 15:30

[데이터 사이언스] 6. 예측 모델 설계 방법 (1) - 감독 세분화

예측 모델링에는 2가지 종류가 있음1. 분류 모델 (Classification model) - Categorical value 예측 (이진 분류, Y or N)2. 회귀 모델 (Regression model) - Numerical value 예측 (집값, 차값 등등) 설명 모델 : 값을 추정하기 위함이 아닌 어떤 현상이나 절차 전체적으로 알기 쉽게 설명하기 위함 감독 세분화 (Supervised Segmentation): 관심있는 특성 성질을 기준으로 전체 데이터를 그룹으로 나눔 (예측 모델링)ex) 계약 만료 후 해지할 가능성이 있는 고객은?ex) 어떤 고객이 지불 연체? Point1. 타깃 변수의 값을 예측하는 데에 있어, 주요한 영향을 미치는 속성을 찾아내는 일이 중요2. 타깃 변수를 기준으로 전체..

딥러닝/데이터사이언스 2025. 5. 27. 15:11

[매일메일] REST란 무엇인가

보통 Restful API라고 부르면서 API URI 설계를 하였다.그렇다면 내가 아는 REST란 무엇인가,HTTP 메서드GETPOSTPUTPATCHDELETE의 기능으로 나눠서 구현하며, URI에 명사 중심적으로 설계를 하는 것 일 것이다.이정도의 느낌으로만 알고 있다.정말 구체적인 REST란 어떤 것일까? 매일메일에서 말하는 REST란 다음과 같다.REST(Representational State Transfer) 는 자원의 표현을 이용하여 상태를 주고받는 것여기서의 자원이란, 소프트웨어가 관리하는 모든 것을 의미한다.REST는 네트워크 상에서 클라이언트와 서버의 통신 방식 중 하나이며, HTTP 프로토콜을 사용한다.구체적으로 HTTP URI를 활용하여 자원을 명시하고 HTTP METHOD를 통해 C..

알고리즘, 백엔드/기술 면접 대비 매일메일 2025. 4. 29. 13:08

[매일메일] 로드 밸런싱에 대해서 설명해주세요.

내가 아는 로드 밸런싱은 이런 내용이었다. 기존의 서버를 하나 사용한다고 가정하면, 해당 서버에 부하나 이런 것들이 몰릴 수 있다. (하나의 서버를 사용한다는 것이 애매할 수 있으니, 하나의 컴포넌트라고 표현)그래서 이러한 부분을 개선하려고 하는 노력이다. 도커를 사용한다는 가정 하에,기존의 경우 하나의 기능에 대해서 하나의 가상의 컴포넌트 위에 올리고 그 아래 서버가 들어가는 느낌이다.개선 방법은 nginx라는 웹 서버를 둔다.(3개의 컴포넌트를 사용한다고 가정)그리고 웹 서버에서 3개의 컴포넌트를 관리하도록 설계를 한다.nginx서버 port 1개와 3개의 컴포넌트는 각각의 port를 갖게 될 것이다. 이러한 상황에서 api는 nginx port에 접근하게 되고 nginx서버가 3개의 컴포넌트 por..

알고리즘, 백엔드/기술 면접 대비 매일메일 2025. 4. 28. 14:49

[프로젝트] 음성인식 프로젝트 #1 딥러닝 모델

STT(Sound To Text) 기능을 구현하기 위하여 모델 학습을 계획했다. 학교에서 지원해주는 사업단의 GPU 서버를 할당 받아 해당 서버에서 모델 학습 및 데이터 처리를 진행하는 것으로 계획하였다. GPU 서버의 스펙은 다음과 같다.환경- GPU : RTX 3090 1개- CUDA : 11.8- Python : 3.8- Pytorch : 2.4.1- 유저당 100GB 학습에 사용할 데이터 셋은 한국어 음성 데이터 셋으로 용량 72.04GB 짜리 AI HUB 데이터 셋이다. (https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=123) 여기서 하나 문제가 생긴 게 해당 데..

딥러닝/음성인식 2025. 4. 17. 17:40

[FastAPI] FastAPI 내부 코드 확인하기 (FastAPI 클래스 생성자 메소드 debug 인자)

보통 FastAPI의 문법을 보면from fastapi import FastAPIapp = FastAPI()이렇게 사용한다. 이렇게 인스턴스를 생성하기 이전에 FastAPI 클래스 자체는 어떤 형식과 구조를 가지고 있는지 궁금해졌다. class FastAPI(Starlette): def __init__( self: AppType, *, debug: Annotated[ bool, Doc( """ Boolean indicating if debug tracebacks should be returned on server errors. R..

알고리즘, 백엔드/FastAPI 2025. 4. 17. 15:52

[프로젝트] .gitignore과 requirement.txt 추가 및 docker 연동 (+로드 밸런싱 신기하다)

해당 내용은 [FastAPI] (STT 기능 API 만들기)음성인식 데이터 처리 (WAV to PCM) #1 과 이어진다. 보통 혼자 개발을 하여 따로 git 저장소에 대해서 생각을 안하였다. (그래도 .gitignore 파일을 까먹고 안올리지는 않았다.)이번에 실수로 .gitignore을 만들지 않고 local git에 commit 했는데 갑자기 7천 개 내용이 변동 사항으로 commit 되어서 순간 당황하였다.확인한 결과 .gitignore 을 추가하지 않았다.보통의 경우 가상환경(venv etc...)등에 대해서 설정과 관련된 코드 부분을 함께 작업하는 모두가 공유하지는 않는다. (하더라도 버전만 맞출 것이다.)그리하여 가상환경 전체를 push하는 것이 아닌 필요한 환경 설정의 경우 requirem..

딥러닝/음성인식 2025. 4. 16. 20:23

[FastAPI] (STT 기능 API 만들기)음성인식 데이터 처리 (WAV to PCM) #1

음성인식 프로젝트에서 sound 파일이 들어올 경우해당 데이터를 학습된 모델을 통하여 Text 데이터로 변하는 것을 Return해주는 API를 만들어야 한다. 이를 위해서Model 학습 시킨 후 해당 모델을 이용할 API를 Docker에 올리기전체 단위로 볼 경우 Sound file을 받아서 Text파일로 Return해주는 API 만들기이렇게 두 가지를 해야했다. 이 중 Whisper 파인튜닝을 통한 모델 학습을 먼저 하려 했으나 살짝 난항을 겪고 있어서 일단 구조를 먼저 만들기로 결심했다. 동작은 간단하다.# main.pyfrom fastapi import FastAPIimport uvicornimport osfrom app.connectAPI.routers.wav_to_pcm import router..

알고리즘, 백엔드/FastAPI 2025. 4. 16. 19:41

추가 정보

인기글

최신글

페이징

이전
1 ··· 3 4 5 6 7 8 9 ··· 12
다음
TISTORY
Overman © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바