본문 바로가기

AI15

Information Retrieval 대회 RAG에 대해 배우고 실험해보는 좋은 기회였다. 이제 시작인 것....! 2024. 7. 5.
Bert모델 Fine-tuning: Single Sentence Classification Task 모델에 입력되는 단일 문장의 종류를 분류하는 문제Task에 대해 모델을 평가하기 위한 데이터셋으로 CoLA (The Corpus of Linguisic Acceptability)를 사용CoLA는 문장마다 문법적으로 올바르거나 잘못된 것으로 레이블이 지정된 데이터평가지표는 Matthews correlation을 사용 하나씩 손코딩으로 따라 쳐보았다(소소한 오타때문에 에러남 ㅠㅠ) 눈으로만 봤을때는 이해한 줄 알고 그냥 지나쳤었는데 실제로 하나씩 타이핑해보니 모르는 부분이 많았고모르는 내용을 검색해가며 정리했다.  작성하고 나서 코드가 복잡해서 엑셀로 정리해 보았다(다이어그램을 그리려니 시간이 너무 오래걸림...) 엑셀로 모든 함수와 변수를 정리해보니 흐름이 이해가 되었다. 예를 들어, prepare_dat.. 2024. 5. 30.
NLP 경진대회: 한국어 대화 요약 task 2024. 5. 30.
Computer Vision 경진대회 1. Competiton InfoOverviewDocument Type Classification: 17 종류의 문서 이미지의 클래스를 예측TimelineStart Date: 2024-04-11Final submission: 2024-04-232. ComponentsDirectory├── configs│ ├── architecture│ ├── callbacks│ ├── dataset│ ├── hydra│ ├── logger│ ├── trainer│ ├── tuner│ ├── huggingface.yaml│ ├── multimodal.yaml│ └── timm.yaml├── src│ ├── architecture│ ├── datasets│ ├── pipelin.. 2024. 4. 26.
(2024-04-05) Backbone 이해하기: AlexNet, VGG AlexNet: CNN 모델의 시초. 여러개의 구조를 가진 CNN AlexNet의 구조 입력으로 24243 크기의 피처맵 1개 필터당: 11113개의 파라미터 + 1개의 bias 위 연산을 총 96번 반복 → 첫 레이어에서 벌써 약 3.5만개의 파라미터 Conv Layer: 원하는 수 만큼의 필터를 사용하여 원하는 수 만큼의 채널을 출력할 수 있음 Pooling Layer: 각 채널별로 독립적인 풀링연산 적용 → 입력채널의 수 = 출력채널의 수 학습가능한 파라미터: 0개 Normalization: 여러 값들을 일정한 범위 내에 고정 Lateral Inhibition현상(강하게 활성화된 뉴런이 다른 뉴런의 값을 억제하는 현상)으로 인해 normalization 필요(강하게 활성화된 뉴런의 값과 주변 뉴런들.. 2024. 4. 5.
2024 AI Stages : ML Competition_House Price Prediction 1. Competiton Info Overview House Price Prediction 주어진 데이터를 활용하여 서울의 아파트 실거래가를 효과적으로 예측하는 모델을 개발하는 경진대회 Timeline March 21, 2024 - Start Date April 1, 2024 - Final submission deadline Evaluation RMSE(Root Mean Squared Error) 2. Components Directory Models 3. Data descrption 대회에서 제공된 데이터셋을 기반으로 모델을 학습하고, 서울시 각 지역의 아파트 매매 실거래가를 예측 Dataset overview 제공된 데이터셋 국토교통부에서 제공하는 아파트 실거래가 데이터 : 위치, 크기, 건축년도, .. 2024. 4. 3.
반응형