CStory

  • 홈
  • 태그
  • 방명록

GPT 1

GPT-1 간단하게 알아보기

GPT-1 Open AI에서 개발한 모델로 다양한 자연어처리 task를 처리할 수 있는 통합된 모델이 중요한 특징이다. 모델 구조와 학습 방식 우선 Text를 position 임베딩을 더한다. self-attention 블럭을 12개 쌓는다. Text Prediction : 첫 단어부터 다음 단어까지 순차적으로 예측하는 모델이다. 동시에 모델의 큰 변형없이 classification도 수행하기 위해 Text Classifier에 Extract 벡터를 최종 output layer에 전달하도록 한다. Classification이 외에 Entailment, Similarity, Multiple Choice와 같이 다른 task에도 사용가능하다. 다른 task의 transfer learning에 활용하고 싶다면..

AI/NLP 2023.12.25
이전
1
다음
더보기
프로필사진

CStory

  • Menu (102)
    • Cloud (15)
      • OS (1)
      • AWS (2)
      • DataBase (1)
      • Network (5)
      • Docker (2)
      • Kubernetes (4)
    • Data Engineering (42)
      • Distributed System (14)
      • Observability (8)
      • Server (5)
      • JAVA (1)
      • Hadoop (9)
      • Kafka (3)
    • MLOps (3)
    • AI (36)
      • CV (5)
      • NLP (9)
      • ML (13)
      • MultiModal (1)
    • Web (0)
    • TroubleShooting (5)

Tag

Kibana, NLP, 도커, 분산시스템, HDFS, Hadoop, dns, Prometheus, OpenSearch, fluentd, LOG, docker, grafana, efk, kubernetes, k8s, Elasticsearch, 하둡, observability, AWS,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Copyright © Kakao Corp. All rights reserved.

티스토리툴바