아기여우의 자기계발로그

  • AI
  • 개발
  • 독서
  • 코딩

AI/Algorithm&Models 41

자연어 생성에서의 Beam Search / 파이썬으로 Beam Search 구현하기

자연어 생성 모델 자연어 생성은 단어들의 시퀀스를 아웃풋으로 예측해내는 태스크이다. 일반적으로 생성 모델은 각각의 디코딩 타임 스텝에서 전체 단어 사전에 대한 확률 분포를 예측한다. 따라서 실제로 단어를 생성해내기 위해서는 모델의 예측 확률 분포를 이용해 각 타임스탭의 단어로 변환하는 과정이 필요하다. 아래 그림은 Image Captioning 태스크에서 모델이 4개의 타임 스텝 동안 생성한 확률 분포를 나타낸 예시이다. 첫 번째에서는 V차원의 단어 사전에 대해 '고양이' 토큰의 확률 값이 가장 높은 softmax 값을 예측했고, 마지막 타임 스텝에서는 문장 종료를 나타내는 '' 토큰에 대한 값이 가장 높은 확률분포를 예측한 것을 볼 수 있다. 이제, 위와 같이 모델이 예측한 확률 분포에 대해 디코딩하기..

AI/Algorithm&Models 2020.02.23
이전
1 2 3 4 5
다음
더보기
프로필사진

아기여우의 자기계발로그

독서, 재테크, 언어/ 시사 공부, 코딩 욕심 많은 직장인의 자기계발 일기장

  • 분류 전체보기 (121)
    • AI (59)
      • Algorithm&Models (41)
      • Deep Learning Basic (3)
      • DL Frameworks (12)
      • Seminar & Conference (2)
      • Others (1)
    • LLM (25)
      • Algorithm&Models (8)
      • LLM Customization (6)
      • LLM Evaluation (6)
      • Proprietary LLM & Services (5)
    • Others (31)
      • Books (14)
      • Coding (9)
      • Language (8)

Tag

NLU, NLG, 경량화, 자연어생성, fine-tuning, post-training, 독서, polm, ChatGPT, Ai, OpenAI, nlp, 5분딥러닝, LLM, TensorFlow, 5분시사, 딥러닝, 논문리뷰, English, 자연어처리,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 🌸 WELCOME 🌸

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/08   »
일 월 화 수 목 금 토
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바