아기여우의 자기계발로그

  • AI
  • 개발
  • 독서
  • 코딩

muli-modal 1

[논문리뷰] DALL-E: Zero-Shot Text-to-Image Generation

너무너무 궁금했던 DALL-E 페이퍼가 공개되었어요 두근두근❤ 사상은 예상했던 대로 텍스트와 이미지를 하나의 스트림 (concat)으로 트랜스포머에 밀어 넣는다는 것 이때 denoising VAE를 사용하여 픽셀 단위의 이미지를 이미지 토큰으로 변환해 사용했다고 한다. 이번 논문 역시 #대용량데이터와 #대규모모델이 핵심 키워드였는데, large-scale 모델 학습을 위한 16-bit 학습, distributed optimization 등 다양한 노하우가 녹아있다. 논문: arxiv.org/pdf/2102.12092.pdf 깃헙: github.com/lucidrains/DALLE-pytorch Abstract 본 논문에서는 하나의 데이터 소스로부터 transformer를 활용하여 text-to-image..

AI/Algorithm&Models 2021.03.13
이전
1
다음
더보기
프로필사진

아기여우의 자기계발로그

독서, 재테크, 언어/ 시사 공부, 코딩 욕심 많은 직장인의 자기계발 일기장

  • 분류 전체보기 (121)
    • AI (59)
      • Algorithm&Models (41)
      • Deep Learning Basic (3)
      • DL Frameworks (12)
      • Seminar & Conference (2)
      • Others (1)
    • LLM (25)
      • Algorithm&Models (8)
      • LLM Customization (6)
      • LLM Evaluation (6)
      • Proprietary LLM & Services (5)
    • Others (31)
      • Books (14)
      • Coding (9)
      • Language (8)

Tag

NLU, OpenAI, Ai, 논문리뷰, 자연어처리, ChatGPT, 독서, 5분딥러닝, 딥러닝, English, polm, TensorFlow, NLG, 자연어생성, fine-tuning, nlp, post-training, 5분시사, LLM, 경량화,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

  • 🌸 WELCOME 🌸

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바