『비전공자도 이해할 수 있는 챗GPT』,
『비전공자도 이해할 수 있는 AI 지식』
10만 베스트셀러를 기록한
세상에서 가장 이해하기 쉬운 챗GPT 교양서

HOME » WIKI » llama3.np

llama3.np

속도

stories15M:

  • M2 MacBook Air, CPU: 28 tokens/s
  • 4080 SUPER, CPU(NumPy): 42 tokens/s
  • 4080 SUPER, GPU(CuPy): 86 tokens/s

stories110M:

  • M2 MacBook Air, CPU: 3 tokens/s
  • 4080 SUPER, CPU(NumPy): 4 tokens/s
  • 4080 SUPER, GPU(CuPy): 21 tokens/s

meta-llama/Meta-Llama-3-8B:
npz 파일 크기가 15G에 달한다. GPU는 Out of Memory로 실행되지 않고, CPU는 속도 측정이 의미 없을 정도로 실행된다(약 0.1tok/s). 설정은 다음과 같다:

dim: int                    = 4096
n_layers: int               = 32
n_heads: int                = 32
n_kv_heads: Optional[int]   = 8
max_seq_len: int            = 8192

kv가 \(\frac{1}{4}\) 크기다.

Last Modified: 2024/10/29 18:57:35
자바 알고리즘 인터뷰 파이썬 알고리즘 인터뷰

카카오 코딩 테스트 출제위원이 직접 집필한,
리트코드(LeetCode) 문제로 풀어보는,
구글, 마이크로소프트, 네이버, 카카오
코딩 테스트 완벽 가이드
『자바 알고리즘 인터뷰』,
『파이썬 알고리즘 인터뷰』

이 사이트의 운영 비용을 후원할 수 있으며, 후원자에게 혜택을 제공할 예정입니다.

© 2000 - Sang Park Except where otherwise noted, content on this site is licensed under a CC BY-NC 4.0.
This site design was brought from Distill. Logo and wiki background image was brought from Bear.