llama - deptno/deptno.github.io GitHub Wiki
llama
- metaμ llama νμ΄μ§μμ downdoad url μμ²
- github.com μμ download.sh μ€ν
- email λ‘μ λ¬λ λ§ν¬ μ½μ
- llama.cpp clone
pip install -r requirements.txt
λ₯Ό νκ²λλ©΄ pytorch μ cuda λ²μ μλ¬ λ±μ
- λ°λ‘ μ€μΉ ν΄μ ν΄κ²°
- python convert.py [download λ°μ llama λͺ¨λΈ ν΄λ]
- optional
./quantize file.guff 2
- μμνλΌκ³ νλλ° f16 -> int8 λ‘ λ¬΄μΈκ°λ₯Ό λ³ννλ©΄μ 리μμ€ ν¨μ¨μ μμΉμν¨λ€
./main [guff_location.guff](/deptno/deptno.github.io/wiki/guff_location.guff) -p 'μ§μμ΄'
link