Home - Shinichi0713/LLM-fundamental-study GitHub Wiki
Welcome to the llm-trials wiki!
-
基礎技術関係
ModernBERT
Positional Encoding
Transformer言語モデルを内部挙動から理解
マルチヘッドアテンション
Flash Attention
MLOpsMLOps(Machine Learning Operations)
拡散モデル
知識蒸留とは
transformerのエンコーダ
MLPとは
ロス関数
複数モデルを結合したモデルから、単体モデルを抽出する
[埋め込み表現の精度評価のベンチマーク](https://jedworkshop.github.io/JLR2024/materials/[b-3.pdf](https://jedworkshop.github.io/JLR2024/materials/b-3.pdf)