AI‐Agent - wlshiu/my_note GitHub Wiki
LLM Module
量化版本(Quantization): 建議選擇名為 q4_k_m 或簡稱 q4 的版本,這是效能與體積的最佳平衡
-
極輕量級
1B ~ 3B適合 CPU 運行或筆電節能模式
- Phi-3.5 Mini (3.8B): 微軟最強小模型, 推理效率高
- Qwen2.5 0.5B/1.5B: 極快, 適合簡單的文字生成
-
綜合能力強、入門首選
7B ~ 9B適合一般電腦、筆電(8GB-16GB RAM),速度快,語境理解能力佳
- Llama 3.1 8B Instruct: Meta 的主力模型, 通用能力最平衡, 支援 128K 超長上下文
- Llama-3-Taiwan: 第一個開源台灣繁體中文LLM, 基於
Meta/Llama 系列的微調模型 - Llama-3.2-Taiwan-3B-Instruct
- Qwen2.5 7B (Instruct): 阿里巴巴出品, 中文能力最強, 且在程式碼和邏輯推理方面表現優異
- Gemma 2 9B: Google 新架構, 在記憶體使用與推理效能上優化良好
- DeepSeek-R1-Distill-Qwen-7B/8B: 推理與程式能力優異
- CodeLlama: 對 Python/C++/Java 等語言有超高精度,尤其擅長大型專案
- DeepSeek-Coder: 記憶體效率高,適合處理長程式碼或多檔案專案
- Qwen 2.5 Coder: 輕量級多語言程式設計任務,快速程式碼補全,對中文程式文件產生友好
- StarCoder2: 腳本編寫能力強
-
推理、複雜任務與程式碼
14B ~ 32B+適合有高階顯示卡 (12GB VRAM 以上) 的工作站
- Qwen3-32B / Qwen2.5-72B (量化版): 中文語境與複雜任務最強。
- DeepSeek-R1 (14B/32B+): 強大的推理模型, 特別適合邏輯推理與困難問題
- Mistral-Nemo-12B: 指令遵循能力強
- WizardLM-2 (7B/8x22B): 微軟發布, 在複雜聊天、多語言和推理任務上非常出色
- GPT-OSS 20B: 高階推理、工具呼叫、AI Agent工作流程、GPT-4 層次的效能
- DeepSeek V3.2-Exp: 高階推理能力、思考模式、數學問題解決能力、程式碼分析能力
OpenClaw
-
*OpenClaw + LM Studio Tutorial: Free Local AI Setup (No OpenAI/Gemini/Claude) - YouTube
-
*Openclaw 本地安装 Windows 快速部署深度详细全程演示 超强爆火个人 AI 助理(原 clowdbot moltbot) - YouTube
-
如何在Windows安裝 OpenClaw 龍蝦AI代理人(Gemini + Telegram + WSL) · Ivon的部落格
-
别再用 Ollama 了!OpenClaw 秒级响应方案(vLLM + 本地模型)完全免费!| 零度解说 - YouTube
-
Tools
-
Skills
-
troubleshooting
VM Linux
NotebookLM
-
Key words
- 在問題裡加上具體、數據、建議、差異這類關鍵字,AI 就知道你要詳細資訊,不是敷衍的摘要。
-
-
懶人必學!4 招教你無腦生成神級 Prompt,不用再抄別人的懶人包也能打造專屬提示語,AI 從此聽懂你每句話、自動生成完美答案!|泛科學院 - YouTube
Ollama
- AI 文獻處理實戰
- 实验 | 使用本地大模型从论文PDF中提取结构化信息 | 大邓和他的PYTHON