Ollama本地大模型运行指南

📅 2025-01-25 ⏱ 阅读约10分钟 简单 本地模型
广告位 - 百度联盟

一、安装Ollama

1.1 Windows安装

前往Ollama官网下载Windows安装包:

# 访问官网下载
# https://ollama.com/download

# 或使用winget安装
winget install Ollama.Ollama

1.2 macOS安装

# 使用Homebrew安装
brew install ollama

1.3 Linux安装

curl -fsSL https://ollama.com/install.sh | sh
💡 提示:安装完成后,Ollama会以后台服务形式运行。Windows用户可以在系统托盘找到Ollama图标。

二、运行模型

2.1 Llama 3

# 下载并运行Llama 3(8B参数)
ollama run llama3

# 下载并运行Llama 3(70B参数,需要更强硬件)
ollama run llama3:70b

2.2 Qwen2.5

# 运行Qwen2.5 7B(推荐中文用户)
ollama run qwen2.5:7b

# 运行Qwen2.5 72B(效果更好,需高端显卡)
ollama run qwen2.5:72b

2.3 Mistral

# 运行Mistral 7B
ollama run mistral

三、常用命令

命令说明
ollama run <model>运行指定模型
ollama list列出已下载的模型
ollama pull <model>下载模型(不运行)
ollama rm <model>删除已下载的模型
ollama ps查看正在运行的模型
ollama serve启动API服务

四、硬件要求参考

模型参数量最低内存推荐GPU显存
Qwen2.5 3B3B4GB4GB
Llama3 8B8B8GB8GB
Qwen2.5 7B7B8GB8GB
Mistral 7B7B8GB8GB
Qwen2.5 32B32B24GB24GB
Llama3 70B70B48GB48GB(多卡)
⚠️ 注意:没有独立GPU也可以使用CPU运行,但速度会明显变慢。建议至少使用16GB内存的电脑来运行7B级别的模型。
广告位 - 百度联盟