#LLM#部署#vLLM#llama.cpp#Ollama
LLM 推理框架选型与部署实战
对比 vLLM、llama.cpp、Ollama 等主流推理框架,分享实际部署经验和性能优化方案。
Technical Articles
Thoughts, tutorials, and insights on technology and design.
对比 vLLM、llama.cpp、Ollama 等主流推理框架,分享实际部署经验和性能优化方案。
DPXX Chat 是轻量级对话 AI Web 产品,定位为 LobeHub 的轻量替代方案,面向小团队自托管部署。
DPXX(东品西选)全球品牌门户,AI 驱动的跨境电商全链路平台,支持中英双语。
沉淀可复用 Agent 技能、协作规范和项目执行经验,覆盖内容生成、跨境电商数据获取、UI 设计三大领域。
整理上传体积限制、uploads alias、构建后静态文件 404 和证书重启问题,避免重复踩坑。
记录短剧、漫画视频、ComfyUI 工作流和 GPU 方案的组合路线,探索 AI 内容生产的新可能。
定义 Agent 参与产品开发、提交审核、权限边界和版本治理的工作法,确保 AI Agent 在可控范围内协作。
记录 Next.js 项目在 systemd、Nginx、证书和数据库路径上的部署经验,包括常见坑和解决方案。
DPXX Image 是面向团队的 AI 生图工作台,支持提示词管理、生图任务提交和积分管理。