李梨的博客 | lili Blog

AI 架构

再见前后端分离！我用 AI 一个人“合围”了软件工程

再见前后端分离！我用 AI 一个人卷死了传统团队 —— 告别高昂的“沟通税”：一场关于超级个体的效率回归实验小时候读《三国演义》，开篇那句话总觉得气势磅礴：“天下大势，合久必分，分久必合。” 那时候以为这是写给帝王将相看的史诗。后来自己从全栈开发做到大型项目的PMO，又开始折腾属于自己的 AI 工作室，才在无数个联调到吐血的深夜恍然大悟——罗贯中这老头，分明是个看透了系统架构的顶级程序...

Posted by lili Blog on May 13, 2026 · 7 min

AI ComfyUI FastAPI

🚀 实战进阶：将 ComfyUI 封装为 AI 视频生成网站 (FastAPI + WebUI)

10行代码把万兴2.1变公司内网专属视频MidJourney，同事再也不半夜@我了

🚀 实战进阶：将 ComfyUI 封装为 AI 视频生成网站 (FastAPI + WebUI) 背景：在上一篇文章中，我们已经在 Ubuntu 服务器 (RTX 4090) 上成功部署了 ComfyUI 并跑通了 Wan2.1 文生视频工作流。但 ComfyUI 原生界面太复杂，不适合直接丢给最终用户使用。目标：我们要构建一个“业务网关”，包含：后端 (FastAPI...

Posted by lili on October 20, 2025 · 53 min

AI ComfyUI

🚀 实战入门：在服务器单卡部署 ComfyUI + Wan2.1 文生视频最佳实践

30分钟4090跑通Wan2.1，公司新媒体同事从此告别烧钱闭源工具

🚀 实战入门：在服务器单卡部署 ComfyUI + Wan2.1 文生视频最佳实践背景：公司新媒体同事用闭源工具烧钱烧到财务报警，素材还往外网扔，老板直接放话：“本地化，自己搞一个能文生视频的。” 目标：在一台全新的 Ubuntu 服务器上，“傻瓜式”地部署 ComfyUI，用于 Wan2.1 文生视频 (T2V)。核心原则：环境隔离：绝不污染系统 Python，使...

Posted by lili on October 10, 2025 · 17 min

AI OCR

🚀 实战部署：单卡4090跑通DeepSeek-OCR本地WebUI

单卡RTX 4090跑通DeepSeek-OCR本地WebUI，6大血坑实录+一键启动

🚀 实战部署：单卡4090跑通DeepSeek-OCR本地WebUI 大家好！我是李梨。最近，我们想在本地的 4090 服务器上部署大名鼎鼎的 DeepSeek-OCR 模型，搭建一个内部的 WebUI 测试服务。我是个“小白”，本以为会很顺利，结果一路上遇到了各种“拦路虎”。这篇文章就是把我们从 0 到 1 成功运行的完整步骤，以及（更重要的）所有报错和解决方案，原汁原味地记录下...

Posted by lili on October 1, 2025 · 14 min

AI FastAPI

队长别开枪！Java硬接AI模型当场暴毙，我用这套方案救回了项目

一个 AI 工程师的“吐槽”，以及 Java 与 Python“异地恋”的正确姿势

队长别开枪！Java硬接AI模型当场暴毙，我用这套方案救回了项目一个 AI 工程师的“吐槽”，以及 Java 与 Python“异地恋”的正确姿势大家好，我是、小李。最近我们团队春风得意，老板“王总”开完会回来，红光满面地拍着我的肩膀说：“小李啊，最近 AI 很火，你给咱们的 RuoYi 框架也整上！就那个，文生视频！明天能上线不？” 我（面带微笑，内心 M**）：”王总…这…...

Posted by lili on September 1, 2025 · 12 min

AI 学习笔记 OCR

高效 PDF 解析利器：MinerU 实战避坑与高精度调优指南

解决环境冲突、搞定扫描件表格，一份给开发者的 MinerU 最佳实践

高效 PDF 解析利器：MinerU 实战避坑与高精度调优指南在处理海量 PDF 文档（尤其是扫描件、统计年鉴或古籍方志）时，如何精准提取其中的文本和表格数据一直是个痛点。最近在服务器上部署并深入使用了 MinerU，这是一款强大的开源 PDF 提取工具。在使用过程中，从环境配置到参数调优，我总结了一套“最佳实践”。本文将分享如何规避常见的环境坑，以及如何通过参数组合实现最高精度的中...

Posted by lili on August 20, 2025 · 6 min

AI 运维

我刚拿到了8卡GPU服务器的钥匙，现在我慌得一批……”

8×4090「合租公寓」生存法则：不被同事顺着网线打死的正确姿

我刚拿到了8卡GPU服务器的钥匙，现在我慌得一批…… 一个“小白”的GPU服务器“踩坑”与“爬坑”指南朋友们，就在今天，我的人生（职业生涯）达到了一个小高峰。我拿到了团队一台全新8卡GPU服务器（8 x RTX 4090）的ssh登录权限。我的第一反应是：“不就是一台CPU核多一点、内存大一点的Linux服务器吗？ssh连上去，htop跑起来，我就是这台机器的王！” 然而，当...

Posted by lili on August 1, 2025 · 9 min

AI

玩转Dify：三步设置，让你的AI从“智障”变“专家”

玩转Dify知识库

玩转Dify：三步设置，让你的AI从“智障”变“专家” 你是否遇到过这样的情况：明明把文件喂给了 AI，但它的回答总是不尽人意，要么答非所问，要么信息不全？别急，问题通常不出在模型本身，而在于我们“喂”给它知识的方式。今天，我们就用大白话聊聊 Dify 知识库背后最重要的技术——文本分段（Chunking）。我们将从基础的“通用模式”讲起，再深入到效果拔群的“父子模式”，让你彻底掌握如...

Posted by lili on April 10, 2025 · 7 min

AI 代码生成

如何度量代码生成大模型的准确性？

代码生成大模型

如何度量代码生成大模型的准确性？项目背景在公司内网部署StarCoder-1B大模型已经半月有余了，在考虑继续优化升级StarCoder-7B模型的同时，一个重要的问题出现了。在实际生产开发中，我们应该如何评估代码生成大模型的准确性？是从10亿到70亿参数越多就越好吗？还是看论文测试说哪个模型好就一定更好？用数据说话！评估指标插件的下载数量—-普及度 ...

Posted by lili on April 10, 2024 · 10 min

AI 代码生成学习笔记

二次开发tabby插件

二次开发tabby插件以下同时包含idea和vscode教程。 1、tabby架构 Tabby的架构由多个crate（模块）组成，主要包括： crates/tabby：处理核心功能和HTTP API。 crates/tabby-download：从互联网获取模型。 crates/tabby-inference：用于LLM推理的功能和工具。 crates/tabby...

Posted by lili on March 20, 2024 · 19 min

lili Blog

再见前后端分离！我用 AI 一个人“合围”了软件工程

🚀 实战进阶：将 ComfyUI 封装为 AI 视频生成网站 (FastAPI + WebUI)

10行代码把万兴2.1变公司内网专属视频MidJourney，同事再也不半夜@我了

🚀 实战入门：在服务器单卡部署 ComfyUI + Wan2.1 文生视频最佳实践

30分钟4090跑通Wan2.1，公司新媒体同事从此告别烧钱闭源工具

🚀 实战部署：单卡4090跑通DeepSeek-OCR本地WebUI

单卡RTX 4090跑通DeepSeek-OCR本地WebUI，6大血坑实录+一键启动

队长别开枪！Java硬接AI模型当场暴毙，我用这套方案救回了项目

一个 AI 工程师的“吐槽”，以及 Java 与 Python“异地恋”的正确姿势

高效 PDF 解析利器：MinerU 实战避坑与高精度调优指南

解决环境冲突、搞定扫描件表格，一份给开发者的 MinerU 最佳实践

我刚拿到了8卡GPU服务器的钥匙，现在我慌得一批……”

8×4090「合租公寓」生存法则：不被同事顺着网线打死的正确姿

玩转Dify：三步设置，让你的AI从“智障”变“专家”

玩转Dify知识库

如何度量代码生成大模型的准确性？

代码生成大模型

二次开发tabby插件

二次开发tabby插件

FEATURED TAGS

ABOUT ME

FRIENDS