跳到正文

lili Blog

「离开世界之前 一切都是过程」

再见前后端分离!我用 AI 一个人“合围”了软件工程

再见前后端分离!我用 AI 一个人卷死了传统团队 —— 告别高昂的“沟通税”:一场关于超级个体的效率回归实验 小时候读《三国演义》,开篇那句话总觉得气势磅礴:“天下大势,合久必分,分久必合。” 那时候以为这是写给帝王将相看的史诗。后来自己从全栈开发做到大型项目的PMO,又开始折腾属于自己的 AI 工作室,才在无数个联调到吐血的深夜恍然大悟——罗贯中这老头,分明是个看透了系统架构的顶级程序...

🚀 实战进阶:将 ComfyUI 封装为 AI 视频生成网站 (FastAPI + WebUI)

10行代码把万兴2.1变公司内网专属视频MidJourney,同事再也不半夜@我了

🚀 实战进阶:将 ComfyUI 封装为 AI 视频生成网站 (FastAPI + WebUI) 背景: 在上一篇文章中,我们已经在 Ubuntu 服务器 (RTX 4090) 上成功部署了 ComfyUI 并跑通了 Wan2.1 文生视频工作流。 但 ComfyUI 原生界面太复杂,不适合直接丢给最终用户使用。 目标: 我们要构建一个“业务网关”,包含: 后端 (FastAPI...

🚀 实战入门:在服务器单卡部署 ComfyUI + Wan2.1 文生视频最佳实践

30分钟4090跑通Wan2.1,公司新媒体同事从此告别烧钱闭源工具

🚀 实战入门:在服务器单卡部署 ComfyUI + Wan2.1 文生视频最佳实践 背景: 公司新媒体同事用闭源工具烧钱烧到财务报警,素材还往外网扔,老板直接放话:“本地化,自己搞一个能文生视频的。” 目标: 在一台全新的 Ubuntu 服务器上,“傻瓜式”地部署 ComfyUI,用于 Wan2.1 文生视频 (T2V)。 核心原则: 环境隔离: 绝不污染系统 Python,使...

🚀 实战部署:单卡4090跑通DeepSeek-OCR本地WebUI

单卡RTX 4090跑通DeepSeek-OCR本地WebUI,6大血坑实录+一键启动

🚀 实战部署:单卡4090跑通DeepSeek-OCR本地WebUI 大家好!我是李梨。 最近,我们想在本地的 4090 服务器上部署大名鼎鼎的 DeepSeek-OCR 模型,搭建一个内部的 WebUI 测试服务。我是个“小白”,本以为会很顺利,结果一路上遇到了各种“拦路虎”。 这篇文章就是把我们从 0 到 1 成功运行的完整步骤,以及(更重要的)所有报错和解决方案,原汁原味地记录下...

队长别开枪!Java硬接AI模型当场暴毙,我用这套方案救回了项目

一个 AI 工程师的“吐槽”,以及 Java 与 Python“异地恋”的正确姿势

队长别开枪!Java硬接AI模型当场暴毙,我用这套方案救回了项目 一个 AI 工程师的“吐槽”,以及 Java 与 Python“异地恋”的正确姿势 大家好,我是、小李。 最近我们团队春风得意,老板“王总”开完会回来,红光满面地拍着我的肩膀说:“小李啊,最近 AI 很火,你给咱们的 RuoYi 框架也整上!就那个,文生视频!明天能上线不?” 我(面带微笑,内心 M**):”王总…这…...

高效 PDF 解析利器:MinerU 实战避坑与高精度调优指南

解决环境冲突、搞定扫描件表格,一份给开发者的 MinerU 最佳实践

高效 PDF 解析利器:MinerU 实战避坑与高精度调优指南 在处理海量 PDF 文档(尤其是扫描件、统计年鉴或古籍方志)时,如何精准提取其中的文本和表格数据一直是个痛点。最近在服务器上部署并深入使用了 MinerU,这是一款强大的开源 PDF 提取工具。 在使用过程中,从环境配置到参数调优,我总结了一套“最佳实践”。本文将分享如何规避常见的环境坑,以及如何通过参数组合实现最高精度的中...

我刚拿到了8卡GPU服务器的钥匙,现在我慌得一批……”

8×4090「合租公寓」生存法则:不被同事顺着网线打死的正确姿

我刚拿到了8卡GPU服务器的钥匙,现在我慌得一批…… 一个“小白”的GPU服务器“踩坑”与“爬坑”指南 朋友们,就在今天,我的人生(职业生涯)达到了一个小高峰。 我拿到了团队一台全新8卡GPU服务器(8 x RTX 4090)的ssh登录权限。 我的第一反应是:“不就是一台CPU核多一点、内存大一点的Linux服务器吗?ssh连上去,htop跑起来,我就是这台机器的王!” 然而,当...

玩转Dify:三步设置,让你的AI从“智障”变“专家”

玩转Dify知识库

玩转Dify:三步设置,让你的AI从“智障”变“专家” 你是否遇到过这样的情况:明明把文件喂给了 AI,但它的回答总是不尽人意,要么答非所问,要么信息不全?别急,问题通常不出在模型本身,而在于我们“喂”给它知识的方式。 今天,我们就用大白话聊聊 Dify 知识库背后最重要的技术——文本分段(Chunking)。我们将从基础的“通用模式”讲起,再深入到效果拔群的“父子模式”,让你彻底掌握如...

如何度量代码生成大模型的准确性?

代码生成大模型

如何度量代码生成大模型的准确性? 项目背景 在公司内网部署StarCoder-1B大模型已经半月有余了,在考虑继续优化升级StarCoder-7B模型的同时,一个重要的问题出现了。 在实际生产开发中,我们应该如何评估代码生成大模型的准确性?是从10亿到70亿参数越多就越好吗?还是看论文测试说哪个模型好就一定更好? 用数据说话! 评估指标 插件的下载数量—-普及度 ...

二次开发tabby插件

二次开发tabby插件

二次开发tabby插件 以下同时包含idea和vscode教程。 1、tabby架构 Tabby的架构由多个crate(模块)组成,主要包括: crates/tabby:处理核心功能和HTTP API。 crates/tabby-download:从互联网获取模型。 crates/tabby-inference:用于LLM推理的功能和工具。 crates/tabby...