Python uv 简明教程
告别依赖地狱:用 uv 重塑你的 Python 开发体验
如果你长期使用 Python,一定对下面这些场景不陌生:
创建一个新项目,pip install 了几个包,忽然发现版本冲突,陷入无尽的 pip install 和 pip uninstall 循环。
项目依赖文件 requirements.txt 越来越大,分不清哪些是核心依赖,哪些是依赖的依赖。
想尝试新工具 poetry ...
数据分析师的“水晶球”:时间序列分析
很多刚入行的小伙伴问我:“我想预测下个月公司的销售额,或者预测一下明天的股价,该学什么?”
我的回答通常只有六个字:时间序列分析。
如果在数据分析的世界里有一种魔法能让你“预知未来”,那一定就是它。
1. 什么是时间序列?
别被名词吓到了。简单来说,时间序列(Time Series)就是按时间顺序排列的一组数据。
比 ...
①搭建vimo-desktop本地运行环境
Vimo-desktop是VideoRAG的前端实现。
目前该项目仍是不稳定阶段,在环境配置上也遇到了很多问题。
一、conda 环境配置
conda create --name vimo python=3.11
conda activate vimo
1、pytorch需要安装GPU版本,且最好用conda安装。
❌原始命令:
# Core numerical and deep learning libraries
# pip install numpy==1.26. ...
在Python+FastAPI项目中使用SqlAlchemy操作数据的几种常见方式
在Python+FastAPI的后端项目中,我们往往很多时候需要对数据进行相关的处理,本篇随笔介绍在Python+FastAPI项目中使用SqlAlchemy操作数据的几种常见方式。
使用 FastAPI, SQLAlchemy, Pydantic构建后端项目的时候,其中数据库访问采用SQLAlchemy 的异步方式处理。一般我们在操作数据库操作的时候,采用基类继承的方式减少重 ...
拒绝“凭感觉”:用回归分析看透数据背后的秘密
在数据分析的江湖里,有一个绝对的核心技能,叫做回归分析(Regression Analysis)。
无论你是刚入行的新手,还是想要进阶的老手,掌握它,你就拥有了预测未来的“水晶球”。
很多初学者一听到“回归”两个字,脑子里全是复杂的数学公式,立刻想打退堂鼓。
别急!今天我们不讲枯燥的数学推导,只讲它是什么、怎么用,以及如 ...
国产化Excel开发组件Spire.XLS教程:使用Python批量删除Excel分页符
Excel 中多余或不必要的分页符,往往会打乱工作表的整体布局,甚至导致打印结果出现分页不合理、内容被截断等问题。这类分页符通常在修改打印设置、调整页边距,或切换视图模式后出现。本文将介绍如果借助Spire.XLS,使用Python批量删除Excel分页符,掌握如何正确删除它们是保持工作表结构清晰、排版专业、打印可控的重要 ...
在PySide6/PyQt6的项目中封装一些基础类库,包括文件对话框、字体对话框、颜色对话框、消息对话框等内容
在我们实际开发项目的时候,有时候为了使用方便,会针对一些常用到的内容进行一定的封装处理,以降低使用的难度和减少相关代码,本篇随笔介绍在PySide6/PyQt6的项目中封装一些基础类库,包括文件对话框、字体对话框、颜色对话框、消息对话框等内容。
1、常用对话框处理封装的优点
对常用对话框的调用(包括文件对话框、字体 ...
如何通过Anaconda快速安装和使用Python来执行文件并打包.exe可执行程序
Anaconda是一个开源的 Python 和 R 语言的发行版,专为数据科学、机器学习、人工智能、科学计算和大数据处理等领域设计。它由 Anaconda, Inc.(原 Continuum Analytics)开发,是目前全球使用最广泛的数据科学平台之一。
核心特点:
预装大量科学计算库(Anaconda 自带 250+ 个常用数据科学包,开箱即用)
强大的包管理器 ...
通过 Python 在 Excel 中添加或删除图片
在数据处理与办公自动化场景中,Excel 文件常需嵌入图片以增强可视化表达。然而,手动添加或删除图片不仅效率低下,还容易出错。如何用 Python 实现 Excel 中图片的自动化管理?答案是:使用 Free Spire.XLS for Python 免费库。
本文将系统介绍如何通过 Python 代码,在 Excel 文件中添加图片和删除图片,并提供完整示例与 ...
国产化Excel开发组件Spire.XLS教程:以Python编程方式在Excel中高亮重复值
重复值是 Excel 表格中常见的问题。无论你是在处理客户列表、产品库存、发票,还是调查问卷结果,重复数据都可能导致错误、不准确的报表以及错误的决策。。好在 Excel 提供了多种简单而高效的方法来高亮重复值,帮助你快速发现并管理这些数据。本文将介绍如何借助Spire.XLS,以Python编程的方式在Excel中查找并高亮重复值 ...
国产化Word处理组件Spire.DOC教程:使用Python将文件自动化批量附加到 Word文档
在许多商业或学术场景中,Word 文档不仅仅是文本载体 —— 它通常还是相关资料(如报告、电子表格、图表或参考 PDF)的集中中心。与其单独发送多个文件,不如将它们直接附加到 Word 文档中,以保持所有内容的统一和良好组织。
这在准备项目报告、提案或需要支撑数据的技术文档时,将文件附加到Word文档尤为有用。在本指南 ...
国产化PPT处理控件Spire.Presentation教程:使用Python将图片批量转换为PPT
图片是传递视觉信息、增强内容感染力的关键载体,而PPT则是整合信息、有效展示的重要工具。将图片转换为PPT,可以使视觉内容在演示文稿中更加生动、直观。无论是照片、图表,还是信息图,转化为PowerPoint幻灯片后,不仅能够提升演示效果,还能更好地吸引观众的注意力。
本文将介绍如何借助Spire.Presentation将图片转换为 ...
数据点的“社交距离”:衡量它们之间的相似与差异
在数据分析的世界里, “距离” 不仅仅是地图上两点之间的路程。
距离 ,本质上是衡量两个事物 “相似度” 的尺子。
距离越近 = 相似度越高
距离越远 = 差异越大
如果你想做用户画像聚类、想做商品推荐系统,或者想识别信用卡欺诈交易,你首先要选对这把“尺子”。
本文将带你全面了解数据分析中常用的各种距离度量,从最 ...
在windows平台搭建一个mini版本的k8s集群
前置要求:
1. 安装wsl2和docker-desktop
这边安装步骤之类的网上都有,最后要达成的效果就是二者都安装ok,同时要用wsl2起一台Linux虚机即可
2.安装kubectl
curl -LO "https://dl.k8s.io/release/$(curl -L -s https://dl.k8s.io/release/stable.txt)/bin/linux/amd64/kubectl"
chmod +x kubectl
sudo mv kubectl ...
doc-llm-autotest 基于大模型的文档自动化测试平台:worker服务的可靠性增强
一、可靠性分析
从架构图上,我们可以看出worker调用大模型服务过程中,会发生阻塞等待,如果此时worker异常容器挂掉了,那么此次任务状态会一直为processing,并且因为redis关联task_id的消息已经被消费了,那么这个任务就无法被识别出来重试。
基于这个场景分析,我们要补充巡检服务,去定时重启处于超时并且状态为proces ...
数据会说谎?三大推断方法帮你“审问”数据真相
很多刚入行甚至想入行数据分析的朋友,往往会陷入一个误区:以为数据分析就是不停地做报表、画饼图。
其实,数据分析的核心魅力在于 “推断”——即见微知著。
在现实生活中,我们很难获取“全量数据”(比如你不可能调查全国每一个人的身高),那么,如何通过手中的“小样本”去推测“大总体”的规律?
这就需要用到统计学 ...
doc-llm-autotest 基于大模型的文档自动化测试平台::用户提交文件进行文档测试
一、技术选型与功能设计
使用minio服务,进行文件的中转与存储。用户提交文件到doc-llm-controller,控制面将文件转存到minio中,关联此次任务id。然后doc-llm-worker轮询redis发现有需要执行的任务,拿到id后,根据id从minio拿取文件,然后将文件解析成结构化信息,再提交到大模型,进行文档测试。
那么此部分功能流程图大 ...
国产化Word处理组件Spire.DOC教程:通过Python将HTML转换为TXT文本
HTML(超文本标记语言)是一种用于创建网页的标记语言,能让开发者构建内容丰富、视觉吸引力强的页面布局。然而,HTML 文件通常包含大量标签,若仅需获取主要内容,这些标签会使其难以阅读。通过 Python 将 HTML 转换为文本,可轻松解决这一问题。与原始 HTML 不同,转换后的文本文件会剥离所有不必要的标记,仅保留干净易 ...
在PySide6/PyQt6的项目中实现样式切换处理
在桌面应用开发中,“主题切换(深色 / 浅色模式)”已经不再是锦上添花的功能,而是逐渐成为一种用户刚需。尤其对于长时间使用的 ERP 工具类应用来说,良好的视觉舒适度对用户体验影响巨大。本篇随笔针对PySide6/PyQt6的项目的实现案例,介绍如何实现样式切换处理。
Qt 官方本身提供了 QStyle 体系,但如果想做到:
可自 ...
markdown文档格式分析,再使用python对md文件进行结构化拆解
一、markdown文档
Markdown 文档本质上是:一个树状结构(Block 级) + 行内结构(Inline 级)
Block 级元素(结构):
heading_open → inline → heading_close
paragraph_open → inline → paragraph_close
list_open → list_item_open → inline → list_item_close
blockquote_open → ...
fence(代码块 ...