Windows和Linux下使用Python搭建一个图片OCR工具
目录识别结果效果一、安装系统级依赖Windows 系统Linux 系统二、创建并激活虚拟环境1. 创建虚拟环境2. 激活虚拟环境三、安装 PaddlePaddle(CPU 版本)四、安装 PDF 相关依赖1. 安装 PyMuPDF(PDF 解析)2. 安装 PaddleX(含 OCR 模块)3. 安装 ReportLab(PDF 生成)识别结果效果
案例参考图片
一、安装系统级依赖
Windo ...
爬虫_20251211_Browser-Use_MCP_Selenium_爬虫+LLM
爬虫_20251211
Browser-Use
Browser-Use 下载安装
Github 仓库链接: https://github.com/browser-use/browser-use
检查 Windows 中是否已经安装 uv:
uv --version
升级 uv 版本:
uv self update
安装方法:
用 pip 安装 uv:
pip install uv
用官方脚本安装:
powershell -ExecutionPolicy ByPass -c "irm https://astr ...
Python从安装到实战入门指南
目录一、环境配置:搭建Python开发基础安装Python验证安装二、开发工具推荐:高效编程助手编辑器交互工具三、基础语法学习路径:核心概念逐步掌握1. 核心概念2. 函数与模块3. 文件操作四、练习建议:实战提升技能每日一练小项目驱动五、学习资源:持续成长的支持免费教程书籍六、避坑指南:常见问题解决方案虚拟环境包管理 ...
Python属性(Property)优雅掌控对象数据的完全指南
目录一、 为什么我们需要 Property?从简单的陷阱说起二、 Property 的魔法:@property 装饰器详解1. 基本用法:只读属性2. 进阶用法:添加 Setter 和 Deleter三、 实战案例:Property 的高级应用场景1. 惰性计算(Lazy Evaluation)2. 优雅的接口重构(向后兼容)3. 计算属性(Computed Attributes)四、 总结与思考:何时 ...
Python进阶技巧之利用break和哈希算法优化数据库批量操作
目录第一章:为什么你的 Python 批量插入脚本总是又慢又占内存?第二章:利用break实现可控的流式处理2.1 摆脱fetchall()的陷阱2.2 结合break的分批处理逻辑第三章:引入哈希(Hash)算法:去重与快速校验3.1 实战案例:基于哈希的增量数据同步3.2 哈希优化的思考第四章:终极整合——构建一个健壮的 ETL 脚本框 ...
Python使用Flask构建智能的静态文件服务器
目录摘要1. 项目简介2. 代码实现3. 功能详解3.1 已知扩展名集合3.2 扩展名检查函数3.3 JSON文件验证函数3.4 MIME类型获取函数3.5 文件服务路由4. 使用方法5. 请求处理逻辑6. 应用场景7. 总结摘要
本文将详细介绍一个使用Flask构建的智能静态文件服务器,该服务器具有自动识别和处理JSON文件的功能。当请求没有扩展名的文件 ...
Python原生代码实现高效接口测试的终极指南
目录一、 核心武器库:Requests 库深度解析1.1 环境准备与基础请求1.2 理解 Response 对象二、 实战进阶:处理复杂的业务场景2.1 接口鉴权与 Session 管理2.2 数据驱动测试 (Data-Driven Testing)2.3 接口依赖与数据清理 (Teardown)三、 架构设计:从脚本到测试框架3.1 配置与数据分离3.2 引入 Pytest 框架3.3 接口测试中的 ...
一文带你深入理解Python中zip的用法
目录引言一、基础语法与核心特性1.1 基本语法1.2 核心特性演示二、进阶用法与技巧2.1 解压操作(Unzip)2.2 处理不等长序列2.3 矩阵转置三、实战应用场景3.1 字典创建与操作3.2 数据分组处理3.3 并行遍历与索引四、性能优化与注意事项4.1 内存管理4.2 特殊场景处理五、对比与扩展5.1 vs map()函数5.2 滑动窗口实现六、最佳 ...
基于Python+PyQt5+Pandas编写的带图形界面的Excel合并工具
目录引言一、效果预览二、环境准备1、Python 版本2、安装依赖三、功能设计说明1、合并逻辑说明2、GUI 组件说明四、完整源码(可直接运行)Base64 图标处理主窗口类初始化 UI选择文件夹 & 显示文件列表Excel 合并核心逻辑程序入口完整代码引言
在日常办公或数据处理中,经常会遇到多个 Excel 文件需要合并的场景。手工复制不 ...
使用python快速生成nodejs项目文件结构
目录项目概述运行结果功能特性技术架构使用的技术栈程序结构代码详解1. 类初始化与界面布局2. 文件夹选择功能3. 文件夹结构解析算法4. 文件系统创建算法5. 树形控件填充6. 文件内容读写7. 配置持久化8. 系统集成功能使用场景1. 项目模板生成2. 批量文件管理3. 文档整理性能优化1. 延迟加载2. 深度限制3. 过滤系统文件潜在改 ...
Python合并多个Excel文件的方法实现与对比
目录前提条件方法一:将多个 Excel 文件合并成一个工作簿(多个工作表)代码示例工作原理方法二:将多个 Excel 文件合并到一个工作表中代码示例工作原理总结在日常工作中,处理多个 Excel 文件并将它们合并为一个文件,常常是数据分析、报告生成等工作的必要步骤。对于数据分析师、业务人员以及任何需要处理大量 Excel 数据 ...
使用Python轻松管理Word页脚
目录Python环境配置与文档处理库简介为Word文档添加简单文本页脚定制化页脚:页码、格式与高级排版插入动态页码多元素页脚:文本与页码结合图片页脚不同节的页脚与清除页脚页脚处理的进阶技巧与注意事项总结在日常的办公自动化中,处理Word文档是许多人绕不开的环节。无论是生成报告、合同,还是制作项目文档,Word都是一个 ...
Python偏函数partial的用法小结
目录什么是partial?1) 基本用法与参数合并规则2) 配合标准库:map/sorted/reduce等“柯里化”场景3) 回调函数需要“额外上下文”——用partial传额外参数4) 装饰器/工厂的参数化:让“可调用签名更好看”5)partialvslambda:各有优劣6) 深入属性与调试7) 与实例方法的细节:parti ...
深入解析pysnmp的SNMP协议
目录1. SNMP 协议基础1.1 SNMP 是什么?1.2 SNMP 架构2. SNMP 协议核心概念2.1 OID(Object Identifier)2.2 MIB(Management Information Base)2.3 SNMP 版本3. SNMP 消息结构与pysnmp实现3.1 SNMP 消息格式3.2pysnmp中的编码与解码4.pysnmp模块设计与 SNMP 协议映射4.1 分层架构4.2 核心类与 SNMP 协议对应5. 深入 SNMP ...
Python入门之函数、列表与元组核心用法(附实战案例)
目录前言:一. 函数:告别重复代码的 “代码工厂”1.1 为什么需要函数?1.2 函数的核心语法(重点)1.3 函数的进阶用法(嵌套 + 递归)1.4 函数核心小结二. 列表和元组:批量存储数据的 “容器”2.1 列表(list):最常用的可变容器2.2 元组(tuple):不可变的序列容器2.3 列表的元组小结结尾:前言:
...
Python库使用实战案例(标准库到第三方库)
目录Python 库使用全攻略一、标准库核心模块二、第三方库实战三、库管理最佳实践四、实战案例:天气数据分析五、常见问题解决Python 库使用全攻略
Python 的库生态系统是其强大功能的核心。本文将从标准库到第三方库,结合实战案例系统讲解使用技巧。
一、标准库核心模块
os模块:操作系统交互
import os
# 获取当前目录
pr ...
棒棒糖图:当条形图遇上极简美学
棒棒糖图(Lollipop Chart)可以看作是条形图的一种“轻盈版”变体:它用一根从基准线延伸出来的“棒”,并在末端以一个“糖”(圆点)来表示数值,取代了传统的矩形条。
这种图表传达的信息与条形图是一样的,但它更注重突出数据点的位置,整体看起来更加清新、现代。
今天,我们一起探索棒棒糖图的优势,并通过代码实现, ...
Python借助 Spire.PDF for Python提取PDF图片的终极指南
目录安装 Spire.PDF从指定页提取图片提取所有图片总结PDF 文件中的图片往往蕴藏着重要的信息,但提取它们的过程却可能颇具挑战性。借助 Spire.PDF for Python,我们可以轻松高效地从 PDF 文档中提取所需的图片,不论是单个页面还是整个文件。不仅如此,该库功能强大且使用简单,适合各类开发者和数据分析师使用。接下来,我 ...
opencv图片处理常见操作方法总结
目录1、图片打码2、图片组合和缩放3、图片运算4、平滑处理(模糊处理)总结今天学习opencv对图片的常见处理操作,包括:图片的打码,组合,放缩,加法运算,加权运算,以及图片的模糊处理(平滑处理)
1、图片打码
代码:
import cv2
import numpy as np
# 图片打码
a = cv2.imread(r'img.png')
a[100:200,200:300] = np.r ...
python脚本实现下载高德离线底图瓦片并使用
在内网环境中开发,无法使用高德在线瓦片服务,需要下载到本地或者部署到内网服务器中进行使用,如何下载离线瓦片呢,可以使用python脚本进行
以下是完整代码
import math # 新增这行,导入math模块
import requests
import os
from PIL import Image
from urllib.parse import quote
import time
# 高德瓦片下载配置
cla ...