网站首页 > 开源技术 正文
前两天因为工作原因,需要将网页上的表格转换为excel表格,用deepseek搜了一下,搜出以下五种方法。自己使用感受,推荐方法二。方法一的话复制过去单元格会比较乱,需要合并单元格等操作。方法二的话存在空行问题,但可以通过全选表格,筛选空白单元格删除的方式删除(具体见方法二)。其他三种方法怎么说呢,对大多数像我一样的人来说可以操作,但不愿尝试,放在这里,就做补充吧,希望能帮到大家。
方法一:手动复制粘贴
- 选择表格:在网页上选中表格内容。
- 复制:右键点击选择“复制”或按 Ctrl+C(Windows)或 Cmd+C(Mac)。
- 粘贴到Excel:打开Excel,右键点击单元格选择“粘贴”或按 Ctrl+V(Windows)或 Cmd+V(Mac)。
方法二:使用Excel的“从网页获取数据”功能
- 打开Excel:启动Excel并创建一个新工作簿。
- 数据选项卡:点击“数据”选项卡,选择“从网页”。(我自己用的WPS,这一步用的是“数据”选项课,在“获取数据”选项下拉菜单点击“自网站连接”)
- 输入URL:在弹出的对话框中输入网页URL,点击“确定”。(wps中这一步是在“新建web查询”对话框的地址栏粘贴表格网页的网址,然后点击“转到”,下边预览窗口就会转到相应网页)
- 选择表格:在导航器窗口中选择要导入的表格,点击“加载”。(wps中是点击“导入”按钮,在弹出的“导入数据”对话框一般选默认位置“$A$1”就可以了,等待一会,就能在表格里看到数据了)
导出的表格中我的这边是有一些空行,影响筛选结果,需要删除。删除做法如下:第一步选中整个表格,一定要选中,不然筛选空行时只会出现个位数的空行,选中整个表格你就会看到筛选中的空行有很多,然后筛选确定,就会出现一个只有筛选行(标题行)和所有空行的表格,此时记住按住“ctrl键”,双击筛选行,然后直接右键删除就能删除所有表格内的空行了。删除前双击左键是为了在删除时不删除标题行,左键双击后应为如下情况:
方法三:使用浏览器扩展
- 安装扩展:在浏览器中安装如“Table Capture”等扩展。
- 捕获表格:打开网页,点击扩展图标,选择要捕获的表格。
- 导出到Excel:选择“导出为Excel”或类似选项,下载文件后打开。
方法四:使用在线工具
- 访问在线工具:打开如“Convert CSV”或“Table2Excel”等在线工具。
- 上传或输入URL:根据工具要求上传表格文件或输入网页URL。
- 转换并下载:按照提示操作,完成后下载Excel文件。
方法五:使用编程脚本(如Python)
- 安装库:使用 pandas 和 requests 库。
- 编写脚本:
- python
- 复制
- import pandas as pd import requests from bs4 import BeautifulSoup url = '网页URL' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') table = soup.find('table') df = pd.read_html(str(table))[0] df.to_excel('output.xlsx', index=False)
- 运行脚本:保存并运行脚本,生成Excel文件。
注意事项
- 格式检查:转换后检查格式是否正确。
- 数据验证:确保数据完整无误。
- 隐私保护:处理敏感数据时注意隐私安全。
选择适合你的方法进行操作即可。
猜你喜欢
- 2025-03-20 如何将Excel文件中的每行数据导出为单独的文本文件
- 2025-03-20 Excel | 批量导出图片(excel批量导出图片)
- 2025-03-20 只需三步,将Excel中的图片导出为单独的文件,就这么简单
- 2025-03-20 java大牛告诉你这样导出excel更加简单高效
- 2025-03-20 如何自动识别CAD图中所有表格数据并导出
- 2025-03-20 玩转无代码之批量导出 Excel 设置
- 2025-03-20 EasyExcel导出Excel表格到浏览器,通过Postman测试导出Excel
- 2025-03-20 办公效率up!一键导出Word全部表格到Excel
- 2025-03-20 利用VBA将Excel工作表导出为文本文件
- 2025-03-20 将记录集数据导出到Excel的函数(全记录格式导出)
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- jdk (81)
- putty (66)
- rufus (78)
- 内网穿透 (89)
- okhttp (70)
- powertoys (74)
- windowsterminal (81)
- netcat (65)
- ghostscript (65)
- veracrypt (65)
- asp.netcore (70)
- wrk (67)
- aspose.words (80)
- itk (80)
- ajaxfileupload.js (66)
- sqlhelper (67)
- express.js (67)
- phpmailer (67)
- xjar (70)
- redisclient (78)
- wakeonlan (66)
- tinygo (85)
- startbbs (72)
- webftp (82)
- vsvim (79)
本文暂时没有评论,来添加一个吧(●'◡'●)