当前位置:首页 > 技术分析 > 正文内容

利用Knime合并多个文件(无需代码,比Python更简单)

ruisui885个月前 (02-03)技术分析28

Knime有数据科学界“瑞士军刀”的美誉,在未正式开始介绍Knime入门基础操作之前,我想选择其中一个场景来展示下Knime的功能,让诸位判断,这是否就是你要找的。

很多时候我们经常遇到合并多个相同结构的CSV文件,或者Excel文件尤其合并多个Excel文件更多。一下场景你遇到过吗?后续入门课程中,有了基础后再详细讲解,先对场景1做一个展示,Knime是如何实现的

Excel不同的文件合并场景

  1. 指定文件夹内有多个Excel文件(子文件夹可能也有Excel)
  2. 一个Excel文件内有多个sheet表,比如每个月份一个表,如何快速合并,而不是复制粘贴
  3. 多个Excel文件,每个Excel文件内有多个sheet表(1,2场景的综合)
  4. 多个Excel文件,每个Excel文件内虽有多个sheet表,只选择特定名称的表(而不是都选择,因为单个Excel文件内的多个sheet表,结构并不相同)
  5. 更要命的是,多个excel文件的列名不统一,如何合并,比如有的列名“公司名”,有的表内是“企业名”,如何统一处理成相同列名的数据,然后再合并(列名称不一致,不能自动合并)

场景1:指定文件夹内有多个Excel文件

Knime实现操作

本例涉及循环处理,合并,流变量(flow variable)使用,仅做展示,后续再深入讲解。

节点配置说明

如何实现:只需要5个节点(node),配置3个节点(node)的参数,点击运行,即可循环读入各个文件。

  • List Files 节点配置
  • Excel Reader(xls)
  • 查看结果 在Loop End点击运行后,再查看合并的结果

这是否就是你想要的简单方便,若需要数据和示例工作流,请头条私信

如何导入示例

你在Knime软件内导入工作流,根据你的情况,修改文件路径,再重新运行,即可看到合并后结果(可以使用我的示例数据,也可使用你自己的数据(此时注意表头行的位置需要根据情况修改),Excel文件内只有一个sheet表)

小结

以上只是一个展示,后续从基础讲起,让你数据处理不在难,更不需要Python编程,网上你随便找个合并文件的Python程序,至少二三十行,很多是“硬编码”,手动指定表名,列名之类的,即使有编程基础,也要先理解下,才能修改。没有编程基础的,只能看看,可能你还是无法使用。再说学习编程最大的成本是时间,很多函数的参数你是否能记住(查看帮助文档也是要时间的)。Knime图形化界面,进行配置即可,无需记忆那么多参数,使用熟练后,处理数据各种各样的数据更简单。

如果尝试VBA合并,比Python更麻烦,网上有小插件帮助合并,但是以上我列出的5个场景,恐怕就搞不定。学了VBA只能应用Excel。Knime可以处理各种数据文件,以及数据库(MySQL、Oracle,mongoDB等等)。

但上述示例,简单修改即可使用,无需一行代码。需要示例请私信留言,若执行示例有疑问请在本文留言

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/642.html

标签: node xlsx
分享给朋友:

“利用Knime合并多个文件(无需代码,比Python更简单)” 的相关文章

Excel VBA 收费单据打印/一步一步带你设计【收费管理系统】12

本文于2023年6月10日首发于本人同名公众号:Excel活学活用,更多文章案例请搜索关注!☆本期内容概要☆用户窗体设置:收费结算模块设置(7)单据打印大家好,我是冷水泡茶,前几期我们分享了【收费管理系统】的设计,最近一期是(Excel VBA 收费结算模块/一步一步带你设计【收费管理系统】11),...

软件测试-性能测试专题方法与经验总结

本文 从 性能测试流程,性能测试指标,性能监测工具,性能测试工具,性能测试基线,性能测试策略,性能瓶颈分析方法几个维度,进行知识总结和经验分享;详细见下图总结,欢迎大家补充;性能测试经验与思考1. 性能测试流程1.1. 性格规格评审1.2. 资源排期1.2.1. 人力资源1.2.2. 时间计划· 性...

双子座应用程序推出模型切换器以在Android上访问2.0

#头条精品计划# 快速导读谷歌推出了Gemini 2.0 Flash实验版,现已在其安卓应用中可用,之前仅在gemini.google.com网站上提供。新版本的15.50包含模型切换器,用户可以在设置中选择不同模型,包括1.5 Pro、1.5 Flash和2.0 Flash实验版。谷歌提醒,2.0...

你感动了吗?佳能超规格镜头 RF 24-105mm F2.8深度测评

如果要你选一支用作多题材创作的挂机镜头,那我相信很多人会选择24-105mm这个焦段的镜头。作为一支可以实现从广角到长焦的变焦镜头,24-105mm有着丰富的焦段选择。只是基于镜头体积以及光学结构上的限制,此前的24-105mm镜头只能恒定在F4的光圈。而佳能打破了这一限制,将实用焦段和恒定光圈完美...

《暗黑破坏神 2:重制版》PC 版 2.3 版本发布,支持英伟达 DLSS

IT之家 12 月 3 日消息,暴雪为《暗黑破坏神 2:重制版》PC 版发布了更新 2.3 版本,添加了“离线难度缩放”滑块(玩家可以在单人游戏时增加挑战和奖励的级别)、多项辅助功能和用户界面改进,以及英伟达 DLSS 支持。玩法改进:玩家现在可以在离线游戏的选项菜单中使用“游戏难度等级”,它提供与...

Vue中路由router的基本使用

??本文开始我们来给大家介绍在Vue中非常重要的一个内容,就是路由Router什么是路由后端路由:对于普通的网站,所有的超链接都是URL地址,所有的URL地址都对应服务器上对应的资源;前端路由:对于单页面应用程序来说,主要通过URL中的hash(#号)来实现不同页面之间的切换,同时,hash有一个特...