Excel 分列处理复杂数据技巧分享
消息来源:baojiabao.com 作者: 发布时间:2024-11-18
原文标题:《天天都在用的 Excel 分列,还藏着这个你不知道的神技?!》
大家好,我是农夫,专治疑难杂「数」的农夫~
昨天同事突然扔给了我这样一个数据~
让我把它分成下面这样的四列~
这还能难倒我这数据小能手吗?
废话不多说,盘它~
拿到这样的数据,大部分小伙伴脑袋里面率先想到的肯定是 Excel 的【分列】功能。
但是,实际操作发现,无论是使用【分隔符号】还是【固定宽度】都无能为力呀!
于是~
咳咳!说回正题,在正式处理这个数据之前,我们先来分析下当前数据有什么特征。
数据分析
我们观察一下数据,发现有以下几个特征:
首先,第一列红色列全都是数字,第二列蓝色列全都是文字。
Excel 中的分列功能需要一个标识符,比如空格。
那么,我们只要把数字和文字中间,插入一个标识符就可以分列了嘛!
其次,第二列蓝色列和第三列红色列和前面的特征一样,只不过是文字和数字换了位置;
最后,我们来看第三列红色列和第四列绿色列。我们发现两列都是数字。
但是,仔细分析就会发现第四列 -- 绿色列都存在一个小数点,而小数点前面都是一位数字。
这样,我们不就可以,将小数点加前面的一位数字进行特征识别了吗?
好了,既然思路都有了,那么,接下来我们要怎么做呢?
数据处理
对于数据处理,我们可以使用 Word 通配符来帮忙。
比如:你要检索「农」字开头的单词,写入【农 [一-龟]{1,}】,就可以匹配到农夫、农夫好帅、农民、农村、农业、农业经济、农村合作社、农田;
而如果写入【农 *】,只会搜到农字这个单字。
这其实就是利用正则表达式实现的。
然而,正则表达式又是啥?
就相当于通配符的升华。
通俗理解是文本数据的超级匹配模式,用更简洁的方法来指定所需的文本。类似于一对多模式。
其中,一就是由元字符组成的通用模式;多则是文本中符合该模式的文本数据。
就好比:水果(你写的正则表达式)包括苹果、梨、香蕉、车厘子、柚子……(匹配上的文本数据。)
既然是处理文本数据,那我们就不能仅局限在 Excel 了,毕竟 Office 三剑客都各有各的看家本领。
其中,Word 在文本领域可是三剑客中的扛把子呀!
❶ Word 数据处理
① 先将数据粘贴进入 Word 中,操作过程中选择「选择性粘贴」-【只保留文本】。
② 序号与部门之间添加分隔符。
按【Ctrl+H】快捷键进入替换页面,在查找内容输入:【([0-9])([一-龟])】。
【([0-9])】:
选中 0 到 9 的任意一个数字,并定为一组。
【([一-龟])】:
选中文档中的任意一个汉字,并定为一组。
【([0-9])([一-龟])】:
只有前面是数字,后面是汉字才能被选中,同时将其分为前后两组~
在替换内容中输入:【\1|\2】
【\1】代表第一组 [0-9] 模式中查找到的任意一个数字;【\2】代表第二组 [一-龟] 模式中查找到的任意一个文字;并在两组数据间加入分隔符【|】。
之后,点击【更多 >>】,然后勾选【使用通配符】,否则,会查找失败~
因为通配符是文本值中代替未知字符的特殊字符,可以方便查找基于特定模式匹配的数据。
以【*?】为例,勾选了通配符,会让 Word 认识到【*?】不再是普通字符,而是一种特殊匹配符号。
动图走一波~
③ 部门与工作量之间添加分隔符。
按【Ctrl+F】快捷键进入替换页面,在查找内容输入:【([一-龟])([0-9])】。
【([一-龟])】:
选中文档中的任意一个汉字,并定为一组。
【([0-9])】:
选中 0 到 9 的任意一个数字,并定为一组。
【([一-龟])([0-9])】:
只有前面是汉字,后面是数字才能被选中,同时将其分为前后两组~
在替换内容中输入:【\1|\2】
【\1】代表第一组 [一-龟] 模式中查到的任意一个文字,
【\2】代表第二组 [0-9] 模式中查到的任意一个数字,
并在两组数据间加入分隔符【|】。
④ 工作量与工作周期之间添加分隔符。
按【Ctrl+F】快捷键进入替换页面,在查找内容输入:【([0-9])([0-9])(.)】。
【([0-9])】:
选中 0 到 9 的任意一个数字,并定为一组。
【(.)】:
选中符号【.】,并定为一组。
【([0-9])([0-9])(.)】:
只有第一个是数字,第二个数字,第三个是点号才能被选中,同时将其分为前中后三组~
在替换内容中输入:【\1|\2\3】
【\1】代表第一组【[0-9]】模式中查到的任意一个数字;
【\2】代表第二组【[0-9]】模式中查到的任意一个数字;
【\3】代表第三组中的点号,并在第一和第二组间加入分隔符【|】。
以上设置好后,就可将数据粘回 Excel 中处理了~
▋Excel 数据处理
⑤ 用 Excel 进行分列。
分隔符添加完毕后,就可以轻松的使用【分列】功能进行数据分列了~
再用【分列】的【固定宽度】处理下列名就可以了~
最后我们就得到了这样的规范数据了~
知识总结
一定要牢记,拿到数据不要着急。
首先要分析数据特征;根椐数据特征使用相应的软件进行初步处理。
Word+Excel 处理:
❶ 分析数据并粘入 Word;
❷ 构建正则表达式的匹配模型,如【([一-龟])([0-9])】;
❸ 勾选【使用通配符】并进行分组;
❹ 加入分隔标识;
❺ 粘回 Excel【分列】处理。
PS:通配符中的各个符号都是半角下的英文状态哦!
其实除了以上这种处理方法之外,还有一种 PQ 法,由于篇幅有限,我这里简单讲下步骤,感兴趣的同学可以自己动手试试看~
PQ 处理:
❶ 选中数据区域内的任意一个单元格,点击【数据选项卡】-「获取数据」-「来自文件」-选择「从文件夹」;
❷ 拆分列 --【按字符数】;
❸ 拆分列 --【按照从非数字到数字的转换】;
❹ 拆分列 --【按照从数字到非数字的转换】。
本文来自微信公众号:秋叶 Excel (ID:excel100),作者:农夫
2023-02-12 20:07:32相关文章
- 淘宝天猫仅退款属于诈骗吗?淘宝天猫开始部分取消仅退款
2024-10-01 13:01:28
- 哈啰app借钱|哈啰借钱app下载安装免费小小上当和电话骚扰
2024-10-01 11:22:38
- 白嫖党|山西大同大学学生网购申请“仅退款”被拒骂客服一小时
2024-09-27 09:10:44
- 北大数学教授袁新意《姜萍事件的疑点分析》点评姜萍板书 阿里巴巴竞赛受质疑
2024-06-28 10:07:40
- 天猫新规可以无条件申请“仅退款”了?淘宝天猫又离狗多多零元购近了一步
2024-06-28 09:27:13
- 美国法院裁定阿里须为Squishmallows玩具侵权案答辩
2023-12-28 19:59:34
- 小米汽车传员工3700人 雷军称小米汽车不可能卖9万9
2023-12-28 19:41:57
- 国家新闻出版署:认真研究《网络游戏管理办法(草桉徵求意见稿)》关切 实行前进一步完善
2023-12-28 19:14:56
- 印度以打击金融犯罪为由逮捕了两名 vivo 高管
2023-12-26 16:49:01
- 在国外微信收不到国内信息?微信和WeChat将被拆分
2023-12-15 10:40:15
- 苹果iPhone15 系列手机发布最新消息 预计上市发布时间9月
2023-08-06 23:21:02
- 华为将发布鸿蒙HarmonyOS4操作系统 功能五大升级支持设备清单
2023-08-06 23:17:37
- 整治自媒体网红账号 400万粉丝网红发布擦边视频被无限期封禁
2023-07-12 09:56:09
- 网传微信文件传输助手是真人是真的吗?微信官方回应
2023-06-27 15:53:32
- 电信移动送手机成了“信用购”?你上了运营商的贷款套路了吗?
2023-06-12 17:18:55
- 中国电信广东地区崩了无信号 客服回应已在核实处理
2023-06-08 15:39:04
- 消息称小米新能源汽车价格表正讨论定价区间:双版本不同配置,高配或超 35 万元
2023-03-06 12:56:03
- 华为因制裁被传或分拆剥离手机业务? 内部人士回应:可能性不大.
2023-03-05 23:26:41
- OPPO正式发布安第斯智能云,让终端更智能
2023-02-24 16:02:27
- 华为与OPPO签订全球专利交叉许可协议 包括5G蜂窝通信专利
2023-02-24 16:02:26