通过各种渠道收集了大量的关键词后,对收集五花八门的关键词进行分类整理是一件头痛的事。人工筛选工作效率太低,使用工具是最好的选择。给大家分享一个自己用的关键词分组工具和常用的分类方法,这个不是excel使用宏的工具。那个版本我总是不记得放在哪里,有时候习惯在工具进一步分词,导致功能失效。然后就习惯用单文件的小工具,短小精悍,携带方便。
工具介绍
2020.11.27更新:
上传diyu.txt,亦可以自定义,数据源:行政区划代码 (mca.gov.cn)。
修复*筛选闪退,包含全国省、市、县名称。
2019.12.29更新:
添加地域词提取,以*开头,后面啥都不要。
优化导出分词、导出速度。
2019.10.27更新:
为了进一步提升效率,分组规则除了包含外新增不包括、开始于、截止于三种删选方式。
不包括:以/开头,后面可以用+-连接多个词。
开始于:以^开头,后面可以用+-连接多个词。
截止于:以$开头,后面可以用+-连接多个词。
关键词分类分组工具界面比较简单,分组、还原和导出到csv。没有设置关键词上限,速度还可以测试了5000的关键词,基本秒分。
百度推广助手也有分类工具,功能完善,但是弊端是需要直接导入到对应计划。这就比较坑,基本用不了,分词是一个细致的活,需要多长分类,最后人工筛选。
sem分词方法
1、在关键词的输入框填入搜集的关键词,这里一行一个,尽量避免空行和其他符号的出现。
2、在分组规则内填写规则,就是要包含的词,一行一条规则。目前有三种规则:包含单个字词;包含多个字词其他的一个,用-连接;同时包含多个字词用+连接。
3、点击开始分类,左侧关键词框是剩余关键词,右侧是分组结果。
4、“还原数据”,继续调整分组规则达到理想状态后,“开始分类”
5、导出结果,导出csv,选择保存位置。
为避免出现重复情况,所以每个关键词只会出现在一个分类,按分类规则的先后顺序执行;一行规则不得同时出现+-(整个分组规则中三种分组方式可同时使用),有需要可以使用两条规则的先后顺序来满足。
下载地址
关键词分类分组工具下载链接: 链接: https://pan.baidu.com/s/1ee7XIOtTXhFn72hxoAstCQ 提取码: shjj 复制这段内容后打开百度网盘手机App,操作更方便哦
感谢作者,好用,就是数据多了有点慢^^
感谢作者开发这个小工具,不知能否支持大数据,上次一次导入了80万词就崩溃了;还有个问题就是你这个工具给了一个很好的思路,是否可以再进一步升级下(愿意付费)通过程序统计分析词频,自动把一个词包里面高频出现的词分类到一起,可以设定词根的字数几个字以内,如果能实现就更完美了。很多词库下载来的词量大了之后,你刚开始是不可能都人工想得到有哪些根分类最合适的。
@强子 很好的想法,我之前测试过,但是实际会有很多问题 ,有想法可以继续交流
提取码错误
@111 链接: https://pan.baidu.com/s/1ee7XIOtTXhFn72hxoAstCQ 提取码: shjj 复制这段内容后打开百度网盘手机App,操作更方便哦
不错的文章!
请问下,这个是不是有词数和分组规则限制啊?我规则添加有点多,有些词就分不了
@炎 没做限制啊,具体什么问题
不包括:以/开头,后面可以用+-连接多个词。
1.请问这个以/开头的格式是什么?我筛选的时候所有数据都筛选出来,结果不对:/飞机-坦克-空调-冰箱 这样用吗?
2.如果我想筛选包含某个词,但是不包含某些词,该怎么写代码?包含冰箱,不包含:海尔、美的、格力、松下 冰箱/海尔-美的-格力-松下 这么写吗?
@fox1383164k 1、/排除后面用+链接是或,包含任意一个都不会被筛选;-是且,同时包含才不会被筛选。(这里是不是有点不合+-以前的逻辑了)
2、在同一行筛选规则没有同时包含和不包含的功能,但是可以两次实现,例如要筛选包含1 2 不包含3 4,筛选规则前一行先筛选出3 4,后一行再筛选 1 2,后一行就是包含12不包含34了。(一个词只会被删选一次)
添加地域词提取,以*开头,后面啥都不要。
这个功能要怎么用?我写* 程序就崩溃退出了
@声屏障 忘记传地域词文件了,根目录添加diyu.txt 一行一个
怎么取消了?
@廾匸 https://pan.baidu.com/s/1Nm2uCd-SXFXI0drHym3ebA 可以正常打开啊
@廾匸 没有 直接点击
非常牛逼的工具,感谢作者!