公众号
关注微信公众号
移动端
创头条企服版APP

一文教会你用数据挖掘看全国两会“热词”

3129

全国两会上周在北京召开。两会集众智,聚群力,开新篇,谋新篇。全国两会作为每年定期召开的关系国计民生的政治性会议,是外国了解中国的重要窗口,也是与人民生活息息相关的风向标。

 

全国两会集中了全国各族人们的智慧,凝聚了人民的需求和意见。就业、婚恋等民生议题关系到人民的日常生活,宏观经济政策关系到企业的发展方向,企业需要根据政策改动调整战略目标才能提高自身的竞争力。


两会提及了这么多的内容,怎样才能快速地知晓两会“热词”及相关内容呢?Smartbi Mining来教你快速看“热词”。Smartbi Mining是一站式可视化的数据挖掘平台,是广州思迈特软件公司的明星产品。Smartbi Mining可以通过数据挖掘迅速生成两会“热词”,无需编程技术,新手小白也可以掌握,只要简单的鼠标操作便可完成数据挖掘。


下面来演示一下。


1.新建实验


打开默认界面,即‘实验管理’界面,该界面可以进行‘新建实验’:


新建方式1:在文件夹右键菜单‘新建’中单击‘实验’;


新建方式2:单击‘新建实验’。


一文教会你用数据挖掘看全国两会“热词”577.png 


2.选择数据源


根据原始数据存放的方式在选择数据源节点,将数据源节点拖拽至画布区域,并在参数面板上进行数据源信息的设置。


 


3.模型搭建


特征选择:将你关注的关键词,比如放假、假期、春假作为特征列,而‘是否提及’做为标签列;


拆分:将数据集进行拆分,一部分数据用来训练模型,另一部分用来验证经过训练的模型效果如何;


 


4.训练&预测


训练:训练节点的输入分为两部分,左边为算法节点,右边为训练数据集,模型通过对训练集数据中特征列的数据进行学习,并根据标签列的数据,确认具有何种特征的数据可能与“假期”有关,进而使模型获得能够识别关于“假期”的能力;


预测:预测节点的输入分为两部分,左边为训练好的模型,右边为测试数据集,模型运用识别流失客户的能力,对测试集中的特征列数据进行处理,并获得是否为放假的标记,这里的标记是模型给出的结论,并非测试集中标签列的数据。


 


5.结果评估


评估:通过对比模型预测结果与测试集数据之间的差异,可以评价模型的效果。


 


从下面最终输出评价结果可以看到这个模型的准确率高达95%。

 


声明:该文章版权归原作者所有,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系。
您阅读这篇文章花了0
转发这篇文章只需要1秒钟
喜欢这篇 0
评论一下 0
凯派尔知识产权全新业务全面上线
相关文章
评论
试试以这些内容开始评论吧
登录后发表评论
凯派尔知识产权全新业务全面上线
阿里云创新中心
×
#热门搜索#
精选双创服务
历史搜索 清空

Tel:18514777506

关注微信公众号

创头条企服版APP