设为首页 联系我们 加入收藏

当前位置: 网站首页 期刊分类目录 2019第6期 正文

大数据挖掘算法在刷卡中的研究与应用

作者:时间:2019-12-02点击数:

全文下载:   201906013.pdf


文章编号: 1672-6987201906-0090-09DOI10.16351/j.1672-6987.2019.06.013

 

高林, 高尚飞

(青岛科技大学 自动化与电子工程学院,山东 青岛 266061)

 

摘要: 面对海量的刷卡交易数据,普通的聚类算法和自然语言处理无法完成数据挖掘任务。本研究将MapReduceK-meansFCMHanLP算法相结合,不仅提高了海量数据聚类和语句分析的效率,而且可以挖掘出海量用户的刷卡行为特点,丰富和完善了客户画像。经过实验测试,基于MapReduce的聚类和自然语言分析算法运行在Hadoop集群下,不仅快速地实现了客户画像,帮助企业实现精准推销,而且为大数据环境下实现数据挖掘及自然语言分析算法的分布式并行运算提供了重要的参考和应用价值。

关键词: HadoopMapReduce; 聚类算法; HanLP; 行为分析


中图分类号: TP 9TP 305文献标志码: A

引用格式: 高林, 高尚飞. 大数据挖掘算法在刷卡中的研究与应用\[J\]. 青岛科技大学学报(自然科学版), 2019406): 90-98.


GAO Lin, GAO Shangfei. Research and application of big data mining algorithms in credit card\[J\]. Journal of Qingdao University of Science and TechnologyNatural Science Edition), 2019, 40(6)90-98.

Research and Application of Big Data Mining Algorithms in Credit Card

 

GAO Lin, GAO Shangfei

(College of Automation and Electronic Engineering, Qingdao University of Science and Technology, Qingdao 266061, China)

 

Abstract: In the face of massive credit card transaction data, the common clustering algorithm and natural language analysis algorithm can not complete the task of data mining. MapReduce combined with K-means, FCM and HanLP not only improves the efficiency of massive data clustering and sentence analysis, but also extracts the characteristics of swiping behavior of a large number of users, enriching and perfecting customers' images. It also provides an important reference and application value for the distributed parallel operation of algorithms analyzing data and natural language in big data environment.

Key words: Hadoop; MapReduce; clustering algorithm; HanLP; behavior analysis


收稿日期:  2018-11-30

基金项目: 青岛科技大学博士启动基金项目(010022530.

作者简介: 高林(1976—),男,副教授.

 

 

Copyright © 2011-2017 青岛科技大学学报 (自然科学版)