从零开始学Python数据分析与挖掘
(副标题):无 ;
(作者): 刘顺祥 ;
内容简介:
第1章数据分析与挖掘概述
马云曾说“中国正迎来从IT时代到DT时代的变革”,DT就是大数据时代。随着移动互联网的发展,人们越来越感受到技术所带来的便捷,同时企业也将搜集到越来越多与用户相关的数据,包括用户的基本信息、交易记录、个人喜好、行为特征等。这些数据就相当于隐藏在地球深处的宝贵资源,企业都想从数据红利中分得一杯羹,进而推进企业重视并善加利用数据分析与挖掘相关的技术。
本章将以概述的形式介绍数据分析和挖掘相关的内容,通过本章的学习,你将了解如下几方面的知识点:
数据分析与挖掘的认识;
数据分析与挖掘的几个应用案例;
数据分析与挖掘的几方面区别;
数据分析与挖掘的具体操作流程;
数据分析与挖掘的常用工具。
1.1 什么是数据分析和挖掘
随着数据时代的蓬勃发展,越来越多的企事业单位开始认识到数据的重要性,并通过各种手段进行数据的搜集。例如,使用问卷调查法获取用户对产品的评价或改善意见;通过每一次的实验获得产品性能的改良状况;基于各种设备记录空气质量状况、人体健康状态、机器运行寿命等;通过网页或APP记录用户的每一次登录、浏览、交易、评论等操作;基于数据接口、网络爬虫等手段获取万维网中的公开数据;甚至是企业间的合作实现多方数据的共享。企事业单位花费人力、物力获取各种数据的主要目的就是通过数据分析和挖掘手段实现数据的变现,否则囤积的数据就是资源的浪费。
数据分析和挖掘都是基于搜集来的数据,应用数学、统计、计算机等技术抽取出数据中的有用信息,进而为决策提供依据和指导方向。例如,应用漏斗分析法挖掘出用户体验过程中的不足之处,从而进一步改善产品的用户流程;利用AB测试法检验网页布局的变动对交易转化率的影响,从而确定这种变动是否有利;基于RFM模型实现用户的价值分析,进而针对不同价值等级的用户采用各自的营销方案,实现精准触达;运用预测分析法对历史的交
目录预览:
从零开始学Python数据分析与挖掘
第1章 数据分析与挖掘概述
第2章 从收入的预测分析开始
第3章 Python快速入门
第4章 Python数值计算工具——Numpy
第5章 Python数据处理工具——Pandas
第6章 Python数据可视化
第7章 线性回归预测模型
第8章 岭回归与LASSO回归模型
第9章 Logistic回归分类模型
第10章 决策树与随机森林
第11章 KNN模型的应用
第12章 朴素贝叶斯模型
第13章 SVM模型的应用
第14章 GBDT模型的应用
第15章 Kmeans聚类分析
第16章 DBSCAN与层次聚类分析