Python金融大数据挖掘与分析全流程详解
(副标题):无 ;
(作者): 王宇韬 房宇亮 肖金鑫 ;
内容简介:
4.1 MySQL数据库简介及安装
本章使用的是常用的MySQL数据库。如下图所示,MySQL数据库用二维表格来组织数据,其结构和Excel工作表非常相似,也可以把它理解为一个位于云端的大型Excel。我们可以将爬取到的新闻标题、网址、日期等都存入MySQL数据库中,然后就可以从数据库调用数据。
首先来讲解MySQL数据库的安装。这里要介绍的是一个相对简单快捷的安装方法——WampServer安装法。WampServer是一款Apache Web服务器、PHP解释器及MySQL数据库的整合软件包。它会自动将一些设置配置好,所以不需要像传统的数据库安装方法那样配置环境变量。
WampServer的官方下载地址为:https://sourceforge.net/projects/wampserver/。在百度上搜索“wampserver官方下载”也可以找到该网址,注意要选择下图中标注的网址,而不是上面的官网地址,因为官网是法国网站,可能访问不了,找下载链接也会比较麻烦。
打开官方下载地址后,单击“Download”,选择合适的文件夹存储下载的文件即可。
下载到的是一个文件名类似“wampserver×××.exe”的文件,双击即可开始安装,安装过程比较简单。首先选择英文模式安装,然后同意安装协议,一直单击“Next”按钮直到弹出选择安装位置的对话框,建议安装在默认位置,以免之后还要额外进行系统配置。然后单击“Next”按钮进行安装。在安装过程中会提示选择WampServer的默认打开浏览器,默认为IE浏览器,也可以改成谷歌浏览器(chrome.exe)。之后还会弹出一个类似的对话框提示选择WampServer的默认文本编辑器,默认为Windows系统自带的“记事本”(notepad.exe),也可以根据需要修改。接着一直单击“Next”按钮
目录预览:
Python金融大数据挖掘与分析全流程详解
第1章 Python基础
1.1 Python安装与第一个Python程序
1.2 Python基础知识
1.3 Python语句
1.4 函数与库
第2章 金融数据挖掘之爬虫技术基础
2.1 爬虫技术基础1——网页结构基础
2.2 爬虫技术基础2——网页结构进阶
2.3 初步实战——百度新闻源代码获取
2.4 爬虫技术基础3——正则表达式
第3章 金融数据挖掘案例实战1
3.1 提取百度新闻标题、网址、日期及来源
3.2 批量获取多家公司的百度新闻并生成数据报告
3.3 异常处理及24小时实时数据挖掘实战
3.4 按时间顺序爬取及批量爬取多页内容
3.5 搜狗新闻与新浪财经数据挖掘实战
第4章 数据库详解及实战
4.1 MySQL数据库简介及安装
4.2 MySQL数据库基础
........