数据存储至MySQL数据库 MySQL数据库安装及配置教程

由于MySQL关系数据库体积小、速度快而且免费,因此在网络爬虫的数据存储中作为常用的数据库。

MySQL安装

首先下载MySQL。进入MySQL官方网站下载页面(http://dev.mysql.com/downloads/windows/installer/)下载Windows版本。选择msi格式下载,选择第一个就可以:

选择MySQL安装模块。双击下载的msi文件安装,有几种可以选择的安装模式,选择custom自定义模式安装。

自定义模式可以选择需要安装的模块。其中MySQL Server为MySQL的核心模块,是必须安装的;MySQL Workbench是MySQL的图形化操作界面,习惯界面化操作的可以使用Workbench,其它随意安装:

选择完要安装的模块后单击Next。然后单击Execute,等待安装,点击Next下一步,开始安装选好的MySQL模块:

配置MySQL Server模块,选择Standalone MySQL Server/Classic MySQL Replication
  1. Developer Machine(开发机器):该选项代表典型个人用桌面工作站。假定机器上运行着多个桌面应用程序,将MySQL服务器配置成使用最少的系统资源。
  2. Server Machine(服务器):该选项代表服务器,MySQL服务器可以同其他应用程序一起运行,如FTP、E-Mail和Web服务器。MySQL服务器可以配置成使用适当比例的系统资源。
  3. Dedicated MySQL Server Machine(专用MySQL服务器):该选项代表只运行MySQL服务的服务器。假定没有运行其他应用程序,MySQL服务器就可以配置成使用所有可用系统资源。
因为此对话框仅使用MySQL开发,所以使用Developer Machine已经足够了,这样占用系统的资源不会很多,然后单击Next按钮。

在弹出的对话框中定义root用户的密码,在MySQL Root Password(输入新密码)和Repeat Password(确认)两个编辑框内输入期望的密码。务必记住此时输入的密码,接下来会用到。如果想添加新用户,那么可以单击Add User按钮添加。

继续单击Next按钮,直到完成。

完成整个安装,点击Finish会弹出MySQL workbench和MySQLShell,填入root用户和密码,或者新添加的用户名密码,点击Check之后再点击Next,Execute,最后Finish完成安装!

MySQL的基本操作

安装完MySQL后,就可以测试MySQL的运行了。如果熟悉使用命令行操作,就可以进入“开始”菜单,单击“所有程序”,找到MySQL文件夹,打开MySQL 8.0 Command Line Client – Unicode。图6-14所示就是MySQL Server的操作界面,输入保存的root密码,再按回车键。

输入show databases;,记得后面一定要加上分号,然后按回车键,可以查看现在MySQL服务器中所有的数据库。

如果不熟悉命令行,那么可以用MySQL Workbench使用图形化界面来操作数据库,在菜单栏中找到并打开,点击Local instance MySQL,输入root的密码,然后进入MySQL Workbench的操作界面。在这个界面中,你既可以像在命令行中一样输入命令来操作数据库,也可以通过单击各种选项进行操作。

输入show databases;,然后按Ctrl + Enter组合键得到和命令行操作一样的结果: MySQL使用: MySQL数据库的基本语法总结,这里只介绍常用从操作:创建数据库,创建数据表,增删改查操作!

创建一个数据库:

create databae spider;

如果需要使用某个数据库,在创建之后,后面所有的命令都会在这里执行,除非切换到其它数据库中:

use spider;

创建数据库表必须指定每一列数据的名称(colemn_name)和类别(column_type):

create table urls(
id int not null auto_increment,
url varchar(1000) not null,
content varchar(4000) not null,
created_time timestamp default current_timestamp,
primary key(id)
);
代码创建了4个数据变量,分别是id、url、content、created_time。其中,id的类别是整数(INT),属性为自己增加(AUTO_INCREMENT),一般作为主键(PRIMARY KEY),新添加数据的数值会自动加1。PRIMARY KEY的关键字用于将id定义为主键

url和content的类别是可变长度的字符串VARCHAR,括号里的数字代表长度的最大值,NOT NULL表示url和content不能为空。created_time为该数据添加的时间,不需要设置,它会自动根据当时的时间填入。MySQL对大小写不敏感!

创建数据表后,我们可以查看数据表的结构

desc urls;
或者
describe urls;

增加数据

在urls数据表中插入数据:

insert into urls(url,content) values("www.e1yu.com","鳄鱼君Ba")
这里只插入了url和content两个属性,但是因为id是自动递增的,created_time是数据加入的时间戳,所以这两个变量一般不用手动定义,它们会自动填入。

查找数据

从urls数据表中将id等于1的数据行提取出来:

select * from urls where id=1;
这一段命令的意思是“从表urls中把id等于1的整行数据取出来”。星号(*)代表所有字段。 如果我们只想看部分字段,也就是url和content,只用select选择url、content即可:
select url,content from urls where id=1;
除了将条件定义为“等于”,还可以用包含部分内容的方法:
select id,url from urls where content like "%鱼%";
SELECT id, url FROM urls WHERE content LIKE “%内容%”; 这里只会把字段id和url的数据显示出来,提取的是content字段中包含This所有行的字段的id和url数据,%在MySQL中表示字符串通配符

删除数据

删除url是www.e1yu.com的数据:
delete from urls where url="www.e1yu.com";
如果没有指定WHERE子句,上述命令就变成了DELETE FROM urls。这样结果会非常严重,导致MySQL表中的所有记录被删除,所以一定要记得加入WHERE,不然就会误删除整张表。

修改数据

由于刚刚删除了一行数据,因此现在数据表格又变成空的了。下面再插入一行数据。由于id和created_time是数据库自行填入的,因此这一行数据的id为2。
insert urls (url,content) values("www.baidu.com","baidu log");
将id等于2的url改成www.google.com,content改成Google:
update urls set url="www.google.com",content="Google" where id=2;
数据存储至MySQL参考:Python连接MySQL数据库以及基本的数据库操作

2 评论

    1. 嗯嗯,我也是自己学习,整理的

发表评论