@Macux 2017-12-14T12:44:41.000000Z 字数 14960 阅读 1421

MySQL 学习笔记

MySQL

１、基础知识

1.1 启动MySQL

mysql --local-infile=1 -u root -p 
# 更简单的方法是：创建一个.cnf文件.

1.2 导入本地数据

use sampdb
# 选择当前的数据库为"sampdb".
load data local infile '/etc/mysql/ryan.txt' into table ryan fields terminated by ';' lines 
terminated by '\n';
# 用';'区分不同字段，用'回车'区分不同的record.

1.3 创建一张数据表

create table president(
   last_name varchar(15) not null,
   first_name varchar(15) not null,
   sex enum('F','M') not null, 
   city varchar(20) not null,
   state varchar(2) not null,
   birth date not null,
   death date not null,
   president_id int unsigned not null auto_increment,
   primary key (president_id)
   ) engine = InnoDB;  # 在MySQL中，只有"InnoDB"才支持外键功能.

1.4 show与desc语句

show tables;　　  # 输出当前数据库所有的表. 
desc president;　 # 查看表的结构.

２、常用的SQL语句

2.1 基本语法

select select_list         # What columns to select.
from table_list            # The tables from which to select rows.
where row_constraint       # What conditions rows must satisfy.
group by groupint_columns  # How to group results.
order by sorting_columns   # How to sort results.
having group_constraint    # What conditions groups must satisfy.
limit count;               # Row count limit on results.

2.2 对查询结果进行排序

select * from president order by if (death is null, 0 ,1),death desc;
# 先用if()语句，根据0,1进行升序排列;
# 再用order by death desc(降序)，在进行一次排序;
# 查询结果是：按照总统逝世日期降序排列，且让健在的总统排在最前面.

2.3 限制查询结果中数据行的个数

select * from president order by birth limit 10;
# 输出前10个record.
select * from president order by birth limit 10,5;
# 跳过前10个record后，输出紧跟的5个.
select * from president order by birth order by rand() limit 10;
# 随机抽出10条record.

2.4 输出列进行求值和命名

select concat(first_name,'',last_name) as 'President Name',concat(city,',',state) as 'Place of Birth' from president;

2.5 日期

select * from president where month (birth) = month(curdate()) and dayofmonth(birth) = dayofmonth(curdate());
# 输出'今日出生'的总统信息.
select concat(first_name,''last_name) as 'President Name' ,timestampdiff(year,birth,death) as 'age' from president where death is not null order by age desc limit 10;
# 降序输出已故总统中，寿命最长的前十位的姓名和年龄.
select * from president where death >= '1970-1-1' and death < date_add('1970-1-1',interval 10 year);
# 输出逝世于20世纪70年代的总统信息.

2.6 模式匹配

select * from president where last_name like 'W%';
# 输出姓氏以字母W或w开头的总统信息.

select * from president where last_name not like '%W%';
# 输出姓氏里不含有W或w字母的总统信息.

select * from president where last_name like'____'; # 四个下划线.
# 输出姓氏由且仅有4个字母构成的总统信息.

select 'ryanfan' regexp '[fanpeng]';  # [...]匹配在方括号里的任何一个字符.
# 此处返回'1'.

select * 'kobebryant' regexp '^kobe';       # 匹配以'kobe'开头的字符串.
select * 'wanglihong' regexp 'hong$';       # 匹配以'hong'结尾的字符串.
select * 'wuyuetian'  regexp '^wuyuetian$'  # 匹配字符串仅是'wuyuetian'的情况.

2.7 设置SQL变量

select @birth := birth from president where last_name = 'Jackson' and first_name = 'Andrew';
select * from president where birth < @birth order by birth;

2.8 生成统计信息

select distinct state from president order by state;
# 用关键字distinct把重复的record清除掉.
select count(*) from president where last_name = 'Jackson';
# 用count(*)输出符合条件的全部record，但是count()只能统计非NULL值的个数.   'But，在Teradata中，count在计算中是包含NULL的！'
select sex, count(*) as 'Count' from president group by sex order by Count desc with rollup;
# 分别统计出不同性别的总统人数，并根据人数降序输出。并且多输出一行，统计二者的和.
select month(birth) as 'Month',monthname(birth) as 'Month_Name',count(*) as count from president group by Month_Name order by Month.
# 根据不同出生月份的总统人数进行分组，并按照从1月-12月的顺序输出.
select state, count(*) as 'Count' from president group by state having count > 1 order by Count desc;
# 输出哪些state是有两位或两位以上的总统.
# "having count = 1" 表示不重复的值.
# "having count ≠ 1" 表示某个数据列重复出现的值.

３、使用SQL管理数据

3.1 SQL模式

'sql_mode'：规定MySQL如何处理非法数据。

set (global) seq_mode = "xxxxx";

'sql_mode'的类别：
- "strict_all_tables"：抛出一个错误，停止执行语句，导致“部分更新”。
- "strict_trans_tables"：对每一个非法值，MySQL按照某规则把它转换为最接近的合法值。
- "ansi_quotes"：把双引号识别为一个标识符引用字符。
- "pipes_as_concat"：将"||"识别为字符串合并操作符，而不是"OR"操作符。
- "ansi"：非重点，有兴趣问度娘。
- "traditional"：非重点，有兴趣问度娘。
标识符中的合法字符
- 当标识符是SQL保留字或者包含空格或者其它特殊字符的时候，加上反引号(``)，就可以允许使用任意字符；
- 字符串两端的引号，用单引号是最保险的；

3.2 存储引擎的介绍

存储引擎有很多，常用的主要是下面几种：
- MyISAM：默认的存储引擎;
- InnoDB：具备外键支持功能的事务处理存储引擎；
- Falcon：用来进行事务处理的存储引擎；

具备事务处理的数据库,可以确保在事务处理不成功时，数据可以滚回。

查看当前可供使用的存储引擎

show engines\G
# ';'结尾 ：常规输出.
# '\G'结尾：按行输出.
# '\g'结尾：按列输出.

输出数据表更详细的信息（比desc的输出内容更详细）

show create table president\G

3.3 DataBase的常用操作

创建

create database db_name;

删除

drop database db_name;

变更（默认字符集&排序规则）

alter database db_name character set xxxx collate yyyy;

3.4 重要的SQL语句

插入中文数据

alter database sampdb default character set 'gbk';
set names 'gbk';
create table lenovo (name varchar(100) not null,id int unsigned not null);
insert into lenovo values('电脑','200'),('笔记本','123');

更新record

update member set email='ryanfan0313@163.com',street='123 Elm St',zip= '510520' where last_name = 'Fan' and first_name = 'Ryan';

table的删除

delete from tbl_name where.....; 
# 删除表中符合筛选条件的某几行.

truncate table tbl_name;
# 清空数据表，保留表结构.

创建临时表（temporary table）

create temporary table tbl_name ... ;

temporary数据表的名字允许与一个现有的永久性数据表相同。例如：
如果你在sampdb数据库创建了一个名为zhihui的temporary数据表，原有的zhihui数据表将被隐藏起来，对zhihui数据表的访问将只作用于新建的temporary数据表。比如执行drop table zhihui语句，被删除的将是temporary数据表。

新建一张表的N种懒人方法：

（1）、利用子查询直接复制

create table president_copy select * from president (where sex = 'F');

（2）、先输入一行record，然后借用cast()函数设置字段类型

create table tbl_name select cast(1 as unsigned) as i,cast(curtime() as time) as t,cast(pi() as decimal(10,6)) as d;

（3）、创建表的同时，顺便插入一行record。（它比方法2更加的全面，因为可以对字段进行更详细的设置。）

create table tbl_name(i int unsigned not null,t time not null,d decimal(10,6)) select 1 as i,cast(curtime() as time) as t,cast(pi() as decimal(10,6)) as d;

（4）、最懒的方法

create table tbl_name select 1 as i,curtime() as t,pi() as d;

用途广泛的alter语句

alter table tbl_name engine = xxxx;

alter table tbl_name add column_name varchar(100);
alter table tbl_name drop column column_name;

alter table tbl_name change i j varchar(100) not null;
# 把字段名为'i'的名字改为'j'，并把字段属性修改为varchar(100) not null.

alter table tbl_name auto_increment = 100;

alter table tbl_name rename to new_tbl_name;
# 更简单的重命名table的方法：
rename table tbl_name to new_tbl_name;

alter的全部用法，请参见《MySQL技术内幕》P747。

最短的show语句

show status from db_name (where name = 'ryan')\G
# 输出数据库中每一张table的基础信息，这些信息偏向table本身，比如创建时间等等.
select * from infromation_schema.tables where table_schema = 'sampdb' and table_name = 'ryan'\G
# 输出数据库中某一张具体table的基础信息，效果和'show status from db_name (where name = 'ryan')\G'一样.
show create table ryan\G
# 输出的表内部结构的信息，字段、存储引擎等等.

show index from tbl_name;

show tables;

查看各条SQL语句执行耗时情况

set profiling = 1;
多条SQL语句
show profiles;

关系型数据库的基础：'联结'

（1）、内联结（只显示在两个数据表里都能找到匹配的数据行）

select t1.*,t2.* from t1 inner join t2 where t1.i1 = t2.i2;

（2）、外联结（除了显示同样的匹配结果，还可以把其中一个数据表在另一个数据表里没有匹配的数据行也显示出来，分为左联结和右联结）

工作原理：给定用来匹配两个数据表里的数据行的数据列，除了输出二者匹配的那些数据行，还会把左数据表在右数据表里没有匹配的数据行也显示出来。当右数据表的某些数据列未被定义为"Not Null"，那么一个缺失值的record,也会被认为是'未匹配'。

必要性：在使用左联结的时候，就表示左数据表里的数据是绝对需要的，join右数据表只是为了补充说明，满足联结条件or不满足，都是一种说明。

select t1.*,t2.* from t1 left join t2 on t1.i1 = t2.i2 where t2.i2 is null;
# 当加上'where t2.i2 is null'后，输出的全是那些没有匹配的record，这有可能在实际运用中需要的.

感觉不怎么好用的'子查询'

（1）、"子查询(subquery)"：把一条select语句用括号括起来，并嵌入另一个select语句。

（2）、子查询测试：

1.标量子查询(只产生一个值)的结果，可以用'='、'<>'、'>'、'>='、'<'、'<='操作符进行相对值求值比较；

select * from score where event_id = 5 and score > (select avg(score) from score where event_id =5);

2.'in'、'not in'测试某给定值是否包含在子查询的结果集里；

select * from president where (city,state) not in (select city,state from president where last_name = 'Roosevelt');

3.'all'、'any'/'some'把某给定值与子查询的结果集进行比较；

select * from president where birth <= all (select birth from president　where last_name = 'Roosevelt'); 
# 输出出生日期小于或等于last_name为'Roosevelt'出生日期的所有数据行.

select * from president where (city,state) = any (select city,state from president where last_name = 'Roosevelt');

用'all'的情况一般是筛选条件只有一个(birth)，用any/some的情况一半筛选条件是多个，只要满足其中一个就输出数据行。

4.'exists'、'not exists'测试子查询的结果集是否为空。

select exits (select * from absence);

5.个人认为'子查询'实在太臃肿了，可以用'外联结'的时候还是用'外联结'吧！*

进行多数据表查询的union语句

作用：把多个查询的结果合并在一起创建一个结果集。

　　(1)、union结果集里的数据列名字来自第一个select语句里的数据列的名字。

select i, c from t1 union select i, d from t3;
# 输出结果中，只有两个字段，名字分别是'i'和'c'.

　　(2)、default下，union将结果集中的重复数据行剔除，可以设置union all 来保留重复数据行。

select * from t1 union all select * from t2 union all select * from t3;

　　(3)、借助order by和limit对结果进行优化

(select i, c from t1) union (select i, d from t3) order by c limit 8;

(select * from t1 order by i limit 2) union (select * from t2 order by c limit 3) union (select * from t3 order by d limit 3);

'一劳永逸'的视图

如果要选取某给定数据表的一个子集，将它定义为一个视图，则可以一劳永逸。

create view tera(new_name1, new_name2, new_name3, new_name4) as select last_name, first_name, city, state from president;
# 下次再要引用'last_name', 'first_name', 'city', 'state'这四个字段时，直接从tera中调用就更为简便.

事务处理

1.绕口的概念：

'事务'是作为一个不可分割的逻辑单元而被执行的一组SQL语句，如有必要，它们的执行效果可以被撤销。这是因为并非所有的语句每次都能执行成功，有些语句还会对数据产生永久性影响。

2.工作原理：

事务处理是通过'提交(commit)'和'回滚(rollback)'功能实现的。'提交'将那些语句的执行效果永久性地记录到数据库里，'回滚'将发生错误之前已经执行完的语句的效果全部撤销掉。

3.总结：

(1)、一旦发起'start transaction'，即所有的SQL语句会隐式自动提交一个事务。但若以rollback结尾，将全部撤销。

start transaction;
insert into zhihui set name = 'Leehom';
insert into zhihui set name = 'junjun';
select name from zhihui; # 会输出'Leehom'和'junjun'两行record.
rollback;
select name from zhihui; # 'Leehom'和'junjun'消失了.

(2)、如果'set autocommit = 1'，即所有的SQL语句都会永久性的改写数据库，怎么rollback都没用。
(3)、如果'set autocommit = 0'，你不commit，都可以用rollback来撤销。

4.利用'保存点(savepoint)'进行部分回滚：

start transaction;
insert into zhihui set name = 'Leehom';
savepoint my_point1;
insert into zhihui set name = 'junjun';
rollback to my_point1;
insert into zhihui set name = 'yuanyuan';
commit;
select name from zhihui;
# 将会输出'Leehom'、'yuanyuan'.

锁定数据表，以防止其他人在你锁定有关数据表期间修改它们。

lock tables inventory write;
update inventory set quantity = 44 where item = 'shirt';
unlock tables;

外键的创建和使用
- 'foreign key'子句：列出子表里的被索引数据列，它们必须匹配父表里的索引值。
- 'references'子句：列出父表和父表中的索引数据列的名字。
- 'on delete'子句：设定在父表里数据行被删除时子表应该发生什么事。若缺省，则默认行为是拒绝从父表里删除仍有子表数据行在引用它们的数据行。包括下列'action'子句：

(1)、'on delete no action'&&'on delete restrict'：含义与省略'on delete'子句一样;
(2)、'on delete cascade'子句，删除父表数据行时，子表里与之相关联的数据行也将被删除;
(3)、'on delete set null'子句，删除父表数据行时，子表里与之相关联的数据行将被设置为NULL。

'on update'子句：设定当父表的数据行更新时，子表应该发生什么事情。'action'子句与'on delete'通用。
建立一个外键关系，必须满足如下条件：

(1)、父表的索引必须列出references子句里的数据列，子表里的索引必须列出外键数据列；
(2)、父表和子表索引对应的数据列，必须是兼容的数据类型；
(3)、不能对外键关系里的字符串数据列的前缀编制索引。

create table parent(
   par_id int not null,
   primary key(par_id)
   ) engine = 'InnoDB';

create table child(
   par_id  int not null,
   child_id int not null,
   primary key (par_id,child_id),
   foreign key (par_id) references parent (par_id)
      on delete cascade
      on update cascade
   ) engine = 'InnoDB';

MySQL的全文搜索（共３种模式）
- '自然语言'模式。把'搜索字符串'解释为一系列单词并查找包含这些单词的数据行；
- '布尔'模式。把'搜索字符串'解释为一系列单词，但允许使用一些操作符来修饰这些单词以表明特定的需求，如所有的单词都必须出现（不论顺序）才认为是匹配，或者单词顺序必须与搜索字符串里列出的一致才算匹配；
- '查询扩展'模式。分为两阶段，第一阶段是'自然语言搜索'，第二阶段使用原来的搜索字符加上在第一次搜索中找到的相关度最高的匹配数据行再进行一次搜索。

要想对某个table进行全文搜索，必须实现为它创建一个'fulltext'索引，该索引具有如下特点：

(1)、fulltext索引只能由char、varchar和text这几种类型的数据列构成；
(2)、全文搜索将忽略'常见'(50%规则，即至少在一半的数据行里都出现过)的单词；
(3)、主动忽略一些'休止单词'，例如'the'、'after'等；
(4)、太短（少于4个字符）的单词将会忽略；
(5)、此处的'单词'是指由'字母'、'数字'、'’'和'_'构成的字符序列。'full-blood'将被解释为'full'和'blood'两个单词。

Ａ、自然语言模式：

'match()'操作符列出将被搜索的数据列，'against()'给出搜索字符串。

select * from ryan where match(phrase) against('hard soft');
# 把包含'hard'或者'soft'的数据行找出来.

Ｂ、布尔模式：

特别之处：
a、'50%规则'不再起作用；
b、查询结果不再按照相关度排序；
c、搜索短语时，用双引号括起来，表示按照给定顺序排列，才算匹配。

select * from ryan where match(phrase) against('"bell book and candle"' in boolean mode);

select * from ryan where match(attribution,phrase) against('+bell -candle' in boolean mode);
# 匹配只包含'bell'，不包含'candle'的数据行.
select * from ryan where match(phrase) against('soft*' in boolean mode);
# 匹配以包含'soft'开头的数据行.

Ｃ、查询扩展模式：

select * from ryan where match(attribution,phrase) against('bell book' with query expansion)
# 工作原理：第一阶段进行自然语言搜索，结束后发现'candle'这个词是第一阶段中相关程度最高的数据行里的单词，于是将'candle'用在搜索的第二阶段.

４、数据类型

4.1 疑难杂症

当字符串里有引号，怎么办？

insert into zhihui values('He said,"I told you so."');
# 用与'字符串中的引号字符'不同的引号把整个字符串括起来.

如何知道字符串的长度？

set @s1 = 'ryan';
select length(@s1), char_length(@s1);
# length()测量'字节'个数，char_length()测量'字符'个数.

'NULL'的含义到底是什么？
- '没有数据'、'数据未知'、'数据缺失'、'数据超出取值范围'；
- '对本数据列不适用'、'与本数据列的其它值同';
- '空值'并不等于没有值(NULL)。
MySQL对NULL的官方解释：
- 'NULL' columns require additional space in the row to record whether their values are NULL. For MyISAM table, each NULL column takes one bit extra.
强迫症患者特别喜欢的字段属性---'zerofill'
它经常与int(M)一起使用，'M'表示最大显示宽度。当数值显示宽度小于M时，zerofill会在数字前用'0'补齐。

create table train(id int(12) zerofill);

'ENUM'和'SET'，到底选谁？
- 'ENUM'数据列，必须包含且只包含一个来自值列表的成员；
- 'SET'数据列，允许包含任意多个来自值列表的成员（可以为'空'，也可以是'全体'）。
- 'SET'类型的合法取值列表最多允许有64个成员，列表中的值必须是字符串，必须用逗号隔开。
- 当被插入到'ENUM'里的值不是合法成员时，MySQL会把它替换为NULL。（前提是当前的sql_mode允许）
- 当被插入到'SET'的值里包含不是该数据列合法值的子字符串，MySQL就会剔除不合法的，把剩余合法的插入。（前提是当前的sql_mode允许）

create table ryan (preference set('Snooker','Data Mining'));
insert into table values('Big Data Mining');
# 'Big'将被剔除，'Data Mining'被插入数据库.

遇到非法数据值(数据越界)，怎么办？
- 对于数值数据列或time数据列，超出合法范围的值将被截短到最近的取值范围边界；
- 对于字符串数据列(不包括'ENUM'和'SET')，太长的字符串将被截短到数据列的最大长度；
- 对于'ENUM'和'SET'，前已陈述。

4.2 用途广泛的AUTO_INCREMENT属性

AUTO_INCREMENT必须满足如下条件：
- 每个数据表只能有一个数据列具备AUTO_INCREMENT属性，而且它应该有一种整数数据类型；
- 必须给该数据列添加索引；
- 必须给该数据列添加'not null'约束条件。
当你已经厌倦AUTO_INCREMENT总是从'1'开始计数时，你可以这么做：

alter table ryan auto_increment = 666;
# 或者
create table(.....) engine = MyISAM auto_increment= 666;

MyISAM引擎中的AUTO_INCREMENT数据列：
- 编号值严格地依次递增而不会被再次使用，除非你用'truncate table'命令清空了一个数据表;
- 不能使用AUTO_INCREMENT选项把当前计数值设置的比数据表里现有的最大计数值还低。比如某个AUTO_INCREMENT数据列包含值1和10，即使你用alter语句把AUTO_INCREMENT设置为5，自动生成的下一个序号值也将会是11。
在使用AUTO_INCREMENT时，请注意如下问题：
- MySQL的AUTO_INCREMENT是自动完成的，根本不需要人为地去insert；
- 消除因删除数据行而在序列中产生的'断裂带'，最佳的方式是：先删除该数据列(包括索引)，然后再重新添加它。

重新编排纯属是强迫症患者的批号，虽然工作很容易完成，然并卵。因为重新编排在性能上不会有任何改进，而且调整该数据列的顺序将会破坏表与表之间的对应关系。
故此处不贴出重新编排的代码。

4.3 选用数据类型时应该思考的问题

这个数据列将容纳什么样的数据？
数据是否在某个特定的区间内？
在性能和效率方面偶没有需要考虑的因素？
- 数值操作比字符串操作要更快；
- 短字符串比长字符串完成得更快速；
- 就MyISAM而言，长度固定的数据行比长度可变的数据行具有更好的性能表现。

select * from ryan procedure analyse()\G
# 该语句用于帮助判断是否可以选用一种更'小'的类型，以改善数据表查询性能并减少数据表的存储空间占用量.

5、查询优化

'查询优化'主要是从语法上和硬件上两方面进行，硬件不用多说，让内存尽量大，让CPU尽量牛逼轰轰等等。语法上主要是通过'创建索引'和'查询优化程序'两个方面。

5.1 使用索引

索引能为我们带来什么？
- 没有索引的数据表，就是一个无序的数据行集合；
- 索引能带来怎样的高效查询：

(1)、快速检索　当一张table有索引时，则这张table已经被索引'分类'，那么这张table比不带索引的table，就显得更"小"了。
(2)、快速定位　当一张table带有索引时，进行检索时，不需要从第一行进行线性扫描，而是直接找到第一个匹配项。

索引的种类：
- 唯一索引(UNIQUE、PRIMARY KEY)：不允许索引项本身出现重复的值，其对应的数据列也不能出现重复的值；
- 普通索引(INDEX)：允许出现重复；
- FULLTEXT索引：全文检索，只适用于MyISAM数据表；
- HASH索引：进行精确值查询('IN'、'='和'<=>')时速度非常快，可以比较两个NULL是否代表同样的东西('<=>')，但不能用于范围检索。
- SPATIAL索引：只适用于MyISAM数据表和空间(spatial)数据类型；
- 应注意的细节问题：

(1)、如果某个索引是PRIMARY KEY或是SPATIAL时，带索引的数据列必须具备NOT NULL属性；
(2)、'PRIMARY KEY'和'UNIQUE'的区别：
Ａ、每张table只能有一个PRIMARY KEY(当然也可以是组合主键)；
Ｂ、PRIMARY KEY不可以包含NULL，而UNIQUE索引可以包含NULL;

主键和主索引的区别：

(1)、主键是逻辑模型的概念，主索引是物理模型中用于数据分配和存取的物理机制；
(2)、主键没有属性数目限制，主索引最多由16个属性组成；
(3)、主键在逻辑模型中定义，主索引在创建表或单独定义；
(4)、主键取值必须唯一，主索引可以唯一也可以不唯一；
(5)、主键用来区分数据记录，主索引用来进行数据分配；
(6)、主键的值不会改变，主索引的值可以变化；
(7)、主键不可以为空值，主索引可以为空值；

与索引相关的语句

alter table tbl_name add index/unique/... index_name (index_columns);
# 创建索引.

show index from tbl_name;
# 查看数据表的索引.

alter table tbl_name drop index/primary/.... index_name;
# 删除索引.

挑选索引的原则
- 最适合出现索引的数据列是那些在'where子句'、'联结子句'、'order by 或 group by'子句的数据列中；
- 数据列重复的值越少，索引的使用效果越好；
- 对具有短小的数据类型的数据列构建索引；
- 为字符串值的前缀编制索引；
- 充分利用最左边的前缀；
- 适可而止，不要建立过多的索引。

5.2 查询优化程序

查询优化程序的目标：
- 只要可能就使用索引；
- 使用条件最严格的索引；
- 尽可能多、尽可能多地排除不符合索引条件的数据行。(优化查询语句)

So，它主要是为了帮我们做两件事：
(1)、当哪些数据行有索引时，可以提升查询速度；
(2)、现在的查询语句有没有被优化的必要。

How to do it ?　(借助explain语句)

explain select * from member where to_days(expiration) < 30 + to_days(curdate())\G

关于输出结果的解释，，请参见《MySQL技术内幕》P776。

5.3 数据类型也会影响查询效率

尽量使用数值操作，少用字符串操作；
不要盲目选用'大'类型，刚刚好是最快的；
尽量把数据列设置为'NOT NULL'；
如果可以，多使用'ENUM'；
利用procedure analyse()语句查看它对字段的声明有什么更好的建议；
利用optimize table命令以减少碎片和改善系统性能。

select * from tbl_name procedure analyse(16,256);
# 如果数据列的不同取值在16个以上或者长度超过256字节，则不提出ENUM类型建议.

optimize table tbl_name;
# 当数据库在删除大量的数据后，数据文件大小可能仍未变小，这是由于删除操作后数据文件留下所致.

6、使用Python操作MySQL

import MySQLdb
# 连接数据库
conn = MySQLdb.connect(host='localhost', user='root', passwd='root', db='test', port=3306,charset='utf8')  # charset属性，用来避免中文乱码，必须要跟数据库的编码一样
cur = conn.cursor()
# 用Python执行SQL语句 
cur.execute('create database if not exists python')
conn.select_db('python')
cur.execute('create table test(id int,info varchar(20))')
values = []
for i in range(20):
    values.append((i,'Ryan' + str(i)))
cur.executemany('insert into test values(%s,%s)',values)   # 插入多条数据
data = [123,'Fan']
cur.execute('insert into test values(%s,%s)',data)         # 插入一条数据
conn.commit()       # 一定要有这句来提交事务，否则不能成功插入数据。
count = cur.execute('select * from test')
print 'there has %s rows record' % count
cur.close()
conn.close()