与大多数计算机语言一样,SQL支持利用函数来处理数据。为了代码的可移植性,许多SQL程序员不赞成使用特殊实现的功能。虽然这样做很有好处,但不总是利于应用程序的性能。如果不使用这些函数,编写某些应用程序代码会很艰难。必须利用其他方法来实现DBMS非常有效的完成的工作。如果你决定使用函数,应该保证做好代码的注释。
大多数SQL实现支持一下类型的函数。
用于处理文本串(如删除或填充值,转换值为大写或小写)的文本函数。
用于在数值数据上进行算术操作(如返回绝对值,进行袋鼠运算)的数值函数。
用于处理日期和时间值并从这些值中提取特定成分(例如,返回两个日期之差,检查日期有消息等)的日期和时间函数。
返回DBMS正使用的特殊信息(如返回用户登录信息,检查版本细节)的系统函数。
常用的文本处理函数。
函数 | 说明 |
Left() | 返回串左边的字符 |
Length() | 返回串的长度 |
Locate() | 找出串的一个子串 |
Lower() | 将串转换为小写 |
LTrim() | 去掉左边的空格 |
RTrim() | 去掉右边的空格 |
Soundex() | 返回串的SOUNDEX值 |
SubString() | 返回子串的字符 |
Upper() | 将串转换为大写 |
上表中的SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。SOUNDEX考虑了类似的发音字符和音节,是的能对串进行发音比较而不是字母比较。
下面给出一个使用Soundex()函数的例子。customers表中有一个顾客Coyote Inc..其联系名为Y.Lee。但如果这是输入错误,此联系名实际应该是Y.Lie,怎么办?显然,按照常规的联系名搜索是不会返回数据的。我们可以使用Soundex()函数进行搜索,它匹配所有发音类似于Y.Lie的联系名:
SELECT cust_name, cust_contactFROM customersWHERE Soundex(cust_contact) = Soundex('Y.Lie');
日期和时间采用相应的数据列下和特殊的格式存储,以便能快速和有效地排序和过滤,并节省物理存储空间。
常用日期和时间处理函数
函数 | 说明 |
AddDate() | 增加一个日期(天、周等) |
AddTime() | 增加一个时间(时、分等) |
CurDate() | 返回当前日期 |
CurTime() | 返回当前时间 |
Date() | 返回日期时间的日期部分 |
DateDiff() | 计算两个日期之差 |
Date_Add() | 高度灵活的日期运算函数 |
Date_Format() | 返回一个格式化的日期或时间串 |
Day() | 返回一个日期的天数部分 |
DayOfWeek() | 对于一个日期,返回对应的星期几 |
Hour() | 返回一个时间的小时部分 |
Minute() | 返回一个时间的分钟部分 |
Month() | 返回一个日期的月份部分 |
Now() | 返回当前日期和时间 |
Second() | 返回一个时间的秒部分 |
Time() | 返回一个日期时间的时间部分 |
Year() | 返回一个日期的年份部分 |
首先需要注意的是MySQL使用的日期格式。无论你什么时候指定一个日期,不管是插入或更新表值还是用WHERE子句进行过滤,日期必须为格式yyyy-mm-dd。虽然MySQL支持2位数字的年份,但应该总是使用4位数字的年份。
SELECT cust_id, order_numFROM ordersWHERE order_date = '2005-09-01';
如果上述存储的order_date值为2005-09-01 11:30:05
,则WHERE order_date = '2005-09-01'就不可以了。解决办法是指示MySQL仅将给出的日期与列中的日期部分进行比较,而不是将给出的日期与整个列值进行比较。为此,必须使用Date()函数。
SELECT cust_id, order_numFROM ordersWHERE Date(order_date) = '2005-09-01';
如果你想检索出2005年9月下的所有订单,可以使用下面几种解决办法。
SELECT cust_id, order_numFROM ordersWHERE Date(order_date) BETWEEN '2005-09-01' AND '2005-09-30';
还有一种不需要记住每个月有多少天或不需要操心闰年2月的办法。
SELECT cust_id, order_numFROM ordersWHERE Year(order_date) = 2005 AND Month(order_date) = 9;
数值处理函数仅处理数值数据。这些函数一般主要用于代数、三角或几何运算。
常用数值处理函数
函数 | 说明 |
Abs() | 返回一个数的绝对值 |
Cos() | 返回一个角度的余弦 |
Exp() | 返回一个数的指数值 |
Mod() | 返回除操作的余数 |
Pi() | 返回圆周率 |
Rand() | 返回一个随机数 |
Sin() | 返回一个角度的正弦 |
Sqrt() | 返回一个数的平方根 |
Tan() | 返回一个角度的正切 |
我们经常需要汇总数据而不用把它们实际检索出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表生成。这种类型的检索例子有以下几种。
确定表中行数(或者满足某个条件或包含某个特定值的行数)。
获得表中行组的和。
找出表列(或所有行或某些特定的行)的最大值、最小值和平均值。
因此返回实例表数据是对时间和处理资源的一种浪费。为了方便这种类型的检索,MySQL给出了5个聚集函数。
聚集函数(aggregate function)。运行在行组上,计算和返回单个值的函数。
函数 | 说明 |
AVG() | 返回某列的平均值 |
COUNT() | 返回某列的行数 |
MAX() | 返回某列的最大值 |
MIN() | 返回某列的最小值 |
SUM() | 返回某列值之和 |
AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值。
只用于单个列。AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出,为了获得多个列的平均值,必须使用多个AVG()函数。
NULL值。AVG()函数忽略列值NULL的行。
可利用COUNT()确定表中行的数目或复合特定条件的行的数目。
COUNT()函数有两种使用方式。
使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是NULL还是非空值。
使用COUNT(column)对特定列具有值的行进行计数,忽略NULL值。
NULL值。如果指定列名,则指定列的值为空的行被COUNT()函数忽略,但如果COUNT()函数中用的是星号(*),则不忽略。
MAX()返回指定列中的最大值。MAX()要求指定列名。
对非数值数据使用MAX()。虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。
NULL值。MAX()函数忽略列值为NULL的行。
MIN()函数正好与MAX()函数相反。
SUM()函数用来返回指定列值的和(总计)。
在多个列上进行计算。利用标准的算术操作符,所有聚集函数都可用来执行多个列上的计算。
NULL值。SUM()函数忽略列值为NULL的行。
下面将要介绍的聚集函数的DISTINCT的使用,已经被添加到MySQL 5.0.3中。
以上5个聚集函数都可以如下使用:
对所有的行执行计算,指定ALL参数或不给参数(因为ALL是默认行为)
只包含不同的值,指定DISTINCT参数。
ALL为默认。ALL参数不需要指定,因为它是默认行为。如果不指定DISTINCT,则假定为ALL。
下面的例子使用AVG()函数返回特定提供商提供的产品的平均价格。它与上面的SELECT语句相同,但使用了DISTINCT参数,因此平均值只考虑各个不同的价格。
SELECT AVG(DISTINCT prod_price) AS avg_priceFROM productsWHERE vend_id = 1003;
注意,如果指定列名,则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(*),因此不允许使用COUNT(DISTINCT),否则会产生错误。类似的,DISTINCT必须使用列名,不能用于计算或表达式。
将DISTINCT用于MIN()和MAX()。虽然DISTINCT从技术上可用于MIN()和MAX(),但这样做实际上没有价值。一个列中的最小值和最大值不管是否包含不同值都是相同的。
目前为止的所有聚集函数例子都只涉及单个函数,但是实际上SELECT语句可根据需要包含多个聚集函数。