在MySQL中创建全文索引(FULLTEXT INDEX)是提升文本搜索性能的重要手段,尤其适用于对大段文本进行关键词检索的场景。以下详细介绍如何创建全文索引以及优化其使用效果的方法。
如何创建全文索引
全文索引只能在支持它的存储引擎上创建,目前InnoDB和MyISAM都支持FULLTEXT索引,但使用方式略有不同。
1. 创建表时添加全文索引
CREATE TABLE articles (id INT AUTO_INCREMENT PRIMARY KEY,
title VARCHAR(200),
content TEXT,
FULLTEXT(title, content)
) ENGINE=InnoDB;
上述语句在title和content字段上同时建立了一个联合全文索引。
2. 对已有表添加全文索引
ALTER TABLE articles ADD FULLTEXT(title, content);如果表已存在,可以通过ALTER TABLE语句添加全文索引。
3. 使用 CREATE INDEX 语法
CREATE FULLTEXT INDEX idx_content ON articles(content);这种方式更直观,适合为单个或多个字段单独创建索引。
全文索引的查询方法
创建索引后,使用MATCH() ... AGAINST()语法进行全文搜索。
SELECT * FROM articles WHERE MATCH(title, content) AGAINST('数据库优化' IN NATURAL LANGUAGE MODE);MySQL支持三种搜索模式:
NATURAL LANGUAGE MODE:自然语言模式,按相关性评分排序 BOOLEAN MODE:布尔模式,支持+、-、*等操作符 QUERY EXPANSION MODE:查询扩展模式,基于原始结果扩展关键词例如使用布尔模式搜索必须包含“mysql”且不包含“教程”的文章:
SELECT * FROM articles WHERE MATCH(title, content) AGAINST('+mysql -教程' IN BOOLEAN MODE);全文索引优化方法
合理使用和配置全文索引可以显著提升查询效率和准确度。
选择合适的字段建立索引:全文索引适用于TEXT、CHAR、VARCHAR类型,优先在经常用于搜索的长文本字段上创建 避免在过短或高频词上搜索:MySQL默认忽略少于3个字符的词(可配置),并有停用词列表(如“的”、“是”) 调整全文索引参数:可通过修改配置文件优化行为,例如: innodb_ft_min_token_size:设置最小分词长度(默认3) ft_stopword_file:自定义停用词文件 innodb_ft_server_stopword_table:指定停用词表 定期优化表结构:执行OPTIMIZE TABLE可整理索引碎片,提升查询性能 注意多字节语言支持:中文需借助外部工具分词(如Sphinx、Elasticsearch),原生MySQL对中文分词支持有限 结合普通索引使用:对于带条件的复合查询,将全文索引与普通索引结合,先过滤再搜索注意事项与限制
使用全文索引时需注意以下几点:
仅InnoDB和MyISAM支持,MEMORY引擎不支持 InnoDB中每个表最多支持一个FULLTEXT索引(早期版本限制,MySQL 5.6+已放宽) 全文索引不支持分区表上的列 AGAINST()中的字段必须与索引定义完全一致 相关性得分是浮点数,可用于排序,但不同版本计算方式可能不同基本上就这些。掌握创建和优化全文索引的方法,能有效提升文本搜索效率,但在处理中文内容时建议结合专业搜索引擎使用,以获得更好的分词和检索效果。
