性能优化 #

一、性能优化概述 #

1.1 优化目标 #

text

优化目标：
├── 提高查询响应速度
├── 提高吞吐量
├── 降低资源消耗
├── 提高并发能力
└── 优化用户体验

1.2 优化方向 #

方向	说明
查询优化	优化Cypher查询语句
索引优化	合理使用索引
数据建模	优化图数据模型
配置优化	调整Neo4j配置
硬件优化	升级硬件资源

二、查询优化 #

2.1 使用PROFILE分析 #

cypher

PROFILE MATCH (p:Person)-[:KNOWS]->(f:Person)
WHERE p.name = 'Tom'
RETURN p, f

2.2 使用EXPLAIN查看计划 #

cypher

EXPLAIN MATCH (p:Person)-[:KNOWS]->(f:Person)
WHERE p.name = 'Tom'
RETURN p, f

2.3 使用索引 #

cypher

CREATE INDEX FOR (p:Person) ON (p.name)

MATCH (p:Person)
WHERE p.name = 'Tom'
RETURN p

2.4 限制返回数据量 #

cypher

MATCH (p:Person)
RETURN p
LIMIT 100

2.5 使用参数化查询 #

cypher

:param name => 'Tom'
MATCH (p:Person)
WHERE p.name = $name
RETURN p

2.6 避免全图扫描 #

cypher

MATCH (p:Person {name: 'Tom'})-[:KNOWS]->(f:Person)
RETURN f

2.7 使用WITH分阶段处理 #

cypher

MATCH (p:Person)
WHERE p.status = 'active'
WITH p LIMIT 1000
MATCH (p)-[:KNOWS]->(f:Person)
RETURN p, f

2.8 使用索引提示 #

cypher

MATCH (p:Person)
USING INDEX p:Person(name)
WHERE p.name = 'Tom'
RETURN p

三、索引优化 #

3.1 创建合适的索引 #

cypher

CREATE INDEX FOR (p:Person) ON (p.email)
CREATE INDEX FOR (p:Person) ON (p.name, p.age)

3.2 复合索引使用 #

cypher

CREATE INDEX FOR (p:Person) ON (p.lastName, p.firstName)

MATCH (p:Person)
WHERE p.lastName = 'Smith' AND p.firstName = 'John'
RETURN p

3.3 全文索引 #

cypher

CREATE FULLTEXT INDEX person_search FOR (p:Person) ON EACH [p.name, p.description]

CALL db.index.fulltext.queryNodes('person_search', 'engineer')
YIELD node, score
RETURN node.name, score

3.4 查看索引使用情况 #

cypher

SHOW INDEXES YIELD name, state, populationPercent

3.5 避免过度索引 #

text

建议：
├── 只为常用查询属性创建索引
├── 每个标签不超过5个索引
├── 定期审查索引使用情况
└── 删除未使用的索引

四、数据建模优化 #

4.1 合理设计标签 #

cypher

CREATE (p:Person:Employee {name: 'Tom'})

4.2 合理设计关系 #

cypher

CREATE (a)-[:KNOWS {since: 2020, level: 'close'}]->(b)

4.3 避免过深的遍历 #

cypher

MATCH (a)-[:KNOWS*1..3]->(b)
RETURN a, b

4.4 使用适当的属性类型 #

cypher

CREATE (p:Person {
    name: 'Tom',
    age: 30,
    createdAt: datetime(),
    tags: ['developer', 'designer']
})

4.5 避免超级节点 #

text

超级节点问题：
├── 一个节点有大量关系
├── 查询性能下降
├── 内存消耗大

解决方案：
├── 分拆节点
├── 使用中间节点
├── 限制关系数量
└── 使用缓存

五、内存配置优化 #

5.1 堆内存配置 #

properties

server.memory.heap.initial_size=4G
server.memory.heap.max_size=4G

5.2 页面缓存配置 #

properties

server.memory.pagecache.size=2G

5.3 内存配置建议 #

总内存	Heap	PageCache	建议
4GB	1GB	1GB	开发环境
8GB	2GB	2GB	小型生产
16GB	4GB	6GB	中型生产
32GB	8GB	12GB	大型生产

5.4 查看内存使用 #

cypher

CALL dbms.queryJmx('org.neo4j:*') YIELD name, attributes
WHERE name CONTAINS 'Memory'
RETURN name, attributes

六、事务配置优化 #

6.1 事务超时 #

properties

dbms.transaction.timeout=30s

6.2 批量事务 #

cypher

UNWIND range(1, 10000) AS id
CALL {
    WITH id
    CREATE (p:Person {id: id})
} IN TRANSACTIONS OF 1000 ROWS

6.3 事务日志配置 #

properties

db.tx_log.rotation.retention_policy=2 days 1G size

七、并发优化 #

7.1 连接池配置 #

properties

server.bolt.thread_pool_max_size=200
server.bolt.thread_pool_min_size=50

7.2 查询并发 #

cypher

CALL dbms.setConfigValue('dbms.logs.query.threshold', '1s')

7.3 并行查询 #

cypher

MATCH (p:Person)
WHERE p.status = 'active'
WITH p
CALL {
    WITH p
    MATCH (p)-[:KNOWS]->(f:Person)
    RETURN f
} RETURN p, f

八、日志和监控 #

8.1 慢查询日志 #

properties

server.logs.query.enabled=true
server.logs.query.threshold=1s

8.2 查看慢查询 #

cypher

CALL dbms.listQueries()

8.3 终止慢查询 #

cypher

CALL dbms.killQuery('query-id')

8.4 监控指标 #

cypher

CALL dbms.queryJmx('org.neo4j:*')

九、性能监控工具 #

9.1 Neo4j Browser #

访问 http://localhost:7474 查看查询结果和执行计划。

9.2 Neo4j Metrics #

properties

server.metrics.enabled=true
server.metrics.prometheus.enabled=true
server.metrics.prometheus.endpoint=0.0.0.0:2004

9.3 JMX监控 #

properties

dbms.jvm.additional=-Dcom.sun.management.jmxremote
dbms.jvm.additional=-Dcom.sun.management.jmxremote.port=3637
dbms.jvm.additional=-Dcom.sun.management.jmxremote.authenticate=false
dbms.jvm.additional=-Dcom.sun.management.jmxremote.ssl=false

十、性能优化最佳实践 #

10.1 查询优化建议 #

text

建议：
├── 使用PROFILE分析查询
├── 使用索引加速查询
├── 限制返回数据量
├── 使用参数化查询
├── 避免全图扫描
├── 合理使用WITH
└── 使用批量操作

10.2 数据建模建议 #

text

建议：
├── 合理设计标签和关系
├── 避免过深的遍历
├── 处理超级节点
├── 使用适当的属性类型
└── 定期清理无用数据

10.3 配置优化建议 #

text

建议：
├── 合理配置内存
├── 设置事务超时
├── 启用慢查询日志
├── 监控性能指标
└── 定期维护数据库

十一、实际应用示例 #

11.1 优化社交网络查询 #

优化前：

cypher

MATCH (p:Person)-[:KNOWS*1..5]->(f:Person)
WHERE p.name = 'Tom'
RETURN f

优化后：

cypher

MATCH (p:Person {name: 'Tom'})-[:KNOWS*1..3]->(f:Person)
RETURN f
LIMIT 100

11.2 优化批量导入 #

优化前：

cypher

UNWIND range(1, 100000) AS id
CREATE (p:Person {id: id})

优化后：

cypher

UNWIND range(1, 100000) AS id
CALL {
    WITH id
    CREATE (p:Person {id: id})
} IN TRANSACTIONS OF 1000 ROWS

11.3 优化聚合查询 #

优化前：

cypher

MATCH (p:Person)-[:KNOWS]->(f:Person)
RETURN p.name, count(f)

优化后：

cypher

MATCH (p:Person)
WHERE exists((p)-[:KNOWS]->())
WITH p
MATCH (p)-[:KNOWS]->(f:Person)
RETURN p.name, count(f)

十二、总结 #

性能优化要点：

方向	方法	说明
查询优化	PROFILE, 索引, LIMIT	优化查询语句
索引优化	创建合适的索引	加速数据查找
内存优化	配置Heap和PageCache	合理分配内存
事务优化	批量处理, 超时设置	优化事务处理
监控	慢查询日志, Metrics	监控性能指标

最佳实践：

使用PROFILE分析查询
合理使用索引
优化数据建模
合理配置内存
定期监控和优化

恭喜你完成了Neo4j完全指南的学习！