7.30实习培训日志-SQL优化

总结

今天早上考试,下午主要是老师引导我们学习SQL优化,晚上主要是同学的技术分享,杨松柏同学主要给我们分享了java的io的一些东西,c10k问题,bio(同步阻塞IO),NIO(同步非阻塞IO),netty,对于NIO的进一步封装,主要因为NIO用起来很麻烦。邵闫利主要给我们讲解了java基础,特别强调设计模式的应用,工厂模式,观察者模式,装饰器模式三者,给我们通俗易懂的讲解虽然我还是不太懂,下来自己去看一下设计模式,后面的同学都给我们讲解了一些新的知识,git rebase,k8s子类的东西,收获良多。

杂项

用in和exists替换distinct

能用union不要用union all

驱动表

wwh999 在 2006年总结说,当进行多表连接查询时, [驱动表] 的定义为:

  1. 指定了联接条件时,满足查询条件的记录行数少的表为[驱动表];
  2. 未指定联接条件时,行数少的表为[驱动表](Important!)。

优化

  1. LEFT JOIN改为JOIN
  2. 除所有JOIN,让MySQL自行决定

连表查询之驱动表

基于案例学习的sql优化

从案例中推导SQL优化的总体思路与误区

count(*) count(列)

无索引:count(*) count(列)一样

有索引:列非空(count() count(列)一样) (列可空)count() count(列)不一样

但是count(*)与 count(列)不等价

count(*):会统计null列,count(列)不会计算Null列

count()速度最快,列的偏移量决定性能,列越靠后,访问开销越大,count()与列无关,所以count(*)速度最快,count(最后列)速度最慢

sql书写顺序

表的连接顺序

大表在前,小表在后是基于规则的时代(select /*+rule*/ count(*) from tab_big,tab.small),现在是基于代价的时代,两种写法一样的。

表的条件顺序

过滤条件越多,越放在后面-> 错

not in,not exists

anti反连接算法比filter高效,10g中,oracle指定非空,not in才用anti算法.11g中not in 和not exists一样,无论是否非空,都走anti算法。

设计

全局临时表

delete删除开销大,占用大量回滚段和产生大量日志。

CREATE GLOBAL TEMPORARY TABLE temp_table_session (...) ON COMMIT (PRESERVE|DELETE) ROWS

session全局临时表:退出session记录清空

基于事务全局临时表:commit表记录清空

分区表

create table range_part_tab (id number,deal_date date,area_code number,contents varchar2(4000))
partition by range (deal_date)
(
partition p1 values less than (TO_DATE('2012-02-01', 'YYYY-MM-DD')),
...
partition p_max values less than (maxvalue)
)
;

oracle的 分表 详解 —–表分区

历史数据管理

开发

避免SQL中函数调用

用表连接代替函数调用

用集合写法

只取所需列

  1. 访问视图变快,可以避免访问更多表
  2. 可以通过索引得到列,无需回表
  3. 表连接变快,避免连接更多的表

超长SQL优化

  • case when相同代码封装
  • group by简化case when(部分适用)

根据场景选择技术

索引坏处

  1. 先插入数据,再创建索引。
  2. 在有索引时插入数据很慢,需要保持数据有序
  3. 分成两个库(一个生产库,很少索引)(一个查询库,很多索引)

分区慢:分区不加where会使性能变慢

位图索引:位图索引适合只有几个固定值的列,如性别、婚姻状况、行政区等等,而身份证号这种类型不适合用位图索引。

等价改写

-- 不等价 一份复制,两份粘贴
insert all into ljb_tmp_transaction into ljb_tmp_session select * from dba_objects
-- 不等价,同一时刻记录不一样
insert into ljb_tmp_transaction as select * from dba_objects;
insert into jb_tmp_session as select * from dba_objects;

-- 没有办法同时扫描叶子,性能比第二条差,但是不等价
select min(object_id),max(object_id) from t;
-- 不是同一时刻
select max(object_id) from t;
select min(object_id) from t;
-- a,b同时一条,索引不会有笛卡尔积 和第一条等价,性能好
select max, min
from (select max(object_id) max from t ) a,
(select min(object_id) min from t ) b;

in性能好于>,<

需求是顶级优化

BIO,NIO,AIO的区别

发表评论

电子邮件地址不会被公开。 必填项已用*标注