大战熟女丰满人妻av-荡女精品导航-岛国aaaa级午夜福利片-岛国av动作片在线观看-岛国av无码免费无禁网站-岛国大片激情做爰视频

專注Java教育14年 全國咨詢/投訴熱線:400-8080-105
動力節(jié)點LOGO圖
始于2009,口口相傳的Java黃埔軍校
首頁 學(xué)習(xí)攻略 Java學(xué)習(xí) MySQL中distinct和group by性能比較

MySQL中distinct和group by性能比較

更新時間:2021-02-12 14:00:00 來源:動力節(jié)點 瀏覽5169次

MySQL是目前最流行的關(guān)系型數(shù)據(jù)庫之一,而關(guān)系數(shù)據(jù)庫將數(shù)據(jù)保存在不同的表中,而不是將所有數(shù)據(jù)放在一個大倉庫內(nèi),這樣就增加了速度并提高了靈活性。我們知道在MySQL數(shù)據(jù)庫中DISTINCT可以去掉重復(fù)數(shù)據(jù),而GROUP BY在分組后也會去掉重復(fù)數(shù)據(jù),那這兩個關(guān)鍵字在去掉重復(fù)數(shù)據(jù)時的效率,究竟誰會更高一點?本文我們就來比較一些distinct和group by的性能。

一、測試過程:

準(zhǔn)備一張測試表   

??CREATE TABLE `test_test` (
?????`id` int(11) NOT NULL auto_increment,
??????`num` int(11) NOT NULL default '0',
??????PRIMARY KEY ?(`id`)
?????) ENGINE=MyISAM ?DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;

建個儲存過程向表中插入10W條數(shù)據(jù)  

???create procedure p_test(pa int(11))
?????begin
??????declare max_num int(11) default 100000;
??????declare i int default 0;
?????declare rand_num int;
??????select count(id) into max_num from test_test;
?????while i < pa do
??????????????if max_num < 100000 then
??????????????????????select cast(rand()*100 as unsigned) into rand_num;
??????????????????????insert into test_test(num)values(rand_num);
??????????????end if;
??????????????set i = i +1;
??????end while;
?????end

調(diào)用存儲過程插入數(shù)據(jù)

call p_test(100000);

開始測試:(不加索引)   

?select distinct num from test_test;
????select num from test_test group by num;
????[SQL] select distinct num from test_test;
????受影響的行: 0
????時間: 0.078ms
????[SQL] ?
???select num from test_test group by num;
???受影響的行: 0
????時間: 0.031ms

二、num字段上創(chuàng)建索引

ALTER TABLE `test_test` ADD INDEX `num_index` (`num`) ;

再次查詢   

select distinct num from test_test;
????select num from test_test group by num;
????[SQL] select distinct num from test_test;
???受影響的行: 0
????時間: 0.000ms
????[SQL] ?
????select num from test_test group by num;
????受影響的行: 0
????時間: 0.000ms

這時候我們發(fā)現(xiàn)時間太小了 0.000秒都無法精確了。

我們轉(zhuǎn)到命令行下 測試   

?mysql> set profiling=1;
????mysql> select distinct(num) from test_test;
????mysql> select num from test_test group by num;
????mysql> show profiles;
????+----------+------------+----------------------------------------+
????| Query_ID | Duration ??| Query ?????????????????????????????????|
????+----------+------------+----------------------------------------+
????| ???????1 | 0.00072550 | select distinct(num) from test_test ???|
????| ???????2 | 0.00071650 | select num from test_test group by num |
???+----------+------------+----------------------------------------+

?

加了索引之后 distinct 比沒加索引的 distinct 快了 107倍。

加了索引之后 group by 比沒加索引的 group by 快了 43倍。

再來對比 :distinct  和 group by

不管是加不加索引 group by 都比 distinct 快。因此使用的時候建議選 group by。

默認(rèn)情況下,distinct會被hive翻譯成一個全局唯一reduce任務(wù)來做去重操作,因而并行度為1。而group by則會被hive翻譯成分組聚合運算,會有多個reduce任務(wù)并行處理,每個reduce對收到的一部分?jǐn)?shù)據(jù)組,進行每組聚合(去重)

通過上述兩個實驗,我們可以得出這樣一條結(jié)論:在重復(fù)量比較高的表中,使用DISTINCT可以有效提高查詢效率,而在重復(fù)量比較低的表中,使用DISTINCT會嚴(yán)重降低查詢效率。所以并不是所有的DISTINCT都是降低效率的,當(dāng)然你得提前判斷數(shù)據(jù)的重復(fù)量。想要獲取更多的MySQL知識,請到本站的MySQL教程觀看最新的MySQL學(xué)習(xí)資料,開啟全新的MySQL學(xué)習(xí)之旅。

提交申請后,顧問老師會電話與您溝通安排學(xué)習(xí)

免費課程推薦 >>
技術(shù)文檔推薦 >>
主站蜘蛛池模板: 久热只有精品 | 欧美国产精品日韩在线 | 久久99国产精品免费观看 | 奇米影视第四色在线观看 | 国产成人精品视频播放 | 综合伊人久久在一二三区 | 日本婷婷 | 国产精品亚洲成在人线 | 欧美性影院 | 亚洲最大网 | 国产一区二区三区精品视频 | 奇米四色影视 | 国产日韩欧美自拍 | 四虎在线看 | 九九视频网 | 国产成人久视频免费 | 分分操这里只有精品 | 中文字幕日韩视频 | 免费观看成人羞羞视频网站观看 | 欧美日韩国产三级 | 久久另类| 亚洲欧美日产综合一区二区三区 | 中文乱码精品一区二区三区 | 啪啪网站色大全免费 | 久久青草国产精品一区 | 久久九九99热这里只有精品 | 超级碰碰青草久热国产 | 国产在线视频不卡 | 成人亚洲欧美 | 女性一级全黄生活片免费看 | 亚洲综合日韩在线亚洲欧美专区 | 国产美女久久精品香蕉69 | 亚洲国产欧美在线不卡中文 | 九九亚洲精品自拍 | 日韩精品成人a在线观看 | 欧美不卡在线观看 | 国产视频第二页 | 日本最新在线 | 黄色综合网 | 香蕉爱视频 | 亚洲大胆精品337p色 |