mysql 多表join顺序计算-贪婪算法笔记

算法流程：

1. 对需要进行参与join的表进行排序，按照rows的多少进行排序。

2. 然后采用深度优先遍历方式查找最优的表join顺序

注: 如果表个数比较少，则退化为穷举算法。如果表个数太多，则仅仅探测到指定深度结束。

思路：

每次表都有两个集合，已经链接的集合A，以及未连接的集合A'。其中A中的链接顺序已经指定，cost代价也已经计算出来。

每次都是拿A的最优子计划和A'中的每一个表做尝试（尝试的使用了递归编程，即深度优先遍历。是的代码很不好读）。

最开始A的集合为空，经过一次BestExtension，则会找出一个最优的可连接表，放到A中。

N层：

BestExtension实现，使用了递归编码，每次递归前先把之前rows-order表原始顺序保存一份，带本次递归调用结束，再复原。

保证探测的时候，不会破坏这个顺序表。

实现是一个for循环，每次都去一个表，swap到idx，然后把该表剔除，剩下的表A'，递归输入。

。。。

0层：经过若干次递归栈帧，最后传入的A'集合只有一个表T7（假定T7），计算T7的最优访问路径，加上之前的传入的cost（A集合中链接顺序的

代价Cost），这时深度优先遍历，就到达了递归探测的底部【探底】，则目前最计划的Cost还是DBL_MAX，对比后，则自然

可以替换DBL_MAX，最优计划Cost/探底。

1 层：探底后，则会返回到上层，则A'集合会为2个表，探测另外一个表，继续探底，或者代码已经大于当前最优计划，终止探测。返回上层。

。。。

返回到N层，A’的集合也会增加。

层次越高，未连接表越多，层次底部则未连接表为1。

探测的原则，如果发现当前cost已经大于当前最优Cost，则终止探测，否则继续探测，知道探底，几所出当前分支所有连接顺序的Cost。如果最优，替换之，否则，返回上层，继续探测。

有两个比较极端的情况：

1）当需要JOIN的表的数量小于search_depth时，这里就退化为一个深度优先的穷举确定最优执行计划

2）当search_depth = 1的时候，函数退化为"极其"贪婪的算法，每次从当前的剩余的表中取一个成本最小的，来扩展当前的执行计划

剩余的情况就是介于上面两者之间。

源码缩略：

1. 顶层：

procedure greedy_search

input: remaining_tables

output: pplan;

{

    pplan = ;

    do {

        (t, a) = best_extension(pplan, remaining_tables);

        pplan = concat(pplan, (t, a));

        remaining_tables = remaining_tables - t;

    } while (remaining_tables != {})

    return pplan;

}

这里的(t , a)表示，每次best_extension返回下一个需要JOIN的表t，并且确定的访问方式是a。上面的代码中，执行计划的扩展由函数best_extension，初始pplan为空，do循环结束输出最终的执行计划。

2. 核心算法

procedure best_extension_by_limited_search(

    pplan in, // in, partial plan of tables-joined-so-far

    pplan_cost, // in, cost of pplan

    remaining_tables, // in, set of tables not referenced in pplan

    best_plan_so_far, // in/out, best plan found so far

    best_plan_so_far_cost,// in/out, cost of best_plan_so_far

    search_depth) // in, maximum size of the plans being considered

{

    // 保存原始rows-order表顺序

    memcpy(saved_refs, join->best_ref + idx, sizeof(JOIN_TAB*) * (join->tables - idx));

    // 递归遍历A'中的每一个表

    for each table T from remaining_tables

    {

        // 此次都是把Swap一下目标探测表，到Idx，Idx表，探测会被放到A集合中

swap_variables(JOIN_TAB*, join->best_ref[idx], *pos);

// Calculate the cost of using table T as above

cost = complex-series-of-calculations;

        // Add the cost to the cost so far.

        pplan_cost+= cost;

        // 如果已经超出当前的代价，则跳过

        if (pplan_cost >= best_plan_so_far_cost)

continue;

// 计算当前表的最佳访问方法（scan、ssek）

        pplan= expand pplan by best_access_method;

        remaining_tables= remaining_tables - table T;

        if (remaining_tables is not an empty set

      and search_depth > 1)

        {

          best_extension_by_limited_search(pplan, pplan_cost,

            remaining_tables,

            best_plan_so_far,

            best_plan_so_far_cost,

            search_depth - 1);

        }

        else

        {

          best_plan_so_far_cost= pplan_cost;

            best_plan_so_far= pplan;

        }

    }

fun_end:

    // 还原rows-order表的顺序

    memcpy(join->best_ref + idx, saved_refs, sizeof(JOIN_TAB*) * (join->tables-idx));

}

最后编辑于：2018.06.05 09:37:18

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,905评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,140评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,791评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,483评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,476评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,516评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,905评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,560评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,778评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,557评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,635评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,338评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,925评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,898评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,142评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,818评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,347评论 2赞 342

mysql 多表join顺序计算-贪婪算法笔记

推荐阅读更多精彩内容