在code的过程中曾经遇到过一个神奇的问题:
现在有多条火车线路,经过了若干站点,找出经过P站点能直接到达的所有站点。
其中在数据库中存储的线路是分路段存储,格式是 ID A_STATION Z_STATION 其他属性略,比如 a->b->c->d->e->f->g 那么存储的数据 为
1 a b
2 c b
3 c d
...
看出来了,分路段存储,但是又无序,不是严格按照 a->b , b->c , c->d 这样存储的,刚开始的时候,我也没有想过其他方法,直接在代码中使用了递归来判断,循环查询数据,但是发现这样效率并不高,而且递归的过程中很容易出错,这时候,我发现oracle中有一个connect by实现的递归查询,于是打算使用一下。
使用过程中发现由于数据不是严格的有序排序,A,Z无序,无法直接使用,这时,我动了一个歪脑筋,由于表中数据量也不是太大,只有几万条记录,我能不能把表中所有数据翻转一下,A,Z 变成 Z,A然后重命名为 A,Z,再使用union 拼接成两倍记录的新表,想到之后马上就做,于是有了:
(select id,a_id,z_id
from table
union
select id,z_id as a_id,a_id as z_id
from table) t
这是一张新的表,里面的记录是原表的两倍,然后对这个表进行connect by 递归查询:
select *
from (select id, a_id, z_id
from table
union
select id, z_id as a_id, a_id as z_id
from table) t
start with t.a_id = ?
connect by prior t.z_id = t.a_id
哈哈,这下好了吧,解决了无序的问题。可是新的问题出现了,我一运行,没有报错,可是数据怎么有问题。重复了两次?仔细一想,数据重复了两次,这样不但查询出来的结果会有问题,而且说不定还会报无限递归调用的错误(可能是我使用的ID正好,所有偶然的没有报错,不然会无限递归报错)。这个怎么解决呢?
然后我查询了一下网上oracle 的 connect by 使用的很多案例,发现了oracle的一个关键字“NOCYCLE”,还有嵌套使用的一个条件“connect_by_iscycle = 0”,限制了递归过程中不能成环,然后再加上我自己生成的数据跟原始数据的id是相同的,那么我可以限制id只能出现一次,不能重复使用一条记录递归“t.id <> t.id”经过修改,最终的SQL成了下面这样:
select *
from (select id, a_id, z_id
from table
union
select id, z_id as a_id, a_id as z_id
from table) t
where connect_by_iscycle = 0
start with t.a_id = ?
connect by NOCYCLE prior t.z_id = t.a_id
and prior t.id <> t.id
最终实现了需求,当然,我这样使用在很多时候是不合规的,有什么不对的,还请大家指出,只是这里是一种特殊的情况中的特殊用法,这种骚操作还是不要推广的好。