旅行商问题与蚁群算法

1 引言

旅行商问题(Traveling Salesman Problem,TSP)是一个经典的组合优化问题:说有一个商品推销员要去若干个城市推销商品,该推销员从一个城市出发,需要经过所有城市后,回到出发地。请问他应如何选择行进路线,以使总的行程最短?

旅行商问题的可行解是所有城市(假设数目为n)的全排列(n!)。随着城市数目的增加,可行解数目呈现指数增长,无法再多项式时间内穷举,因此TSP问题是一个非确定性多项式(Non-deterministic Polynomial )问题,也就是“NP”问题。由于较高的时间复杂度,“NP”问题规模较大时无法精确求解,因此只能寻求近似求解。

1997年,Dorigo等人[1]提出蚁群算法(Ant Colony System)并用于求解旅行商问题。蚁群算法受到“蚁群总是能以较短路线觅得食物”这一现象的启发。图1演示了这一过程:(a)中一些蚂蚁达到了分叉路口(一个决策点);(b)中一些蚂蚁选择了上方的路,另一些选择了下方的路;蚂蚁通常匀速前进并匀速释放信息素(Pheromone,用短虚线表示),(c)中选择更短路径的蚂蚁可以更快到达目标点,并且在路径上留下更浓密的信息素;(d)中越短的路径上留下了越多的信息素。后来的蚂蚁在路过相同的决策点是,有较大概率选择信息素浓度较高的路径,从而提升整个蚁群的觅食效率。
蚁群行进策略演示
图1 蚁群行进策略演示

蚁群这这种智能优化方法如何通过形成算法和代码为我们所用呢?这就是本文要解决的问题。

2 方法

蚁群算法的流程是循环执行以下步骤,直到满足退出条件:

  • 初始化蚁群参数。
  • 蚁群中每只蚂蚁搜索一个可行解。
  • 根据一次蚁群搜索的结果更新信息素。
  • 判断是否终止与退出。

下面以求解旅行商问题为例,说明各个步骤。

2.1 初始化蚁群参数

在旅行商问题中,设城市的数量为n,城市ij之间的距离为d_{ij}(i,j=1,2,\cdots,n)

在蚁群算法中,设蚁群中蚂蚁数量为mt时刻城市i与城市j路上的信息素浓度为\tau_{ij}(t)。初始时刻t=0时,各个城市之间连接路径上的信息素浓度相同,且为\tau_0,也就是\tau_{ij}(0)=\tau_0

2.2 一只蚂蚁搜索可行解(转移概率建模)

蚁群中的蚂蚁k(k=1,2,\cdots,m)随机选择一个城市作为出发点,然后依概率随机选择下一个目标城市。设蚂蚁kt时刻从城市i前往可达城市j的转移概率为P_{ij}^k(t),我们按如下思路建模:

  • 根据蚁群的特性,转移概率P_{ij}^k(t)应与城市之间的信息素浓度\tau_{ij}(t)正相关。这里假设成正比,即
P_{ij}^k(t) \propto \tau_{ij}(t) \tag{1}

  • 除了信息素之外,我们对路径选择可能存在已知的偏好(Prior,也称为“先验”或者启发函数),记为\eta_{ij},则转移概率P_{ij}^k(t)应与偏好\eta_{ij}正相关。 例如,可利用已知的城市间距离信息,依据“贪心策略”选择当前距离自己最靠近的城市。可令偏好\eta_{ij}为城市之间距离d_{ij}的反比, 则有
P_{ij}^k(t) \propto \eta_{ij}=\frac{1}{d_{ij}} \tag{2}

再考虑概率的归一化特性,可得概率P_{ij}^k(t)的计算公式为[2]

P_{ij}^k = \left\{
\begin{aligned}
\frac{\tau_{ij}(t)^\alpha \cdot \eta_{ij}(t)^\beta}{\Sigma_{s \in allow_k} \tau_{is}(t)^\alpha \cdot \eta_{is}(t)^\beta},& s \in allow_k \\
0,& s \notin allow_k 
\end{aligned}
\right.
\tag{3}

其中allow_k(k=1,2,3,\cdots,m)为蚂蚁待访问的城市集合。常数参数\alpha为信息素重要度因子,\beta为偏好重要度因子,分别用于调节信息素和偏好在转移概率中所起的作用大小。当\alpha=0,转移概率完全由偏好决定,算法退化为贪心算法;当\beta=0,转移概率完全由信息素决定,算法就成了正反馈启发式算法。

2.3 更新信息素

经过n个时刻,蚁群中的蚂蚁走完所有城市,每只蚂蚁所走过的路径就是一个解。此时,需要对信息素进行一次更新,以便下一次循环中蚁群利用新的信息素进行决策——选择每一步转移的城市。

注意在蚂蚁释放信息素的同时,各个城市间连接路径上的信息素也会随时间(循环优化的次数)逐渐消失。设参数\rho \in (0, 1)表示信息素挥发的速度,则信息素的更新公式如公式(4)所示:

\left\{
\begin{aligned}
\tau_{ij}(t+1) &= (1-\rho)\tau_{ij}(t) + \Delta \tau_{ij} \\
\Delta \tau_{ij} &= \sum_{k=1}^m \Delta \tau_{ij}^k 
\end{aligned}
\right.
\tag{4}

其中\Delta \tau_{ij}表示蚁群中所有蚂蚁在城市i与城市j连接路径上释放的信息素浓度之和;\Delta \tau_{ij}^k表示第k只蚂蚁在城市i与城市j连接路径上释放的信息素浓度。蚂蚁走过路径总长度越小,则释放的信息素越大。据此可以对蚂蚁k的信息素变化建立一个简单的反比模型,如公式(5)所示:

\Delta \tau_{ij}^k = \left\{ 
\begin{aligned}
\frac{Q}{L_k},& \text{第}k\text{只蚂蚁从城市}i\text{访问城市}j \\
0,& \text{其他}
\end{aligned}
\right.
\tag{5}

其中Q为常数,表示蚂蚁循环一次所释放的信息素总量;L_k为第k只蚂蚁经过的路径总长度。

2.4 判断终止与退出

通常,蚁群算法设定有最大循环搜索次数,达到最大循环次数,则算法退出。

3 Python代码实现

落难Coder的知乎中对于蚁群算法求解TSP问题有一个很好的实现,本文直接引用:

import random
import copy
import time
import sys
import math
import tkinter #//GUI模块
import threading
from functools import reduce

# 参数
'''
ALPHA:信息启发因子,值越大,则蚂蚁选择之前走过的路径可能性就越大
      ,值越小,则蚁群搜索范围就会减少,容易陷入局部最优
BETA:Beta值越大,蚁群越就容易选择局部较短路径,这时算法收敛速度会
     加快,但是随机性不高,容易得到局部的相对最优
'''
(ALPHA, BETA, RHO, Q) = (1.0,2.0,0.5,100.0)
# 城市数,蚁群
(city_num, ant_num) = (50,50)
distance_x = [
    178,272,176,171,650,499,267,703,408,437,491,74,532,
    416,626,42,271,359,163,508,229,576,147,560,35,714,
    757,517,64,314,675,690,391,628,87,240,705,699,258,
    428,614,36,360,482,666,597,209,201,492,294]
distance_y = [
    170,395,198,151,242,556,57,401,305,421,267,105,525,
    381,244,330,395,169,141,380,153,442,528,329,232,48,
    498,265,343,120,165,50,433,63,491,275,348,222,288,
    490,213,524,244,114,104,552,70,425,227,331]
#城市距离和信息素
distance_graph = [ [0.0 for col in range(city_num)] for raw in range(city_num)]
pheromone_graph = [ [1.0 for col in range(city_num)] for raw in range(city_num)]

#----------- 蚂蚁 -----------
class Ant(object):

    # 初始化
    def __init__(self,ID):

        self.ID = ID                 # ID
        self.__clean_data()          # 随机初始化出生点

    # 初始数据
    def __clean_data(self):

        self.path = []               # 当前蚂蚁的路径           
        self.total_distance = 0.0    # 当前路径的总距离
        self.move_count = 0          # 移动次数
        self.current_city = -1       # 当前停留的城市
        self.open_table_city = [True for i in range(city_num)] # 探索城市的状态

        city_index = random.randint(0,city_num-1) # 随机初始出生点
        self.current_city = city_index
        self.path.append(city_index)
        self.open_table_city[city_index] = False
        self.move_count = 1

    # 选择下一个城市
    def __choice_next_city(self):

        next_city = -1
        select_citys_prob = [0.0 for i in range(city_num)]  #存储去下个城市的概率
        total_prob = 0.0

        # 获取去下一个城市的概率
        for i in range(city_num):
            if self.open_table_city[i]:
                try :
                    # 计算概率:与信息素浓度成正比,与距离成反比
                    select_citys_prob[i] = pow(pheromone_graph[self.current_city][i], ALPHA) * pow((1.0/distance_graph[self.current_city][i]), BETA)
                    total_prob += select_citys_prob[i]
                except ZeroDivisionError as e:
                    print ('Ant ID: {ID}, current city: {current}, target city: {target}'.format(ID = self.ID, current = self.current_city, target = i))
                    sys.exit(1)

        # 轮盘选择城市
        if total_prob > 0.0:
            # 产生一个随机概率,0.0-total_prob
            temp_prob = random.uniform(0.0, total_prob)
            for i in range(city_num):
                if self.open_table_city[i]:
                    # 轮次相减
                    temp_prob -= select_citys_prob[i]
                    if temp_prob < 0.0:
                        next_city = i
                        break

        # 未从概率产生,顺序选择一个未访问城市
        # if next_city == -1:
        #     for i in range(city_num):
        #         if self.open_table_city[i]:
        #             next_city = i
        #             break

        if (next_city == -1):
            next_city = random.randint(0, city_num - 1)
            while ((self.open_table_city[next_city]) == False):  # if==False,说明已经遍历过了
                next_city = random.randint(0, city_num - 1)

        # 返回下一个城市序号
        return next_city

    # 计算路径总距离
    def __cal_total_distance(self):

        temp_distance = 0.0

        for i in range(1, city_num):
            start, end = self.path[i], self.path[i-1]
            temp_distance += distance_graph[start][end]

        # 回路
        end = self.path[0]
        temp_distance += distance_graph[start][end]
        self.total_distance = temp_distance

    # 移动操作
    def __move(self, next_city):

        self.path.append(next_city)
        self.open_table_city[next_city] = False
        self.total_distance += distance_graph[self.current_city][next_city]
        self.current_city = next_city
        self.move_count += 1

    # 搜索路径
    def search_path(self):

        # 初始化数据
        self.__clean_data()

        # 搜素路径,遍历完所有城市为止
        while self.move_count < city_num:
            # 移动到下一个城市
            next_city =  self.__choice_next_city()
            self.__move(next_city)

        # 计算路径总长度
        self.__cal_total_distance()

#----------- TSP问题 -----------

class TSP(object):

    def __init__(self, root, width = 800, height = 600, n = city_num):

        # 创建画布
        self.root = root                               
        self.width = width      
        self.height = height
        # 城市数目初始化为city_num
        self.n = n
        # tkinter.Canvas
        self.canvas = tkinter.Canvas(
                root,
                width = self.width,
                height = self.height,
                bg = "#EBEBEB",             # 背景白色 
                xscrollincrement = 1,
                yscrollincrement = 1
            )
        self.canvas.pack(expand = tkinter.YES, fill = tkinter.BOTH)
        self.title("TSP蚁群算法(n:初始化 e:开始搜索 s:停止搜索 q:退出程序)")
        self.__r = 5
        self.__lock = threading.RLock()     # 线程锁

        self.__bindEvents()
        self.new()

        # 计算城市之间的距离
        for i in range(city_num):
            for j in range(city_num):
                temp_distance = pow((distance_x[i] - distance_x[j]), 2) + pow((distance_y[i] - distance_y[j]), 2)
                temp_distance = pow(temp_distance, 0.5)
                distance_graph[i][j] =float(int(temp_distance + 0.5))

    # 按键响应程序
    def __bindEvents(self):

        self.root.bind("q", self.quite)        # 退出程序
        self.root.bind("n", self.new)          # 初始化
        self.root.bind("e", self.search_path)  # 开始搜索
        self.root.bind("s", self.stop)         # 停止搜索

    # 更改标题
    def title(self, s):

        self.root.title(s)

    # 初始化
    def new(self, evt = None):

        # 停止线程
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()

        self.clear()     # 清除信息 
        self.nodes = []  # 节点坐标
        self.nodes2 = [] # 节点对象

        # 初始化城市节点
        for i in range(len(distance_x)):
            # 在画布上随机初始坐标
            x = distance_x[i]
            y = distance_y[i]
            self.nodes.append((x, y))
            # 生成节点椭圆,半径为self.__r
            node = self.canvas.create_oval(x - self.__r,
                    y - self.__r, x + self.__r, y + self.__r,
                    fill = "#ff0000",      # 填充红色
                    outline = "#000000",   # 轮廓白色
                    tags = "node",
                )
            self.nodes2.append(node)
            # 显示坐标
            self.canvas.create_text(x,y-10,              # 使用create_text方法在坐标(302,77)处绘制文字
                    text = '('+str(x)+','+str(y)+')',    # 所绘制文字的内容
                    fill = 'black'                       # 所绘制文字的颜色为灰色
                )

        # 顺序连接城市
        #self.line(range(city_num))

        # 初始城市之间的距离和信息素
        for i in range(city_num):
            for j in range(city_num):
                pheromone_graph[i][j] = 1.0

        self.ants = [Ant(ID) for ID in range(ant_num)]  # 初始蚁群
        self.best_ant = Ant(-1)                          # 初始最优解
        self.best_ant.total_distance = 1 << 31           # 初始最大距离
        self.iter = 1                                    # 初始化迭代次数 

    # 将节点按order顺序连线
    def line(self, order):
        # 删除原线
        self.canvas.delete("line")
        def line2(i1, i2):
            p1, p2 = self.nodes[i1], self.nodes[i2]
            self.canvas.create_line(p1, p2, fill = "#000000", tags = "line")
            return i2

        # order[-1]为初始值
        reduce(line2, order, order[-1])

    # 清除画布
    def clear(self):
        for item in self.canvas.find_all():
            self.canvas.delete(item)

    # 退出程序
    def quite(self, evt):
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()
        self.root.destroy()
        print (u"\n程序已退出...")
        sys.exit()

    # 停止搜索
    def stop(self, evt):
        self.__lock.acquire()
        self.__running = False
        self.__lock.release()

    # 开始搜索
    def search_path(self, evt = None):

        # 开启线程
        self.__lock.acquire()
        self.__running = True
        self.__lock.release()

        while self.__running:
            # 遍历每一只蚂蚁
            for ant in self.ants:
                # 搜索一条路径
                ant.search_path()
                # 与当前最优蚂蚁比较
                if ant.total_distance < self.best_ant.total_distance:
                    # 更新最优解
                    self.best_ant = copy.deepcopy(ant)
            # 更新信息素
            self.__update_pheromone_gragh()
            print (u"迭代次数:",self.iter,u"最佳路径总距离:",int(self.best_ant.total_distance))
            # 连线
            self.line(self.best_ant.path)
            # 设置标题
            self.title("TSP蚁群算法(n:随机初始 e:开始搜索 s:停止搜索 q:退出程序) 迭代次数: %d" % self.iter)
            # 更新画布
            self.canvas.update()
            self.iter += 1

    # 更新信息素
    def __update_pheromone_gragh(self):

        # 获取每只蚂蚁在其路径上留下的信息素
        temp_pheromone = [[0.0 for col in range(city_num)] for raw in range(city_num)]
        for ant in self.ants:
            for i in range(1,city_num):
                start, end = ant.path[i-1], ant.path[i]
                # 在路径上的每两个相邻城市间留下信息素,与路径总距离反比
                temp_pheromone[start][end] += Q / ant.total_distance
                temp_pheromone[end][start] = temp_pheromone[start][end]

        # 更新所有城市之间的信息素,旧信息素衰减加上新迭代信息素
        for i in range(city_num):
            for j in range(city_num):
                pheromone_graph[i][j] = pheromone_graph[i][j] * RHO + temp_pheromone[i][j]

    # 主循环
    def mainloop(self):
        self.root.mainloop()

#----------- 程序的入口处 -----------![请添加图片描述](https://img-blog.csdnimg.cn/cffb2f0918614eb28c8c50b1bb5a9c2f.png)

if __name__ == '__main__':
    TSP(tkinter.Tk()).mainloop()

将上面的代码写入tsp.py文件,然后从命令行运行

python3 tsp.py

即可直观感受蚁群算法迭代优化旅行商问题的过程。

参考文献与致谢

[1] Dorigo, Marco, and Luca Maria Gambardella. "Ant colony system: a cooperative learning approach to the traveling salesman problem." IEEE Transactions on evolutionary computation 1, no. 1 (1997): 53-66.

[2] 老马的程序人生

[3] 落难Coder的知乎

最后,让我们膜拜大神,感谢Dorigo等人为我们带来了蚁群算法。

Marco Dorigo

图2 Marco Dorigo(蚁群算法论文的一作)