1 引言
旅行商问题(Traveling Salesman Problem,TSP)是一个经典的组合优化问题:说有一个商品推销员要去若干个城市推销商品,该推销员从一个城市出发,需要经过所有城市后,回到出发地。请问他应如何选择行进路线,以使总的行程最短?
旅行商问题的可行解是所有城市(假设数目为n
)的全排列(n!
)。随着城市数目的增加,可行解数目呈现指数增长,无法再多项式时间内穷举,因此TSP问题是一个非确定性多项式(Non-deterministic Polynomial )问题,也就是“NP”问题。由于较高的时间复杂度,“NP”问题规模较大时无法精确求解,因此只能寻求近似求解。
1997年,Dorigo等人[1]提出蚁群算法(Ant Colony System)并用于求解旅行商问题。蚁群算法受到“蚁群总是能以较短路线觅得食物”这一现象的启发。图1演示了这一过程:(a)中一些蚂蚁达到了分叉路口(一个决策点);(b)中一些蚂蚁选择了上方的路,另一些选择了下方的路;蚂蚁通常匀速前进并匀速释放信息素(Pheromone,用短虚线表示),(c)中选择更短路径的蚂蚁可以更快到达目标点,并且在路径上留下更浓密的信息素;(d)中越短的路径上留下了越多的信息素。后来的蚂蚁在路过相同的决策点是,有较大概率选择信息素浓度较高的路径,从而提升整个蚁群的觅食效率。
图1 蚁群行进策略演示
蚁群这这种智能优化方法如何通过形成算法和代码为我们所用呢?这就是本文要解决的问题。
2 方法
蚁群算法的流程是循环执行以下步骤,直到满足退出条件:
- 初始化蚁群参数。
- 蚁群中每只蚂蚁搜索一个可行解。
- 根据一次蚁群搜索的结果更新信息素。
- 判断是否终止与退出。
下面以求解旅行商问题为例,说明各个步骤。
2.1 初始化蚁群参数
在旅行商问题中,设城市的数量为n
,城市i
与j
之间的距离为d_{ij}(i,j=1,2,\cdots,n)
。
在蚁群算法中,设蚁群中蚂蚁数量为m
,t
时刻城市i
与城市j
路上的信息素浓度为\tau_{ij}(t)
。初始时刻t=0
时,各个城市之间连接路径上的信息素浓度相同,且为\tau_0
,也就是\tau_{ij}(0)=\tau_0
。
2.2 一只蚂蚁搜索可行解(转移概率建模)
蚁群中的蚂蚁k(k=1,2,\cdots,m)
随机选择一个城市作为出发点,然后依概率随机选择下一个目标城市。设蚂蚁k
在t
时刻从城市i
前往可达城市j
的转移概率为P_{ij}^k(t)
,我们按如下思路建模:
- 根据蚁群的特性,转移概率
P_{ij}^k(t)
应与城市之间的信息素浓度\tau_{ij}(t)
正相关。这里假设成正比,即
P_{ij}^k(t) \propto \tau_{ij}(t) \tag{1}
- 除了信息素之外,我们对路径选择可能存在已知的偏好(Prior,也称为“先验”或者启发函数),记为
\eta_{ij}
,则转移概率P_{ij}^k(t)
应与偏好\eta_{ij}
正相关。 例如,可利用已知的城市间距离信息,依据“贪心策略”选择当前距离自己最靠近的城市。可令偏好\eta_{ij}
为城市之间距离d_{ij}
的反比, 则有
P_{ij}^k(t) \propto \eta_{ij}=\frac{1}{d_{ij}} \tag{2}
再考虑概率的归一化特性,可得概率P_{ij}^k(t)
的计算公式为[2]
P_{ij}^k = \left\{
\begin{aligned}
\frac{\tau_{ij}(t)^\alpha \cdot \eta_{ij}(t)^\beta}{\Sigma_{s \in allow_k} \tau_{is}(t)^\alpha \cdot \eta_{is}(t)^\beta},& s \in allow_k \\
0,& s \notin allow_k
\end{aligned}
\right.
\tag{3}
其中allow_k(k=1,2,3,\cdots,m)
为蚂蚁待访问的城市集合。常数参数\alpha
为信息素重要度因子,\beta
为偏好重要度因子,分别用于调节信息素和偏好在转移概率中所起的作用大小。当\alpha=0
,转移概率完全由偏好决定,算法退化为贪心算法;当\beta=0
,转移概率完全由信息素决定,算法就成了正反馈启发式算法。
2.3 更新信息素
经过n
个时刻,蚁群中的蚂蚁走完所有城市,每只蚂蚁所走过的路径就是一个解。此时,需要对信息素进行一次更新,以便下一次循环中蚁群利用新的信息素进行决策——选择每一步转移的城市。
注意在蚂蚁释放信息素的同时,各个城市间连接路径上的信息素也会随时间(循环优化的次数)逐渐消失。设参数\rho \in (0, 1)
表示信息素挥发的速度,则信息素的更新公式如公式(4)所示:
\left\{
\begin{aligned}
\tau_{ij}(t+1) &= (1-\rho)\tau_{ij}(t) + \Delta \tau_{ij} \\
\Delta \tau_{ij} &= \sum_{k=1}^m \Delta \tau_{ij}^k
\end{aligned}
\right.
\tag{4}
其中\Delta \tau_{ij}
表示蚁群中所有蚂蚁在城市i
与城市j
连接路径上释放的信息素浓度之和;\Delta \tau_{ij}^k
表示第k
只蚂蚁在城市i
与城市j
连接路径上释放的信息素浓度。蚂蚁走过路径总长度越小,则释放的信息素越大。据此可以对蚂蚁k
的信息素变化建立一个简单的反比模型,如公式(5)所示:
\Delta \tau_{ij}^k = \left\{
\begin{aligned}
\frac{Q}{L_k},& \text{第}k\text{只蚂蚁从城市}i\text{访问城市}j \\
0,& \text{其他}
\end{aligned}
\right.
\tag{5}
其中Q
为常数,表示蚂蚁循环一次所释放的信息素总量;L_k
为第k
只蚂蚁经过的路径总长度。
2.4 判断终止与退出
通常,蚁群算法设定有最大循环搜索次数,达到最大循环次数,则算法退出。
3 Python代码实现
落难Coder的知乎中对于蚁群算法求解TSP问题有一个很好的实现,本文直接引用:
import random
import copy
import time
import sys
import math
import tkinter #//GUI模块
import threading
from functools import reduce
# 参数
'''
ALPHA:信息启发因子,值越大,则蚂蚁选择之前走过的路径可能性就越大
,值越小,则蚁群搜索范围就会减少,容易陷入局部最优
BETA:Beta值越大,蚁群越就容易选择局部较短路径,这时算法收敛速度会
加快,但是随机性不高,容易得到局部的相对最优
'''
(ALPHA, BETA, RHO, Q) = (1.0,2.0,0.5,100.0)
# 城市数,蚁群
(city_num, ant_num) = (50,50)
distance_x = [
178,272,176,171,650,499,267,703,408,437,491,74,532,
416,626,42,271,359,163,508,229,576,147,560,35,714,
757,517,64,314,675,690,391,628,87,240,705,699,258,
428,614,36,360,482,666,597,209,201,492,294]
distance_y = [
170,395,198,151,242,556,57,401,305,421,267,105,525,
381,244,330,395,169,141,380,153,442,528,329,232,48,
498,265,343,120,165,50,433,63,491,275,348,222,288,
490,213,524,244,114,104,552,70,425,227,331]
#城市距离和信息素
distance_graph = [ [0.0 for col in range(city_num)] for raw in range(city_num)]
pheromone_graph = [ [1.0 for col in range(city_num)] for raw in range(city_num)]
#----------- 蚂蚁 -----------
class Ant(object):
# 初始化
def __init__(self,ID):
self.ID = ID # ID
self.__clean_data() # 随机初始化出生点
# 初始数据
def __clean_data(self):
self.path = [] # 当前蚂蚁的路径
self.total_distance = 0.0 # 当前路径的总距离
self.move_count = 0 # 移动次数
self.current_city = -1 # 当前停留的城市
self.open_table_city = [True for i in range(city_num)] # 探索城市的状态
city_index = random.randint(0,city_num-1) # 随机初始出生点
self.current_city = city_index
self.path.append(city_index)
self.open_table_city[city_index] = False
self.move_count = 1
# 选择下一个城市
def __choice_next_city(self):
next_city = -1
select_citys_prob = [0.0 for i in range(city_num)] #存储去下个城市的概率
total_prob = 0.0
# 获取去下一个城市的概率
for i in range(city_num):
if self.open_table_city[i]:
try :
# 计算概率:与信息素浓度成正比,与距离成反比
select_citys_prob[i] = pow(pheromone_graph[self.current_city][i], ALPHA) * pow((1.0/distance_graph[self.current_city][i]), BETA)
total_prob += select_citys_prob[i]
except ZeroDivisionError as e:
print ('Ant ID: {ID}, current city: {current}, target city: {target}'.format(ID = self.ID, current = self.current_city, target = i))
sys.exit(1)
# 轮盘选择城市
if total_prob > 0.0:
# 产生一个随机概率,0.0-total_prob
temp_prob = random.uniform(0.0, total_prob)
for i in range(city_num):
if self.open_table_city[i]:
# 轮次相减
temp_prob -= select_citys_prob[i]
if temp_prob < 0.0:
next_city = i
break
# 未从概率产生,顺序选择一个未访问城市
# if next_city == -1:
# for i in range(city_num):
# if self.open_table_city[i]:
# next_city = i
# break
if (next_city == -1):
next_city = random.randint(0, city_num - 1)
while ((self.open_table_city[next_city]) == False): # if==False,说明已经遍历过了
next_city = random.randint(0, city_num - 1)
# 返回下一个城市序号
return next_city
# 计算路径总距离
def __cal_total_distance(self):
temp_distance = 0.0
for i in range(1, city_num):
start, end = self.path[i], self.path[i-1]
temp_distance += distance_graph[start][end]
# 回路
end = self.path[0]
temp_distance += distance_graph[start][end]
self.total_distance = temp_distance
# 移动操作
def __move(self, next_city):
self.path.append(next_city)
self.open_table_city[next_city] = False
self.total_distance += distance_graph[self.current_city][next_city]
self.current_city = next_city
self.move_count += 1
# 搜索路径
def search_path(self):
# 初始化数据
self.__clean_data()
# 搜素路径,遍历完所有城市为止
while self.move_count < city_num:
# 移动到下一个城市
next_city = self.__choice_next_city()
self.__move(next_city)
# 计算路径总长度
self.__cal_total_distance()
#----------- TSP问题 -----------
class TSP(object):
def __init__(self, root, width = 800, height = 600, n = city_num):
# 创建画布
self.root = root
self.width = width
self.height = height
# 城市数目初始化为city_num
self.n = n
# tkinter.Canvas
self.canvas = tkinter.Canvas(
root,
width = self.width,
height = self.height,
bg = "#EBEBEB", # 背景白色
xscrollincrement = 1,
yscrollincrement = 1
)
self.canvas.pack(expand = tkinter.YES, fill = tkinter.BOTH)
self.title("TSP蚁群算法(n:初始化 e:开始搜索 s:停止搜索 q:退出程序)")
self.__r = 5
self.__lock = threading.RLock() # 线程锁
self.__bindEvents()
self.new()
# 计算城市之间的距离
for i in range(city_num):
for j in range(city_num):
temp_distance = pow((distance_x[i] - distance_x[j]), 2) + pow((distance_y[i] - distance_y[j]), 2)
temp_distance = pow(temp_distance, 0.5)
distance_graph[i][j] =float(int(temp_distance + 0.5))
# 按键响应程序
def __bindEvents(self):
self.root.bind("q", self.quite) # 退出程序
self.root.bind("n", self.new) # 初始化
self.root.bind("e", self.search_path) # 开始搜索
self.root.bind("s", self.stop) # 停止搜索
# 更改标题
def title(self, s):
self.root.title(s)
# 初始化
def new(self, evt = None):
# 停止线程
self.__lock.acquire()
self.__running = False
self.__lock.release()
self.clear() # 清除信息
self.nodes = [] # 节点坐标
self.nodes2 = [] # 节点对象
# 初始化城市节点
for i in range(len(distance_x)):
# 在画布上随机初始坐标
x = distance_x[i]
y = distance_y[i]
self.nodes.append((x, y))
# 生成节点椭圆,半径为self.__r
node = self.canvas.create_oval(x - self.__r,
y - self.__r, x + self.__r, y + self.__r,
fill = "#ff0000", # 填充红色
outline = "#000000", # 轮廓白色
tags = "node",
)
self.nodes2.append(node)
# 显示坐标
self.canvas.create_text(x,y-10, # 使用create_text方法在坐标(302,77)处绘制文字
text = '('+str(x)+','+str(y)+')', # 所绘制文字的内容
fill = 'black' # 所绘制文字的颜色为灰色
)
# 顺序连接城市
#self.line(range(city_num))
# 初始城市之间的距离和信息素
for i in range(city_num):
for j in range(city_num):
pheromone_graph[i][j] = 1.0
self.ants = [Ant(ID) for ID in range(ant_num)] # 初始蚁群
self.best_ant = Ant(-1) # 初始最优解
self.best_ant.total_distance = 1 << 31 # 初始最大距离
self.iter = 1 # 初始化迭代次数
# 将节点按order顺序连线
def line(self, order):
# 删除原线
self.canvas.delete("line")
def line2(i1, i2):
p1, p2 = self.nodes[i1], self.nodes[i2]
self.canvas.create_line(p1, p2, fill = "#000000", tags = "line")
return i2
# order[-1]为初始值
reduce(line2, order, order[-1])
# 清除画布
def clear(self):
for item in self.canvas.find_all():
self.canvas.delete(item)
# 退出程序
def quite(self, evt):
self.__lock.acquire()
self.__running = False
self.__lock.release()
self.root.destroy()
print (u"\n程序已退出...")
sys.exit()
# 停止搜索
def stop(self, evt):
self.__lock.acquire()
self.__running = False
self.__lock.release()
# 开始搜索
def search_path(self, evt = None):
# 开启线程
self.__lock.acquire()
self.__running = True
self.__lock.release()
while self.__running:
# 遍历每一只蚂蚁
for ant in self.ants:
# 搜索一条路径
ant.search_path()
# 与当前最优蚂蚁比较
if ant.total_distance < self.best_ant.total_distance:
# 更新最优解
self.best_ant = copy.deepcopy(ant)
# 更新信息素
self.__update_pheromone_gragh()
print (u"迭代次数:",self.iter,u"最佳路径总距离:",int(self.best_ant.total_distance))
# 连线
self.line(self.best_ant.path)
# 设置标题
self.title("TSP蚁群算法(n:随机初始 e:开始搜索 s:停止搜索 q:退出程序) 迭代次数: %d" % self.iter)
# 更新画布
self.canvas.update()
self.iter += 1
# 更新信息素
def __update_pheromone_gragh(self):
# 获取每只蚂蚁在其路径上留下的信息素
temp_pheromone = [[0.0 for col in range(city_num)] for raw in range(city_num)]
for ant in self.ants:
for i in range(1,city_num):
start, end = ant.path[i-1], ant.path[i]
# 在路径上的每两个相邻城市间留下信息素,与路径总距离反比
temp_pheromone[start][end] += Q / ant.total_distance
temp_pheromone[end][start] = temp_pheromone[start][end]
# 更新所有城市之间的信息素,旧信息素衰减加上新迭代信息素
for i in range(city_num):
for j in range(city_num):
pheromone_graph[i][j] = pheromone_graph[i][j] * RHO + temp_pheromone[i][j]
# 主循环
def mainloop(self):
self.root.mainloop()
#----------- 程序的入口处 -----------![请添加图片描述](https://img-blog.csdnimg.cn/cffb2f0918614eb28c8c50b1bb5a9c2f.png)
if __name__ == '__main__':
TSP(tkinter.Tk()).mainloop()
将上面的代码写入tsp.py文件,然后从命令行运行
python3 tsp.py
即可直观感受蚁群算法迭代优化旅行商问题的过程。
参考文献与致谢
[1] Dorigo, Marco, and Luca Maria Gambardella. "Ant colony system: a cooperative learning approach to the traveling salesman problem." IEEE Transactions on evolutionary computation 1, no. 1 (1997): 53-66.
[2] 老马的程序人生
[3] 落难Coder的知乎
最后,让我们膜拜大神,感谢Dorigo等人为我们带来了蚁群算法。
图2 Marco Dorigo(蚁群算法论文的一作)