0%

腾讯开悟智能体决策初赛感想

前几天初赛结束了,虽然成绩很不理想,但是还是进复赛了,复赛题目跟初赛就完全不一样了,希望能进决赛吧。

初赛

初赛题目是走迷宫找宝箱,这个题目我在ICT初赛时做过,但是这个的观测信息跟ICT的不一样,ICT的观测信息直接给了BFS处理过的网格距离,并且有51x51的局部视野,这次的比赛没有这些,并且视野只有11x11。

虽然期间我通过反复设置起点最终打印出了初赛的地图,想要用128x128的图,加CNN,做个纯视觉的,但是家里的电脑居然跑不动,这个训练环境居然还有超时设置。

后来就没用上我打的地图和CNN,但是特征也是给我改的一团乱,之前ICT时折腾了很久的奖励函数这次倒是几乎完全没改,就加入了宝箱分和终点分,毕竟奖励函数只影响训练的收敛情况,只要大方向没有问题,应该都是能收敛的,剩下的都是时间问题,但是特征如果设计不好的话应该会影响实际的效果的。

现在一想其实特征里面不需要把8个宝箱的位置特征全部给出来的,只需要给终点位置特征和最近宝箱位置特征就行了,给终点位置是为了让智能体在宝箱收集完之前避开终点,因为见到过开局起点和终点只隔了3步的情况,如果不给终点位置特征的话开局可能就不小心走到终点了。

对于动态障碍物的处理,我之前通过打地图的方式记录了6个障碍物的位置,特征里面留了6个特征来表示有没有障碍物,智能体边走边用11x11的视野画地图,每次都判断障碍物位置可不可走就行了。

训练

因为初赛平台没有提供算力,需要本地训练,我家的垃圾台式跑4个环境CPU就七八十往上了,可以说几乎什么事都做不了,所以肯定不可能白天跑,更别说白天我还要肝魔兽(虽然也不是不能玩,还能有三四十帧)但是感觉对电脑不好,所以基本都是晚上睡觉跑。

然后折磨的事情就来了,每天晚上睡觉我都要听着风扇狂转的声音,而且我爸装的这个台式,它机箱不盖盖子,说好散热,晚上还能看见它的红光照亮半个房间。而且我家从来都说,晚上不能开空调过夜,所以睡觉的时候都要定时空调,于是在比较热的那几天,我几乎每天早上六点就被热醒(电脑发热,房间升温快)

结束

前几天我用AI写了个仿腾讯开悟平台的迷宫环境,然后稍微魔改了一下比赛给的框架代码,勉强能跑起来,这样在比赛结束之后也可以跑迷宫了,项目地址在这里

已在白嫖的modelscope的免费CPU容器里测试能够运行了,特征和奖励都是官方默认的没改过,不开障碍物(目前我也没写障碍物)直接训练走终点的话能有百分之七十左右的胜率,可以说效果很差了。requirement.txtreadme懒得写了,反正依赖的库也不多,而且都是常规的库,运行缺什么pip安装就好了,后面如果什么时候想写了再补上。

垂死病中惊坐起,突然想起这东西好像是要保密的,赶紧删库跑路了。