Long Ji Lin: Self-Improving Reactive Agents Based On Reinforcement Learning, Planning and Teaching. Mach. Learn. 8: 293-321 (1992)