The QL controller solved the path optimization problems for mobile robots. The QL algorithm predicts the mobile robot's course by learning from prior observations of the surroundings. On the other hand, the QL method calculates the states' Q values to offer massive deals to the Q table. The QL algorithm had optimal navigation planning for mobile robots in a dynamic environment. The mobile robot communicated with the control script by the robot operating system (ROS). The mobile robot is code-programmed using Python in the ROS operating system and the QL controller on Gazebo software. This QL controller is improved for the computation time, convergence time, planning trajectories accuracy, and avoidance of obstacles. Therefore, the QL controller solved the path optimization problems for mobile robots. The QL controller's efficiency was evident in its ability to adjust to changing environments swiftly, ensuring seamless navigation without compromising safety. By leveraging the power of machine learning and advanced algorithms, the mobile robot could adapt its trajectory in real-time, responding to obstacles and dynamic conditions with precision. This groundbreaking approach optimized path planning and enhanced the overall performance of mobile robots, paving the way for a new era of intelligent and autonomous robotic systems.Thuật toán QL dự đoán đường đi của robot di động bằng cách học hỏi từ những quan sát trước đó về môi trường xung quanh. Mặt khác, phương pháp QL tính toán các giá trị Q của các trạng thái để đưa ra các tính toán lớn cho bảng ma trận Q. Thuật toán QL có kế hoạch điều hướng tối ưu cho robot di động trong môi trường năng động. Robot di động giao tiếp với tập lệnh điều khiển bằng hệ điều hành robot (ROS). Robot di động được lập trình mã bằng ngôn ngữ Python trên hệ điều hành ROS kết hợp với bộ điều khiển QL trên phần mềm Gazebo. Bộ điều khiển QL này được cải thiện về thời gian tính toán, thời gian hội tụ, lập kế hoạch quỹ đạo chính xác và tránh chướng ngại vật. Do đó, bộ điều khiển QL đã giải quyết được vấn đề tối ưu hóa đường dẫn cho robot di động. Hiệu quả của bộ điều khiển QL thể hiện rõ ở khả năng điều chỉnh nhanh chóng theo môi trường thay đổi, đảm bảo điều hướng liền mạch mà không ảnh hưởng đến an toàn. Bằng cách tận dụng sức mạnh của máy học và các thuật toán tiên tiến, robot di động có thể điều chỉnh quỹ đạo của nó trong thời gian thực, phản ứng chính xác với các chướng ngại vật và điều kiện động. Cách tiếp cận đột phá này đã tối ưu hóa việc lập kế hoạch đường đi và nâng cao hiệu suất tổng thể của robot di động, mở đường cho kỷ nguyên mới của hệ thống rô bốt tự hành thông minh.