Mobile robots are used in a wide range of fields in the 4.0 industry. Using mobile robots can provide such advantages as time efficiency, production optimization, and so on. However, operating mobile robots with stability and flexibility is always a big challenge and receives numerous researchers’ attention. In particular, mobile robot navigation is considered a key technique in the robotics field. Many research studies and technical methods have been proposed and implemented to solve this issue, in which the reinforcement learning (RL) method has attracted considerable attention because of its ability to learn from experience and powerful adaptability. This paper proposes a navigation framework for mobile robots based on a Q-Learning algorithm and obstacle avoidance method. The relationship and characteristics between robot behaviors and environmental conditions are also analyzed. The results of the Gazebo simulation are then compared to those of SARSA to prove the efficiency of the proposed approach.Robot di động ngày càng được sử dụng rộng rãi trong nhiều lĩnh vực của nền công nghiệp 4.0. Ứng dụng robot di động có thể mang lại những hiệu quả về thời gian, tối ưu sản xuất, lợi ích kinh tế,... Tuy nhiên, để robot di động ổn định, linh hoạt trong môi trường thay đổi luôn là vấn đề được nhiều nhà khoa học quan tâm. Trong đó, bài toán điều hướng robot di động được xem là bài toán quan trọng trong lĩnh vực robot. Nhiều nghiên cứu và giải pháp kỹ thuật đã được đề xuất và thử nghiệm nhằm giải quyết vấn đề này, trong đó phương pháp học tăng cường (RL) đã thu hút được nhiều sự quan tâm vì những ưu điểm như giúp robot có khả năng tự học và ngày càng nâng cao khả năng của robot. Bài báo này đề xuất một giải pháp điều hướng cho robot di động dựa trên thuật toán Q-Learning và phương pháp tránh vật cản tự động. Bên cạnh đó, mối quan hệ và đặc điểm giữa các hành vi của robot và điều kiện môi trường cũng được phân tích. Kết quả của mô phỏng trên nền tảng Gazebo được so sánh với kết quả khi ứng dụng thuật toán SARSA để chứng minh tính hiệu quả của phương pháp đề xuất.