Lựa chọn các thuộc tính tốt cho các mô hình học máy cũng tương tự như việc lựa chọn các chỉ số tối ưu sẽ giúp ích cho việc nâng cao kết quả dự đoán xu hướng của thị trường ngoại hối, chứng khoán dựa trên các mô hình học máy luôn được các nhà đầu tư quan tâm. Trong bài báo này tập trung nghiên cứu giải quyết bài toán bằng cách nào có thể chọn lựa ra được những thuộc tính tốt nhất trong rất nhiều các thuộc tính ban đầu để phục vụ việc giảm chiều dữ liệu nâng cao tốc độ huấn luyện cho mô hình học máy. Phương pháp nhóm tác giả thực hiện gồm 3 bước chính đầu tiên thu thập dữ liệu liên quan bao gồm các chỉ số được sử dụng phổ biến trong lĩnh vực ngoại hối
tiếp theo, dữ liệu được chuẩn hóa và gán nhãn
sau cùng, sử dụng thuật toán Random Uniform Forests với các thông tin về độ quan trọng của các thuộc tính để lựa chọn ra những chỉ số có lợi cho việc dự đoán. Kết quả nghiên cứu đã chỉ ra, trong 17 chỉ số thông dụng trong lĩnh vực nhóm đang quan tâm thì 05 chỉ số (vol, cci, adx, ar và chv) có ảnh hưởng nhất đến kết quả phân lớp dữ liệu có lợi cho mô hình học máy, cải thiện hiệu năng và tốc độ tính toán của các mô hình do số chiều dữ liệu được giảm xuống.