Mô hình định giá tài sản vốn (CAPM) lượng hóa mối quan hệ tuyến tính giữa lợi nhuận và rủi ro hệ thống của các tài sản rủi ro. CAPM là một trong những nền tảng lý thuyết của ngành tài chính hiện đại. Tuy nhiên, tính thực nghiệm của CAPM là một chủ đề gây tranh luận đối với các nhà nghiên cứu bởi vì CAPM sử dụng rất nhiều giả định mà khó có thể được đáp ứng trong thực tế. Xu hướng kết hợp trí tuệ nhân tạo và lý thuyết nền tảng tài chính đã tạo ra nhiều mô hình dự báo hiệu quả và phù hợp hơn trong thực nghiệm. Nghiên cứu này thực hiện nhằm 02 mục tiêu chính: Sử dụng thuật toán Support Vector Regression (SVR) trên nền tảng CAPM để dự báo tỷ suất sinh lời của các cổ phiếu riêng lẻ và xác định các yếu tố tác động đến sai số trong dự báo của mô hình kết hợp này. Nghiên cứu sử dụng dữ liệu của các công ty niêm yết trên thị trường chứng khoán Thành phố Hồ Chí Minh giai đoạn từ tháng 12/2012 đến tháng 09/2020, chu kỳ theo tháng. Nghiên cứu chia dữ liệu thành 02 giai đoạn: giai đoạn 01 sử dụng để tối ưu hóa các tham số và giai đoạn còn lại được sử dụng để đánh giá sai số của mô hình dựa trên Spark MLlib. Nghiên cứu chỉ ra rằng mô hình dự báo tỷ suất sinh lời của cổ phiếu sử dụng thuật toán SVR hiệu quả hơn so với CAPM
hơn nữa, nghiên cứu cũng phát hiện ra rằng yếu tố rủi ro đặc thù công ty (VAR), rủi ro tổng thể (SD), sai số của CAPM (RMSECAPM) và tỷ suất sinh lời trung bình (MEAN) là các yếu tố ảnh hưởng đến sự khác biệt giữa sai số dự báo của mô hình SVR đối với từng cổ phiếu đơn lẻ.The Capital Asset Pricing Model (CAPM) measures the linear connection between risky asset return and systematic risk. CAPM is a theoretical underpinning for contemporary finance. The empirical character of the CAPM, on the other hand, is a contentious subject among scholars since the CAPM makes several assumptions that are difficult to satisfy in reality. In practice, the trend of mixing artificial intelligence with financial foundations theory has resulted in more efficient and appropriate forecasting models. The primary goals of this research are as follows: Using the CAPM and the Support Vector Regression algorithm (SVR), anticipate the return of individual stocks and identify the elements influencing the prediction inaccuracy of this combined model. The analysis makes use of data from firms listed on the Ho Chi Minh City Stock Exchange from December 2012 to September 2020, on a monthly period. The data is divided into two stages in the study: the first is used to optimize the parameters, and the second is used to assess the error of the model based on Spark MLlib. According to research, the stock return forecasting model based on the SVR algorithm is more effective than the CAPM
additionally, the study discovered that company-specific risk (VAR), overall risk (SD), CAPM error (RMSECAPM), and mean return (MEAN) are the main factors influencing the difference between the forecast error of the SVR model for each individual stock.