Data lake (hồ dữ liệu) là khái niệm mới xuất hiện những năm gần đây trong thời đại của dữ liệu lớn (big data). Mặc dù chủ đề về big data đã được thảo luận nhưng vẫn còn nhiều thách thức trong nghiên cứu, đặc biệt là sự đa dạng của dữ liệu. Một trong những thách thức đó là làm thế nào để tích hợp và truy vấn khối lượng dữ liệu lớn từ nhiều nguồn khác nhau khi phương thức lưu trữ dữ liệu truyền thống là kho dữ liệu không đáp ứng được. Data lake- Hồ dữ liệu được đề xuất như một giải pháp cho vấn đề này. Bài báo tập trung nghiên cứu kiến trúc hô dữ liệu cho mô hình dữ liệu ngân hàng dựa trên cơ sở tham chiếu đến mô hình dữ liệu của hãng IBM. Tiếp theo bài báo phân tích vai trò và sự cần thiết của hồ dữ liệu, trình bày về quy trình xây dựng cũng như kiến trúc hồ dữ liệu phù hợp trong các tổ chức tài chính ngân hàng. Cuối cùng là thảo luận về lợi ích của h 'ô dữ liệu giúp cho các bộ phận nghiệp vụ truy cập và phân tích dữ liệu trên toàn bộ tổ chức, ngoài ra thách thức về công nghệ trong quá trình triển khai hồ dữ liệu tại các tổ chức tài chính ngân hàng cũng được nêu trong bài báo này.