Cellobiohydrolase (EC 3.2.1.91) là một trong những enzyme quan trọng tham gia vào quá trình thủy phân cellulose. Trong nghiên cứu này, trình tự gen mã hóa cellobiohydrolase đã được khai thác từ dữ liệu DNA metagenome của vi sinh vật quanh khu nấm mục trắng ở vườn Quốc gia Cúc Phương dựa trên cơ sở dữ liệu KEGG. Có 73 ORF mã hóa enzyme cellobiohydrolase được thu nhận, trong đó có 15 ORF chứa gen hoàn thiện, có 6 ORF có các vùng chức năng. Mức độ biểu hiện của protein trong E. coli được ước đoán bằng phần mềm Periscope cho thấy mã gen GL0212614 có mức độ biểu hiện cao nhất là 742 mg/l. Cấu trúc bậc hai và bậc ba của GL0494307 được dự đoán bằng Phyre2 cho thấy, GL0212614 có cấu trúc được xác định dựa trên khuôn c3nfvA có độ bao phủ 46% và độ tin cậy 100%. Trong cấu trúc bậc 2 của gen GL0212614 có 25% xoắn α, 29% xoắn β, 2% xoắn TM và 14% không xác định. GL0212614 là gen chịu axit, nhiệt độ tối ưu cho hoạt tính của enzyme là 55°C-65oC. Những kết quả này là cở sở quan trong để lựa chọn được các điều kiện biểu hiện gen.