Việc sử dụng tiếng Anh trong thực tiễn thường có sự tham gia của những người có nền tảng ngôn ngữ khác nhau với mục tiêu chính là sự hiểu nhau, và phần lớn các cuộc hội thoại bằng tiếng Anh này không có sự tham gia của những người nói tiếng Anh bản địa (Graddol, 2006
Kirkpatrick, 2007). Tuy nhiên, thay vì tập trung vào tính dễ hiểu của lời nói, nhiều bài kiểm tra vẫn đo lường khả năng nói của thí sinh với tham chiếu về một khuôn mẫu bản ngữ lý tưởng. Điều này khiến cho tính giá trị của bài thi bị giảm trong việc đánh giá khả năng giao tiếp nói khi tiếng Anh được dùng như một ngôn ngữ toàn cầu, dẫn tới việc bỏ sót kỹ năng cần đánh giá hoặc đánh giá các yếu tố không liên quan.Việc xác trị một bài thi tiếng Anh như một công cụ để giao tiếp toàn cầu bao gồm chứng minh mối liên hệ giữa kỹ năng cần đánh giá (khả năng giao tiếp thực tiễn trong trong bối cảnh cụ thể) với các tác vụ trong bài thi và tiêu chí đánh giá (McNamara, 2006). Các bằng chứng hỗ trợ việc giải thích ý nghĩa của điểm số cần được trình bày như một phần của lập luận tổng thể về tính giá trị. Trước hết, bài viết này muốn chỉ ra bối cảnh sử dụng tiếng Anh mà nhiều thí sinh trong các kỳ thi lớn hướng tới với mục đích học thuật thường là bối cảnh trong đó tiếng Anh được dùng như một ngôn ngữ toàn cầu (English as a lingua franca – ELF). Tiếp theo, lập luận của Toulmin (2003) được tận dụng để tìm ra những bằng chứng cần thiết cho việc chứng minh các khẳng định về một bài kiểm tra có tính đại diện tốt cho khả năng sử dụng tiếng Anh như ngôn ngữ toàn cầu. Mô hình được đưa ra và áp dụng vào phân tích minh họa hai bài thi Nói tiếng Anh. Bài viết có mục đích đưa ra minh chứng về mặt thuyết cho sự cần thiết của việc tập trung vào tính dễ hiểu trong giao tiếp và việc tăng cường sự đa dạng ngôn ngữ trong đánh giá ELF. Ngoài ra, tác giả cũng mong muốn đưa ra một mô hình xác trị có tính ứng dụng đối với các nhà phát triển và sử dụng bài thi.