Trắc nghiệm Tin học 12 Cánh diều Bài 2: Giới thiệu về khoa học dữ liệu
-
108 lượt thi
-
15 câu hỏi
-
45 phút
Danh sách câu hỏi
Câu 1:
PHẦN I. Câu trắc nghiệm nhiều phương án lựa chọn. Thí sinh trả lời từ câu 1 đến câu 10. Mỗi câu hỏi thí sinh chỉ lựa chọn một phương án.
Khoa học dữ liệu là gì?
Đáp án: C
Giải thích: Khoa học dữ liệu là một lĩnh vực liên ngành kết hợp toán học, thống kê, và khoa học máy tính để phân tích và trực quan hóa dữ liệu nhằm phát hiện vấn đề và đưa ra quyết định.
Câu 2:
Đáp án: C
Giải thích: Giai đoạn thực hiện quảng cáo không nằm trong các giai đoạn của một dự án Khoa học dữ liệu. Các giai đoạn chính bao gồm xác định vấn đề, thu thập dữ liệu, chuẩn bị dữ liệu, phân tích và khai phá dữ liệu, đánh giá và giải thích, và ra quyết định.
Câu 3:
Đáp án: C
Giải thích: Dự án Bộ gen người kéo dài 13 năm (1990-2003) và tiêu tốn khoảng 3 tỉ USD.
Câu 4:
Đáp án: B
Giải thích: Kính thiên văn Kepler thu thập khoảng 678 GB dữ liệu về độ sáng của khoảng 150 nghìn ngôi sao trong 9 năm hoạt động.
Câu 5:
Đáp án: B
Giải thích: Hệ thống Giám sát đánh bắt cá toàn cầu sử dụng dữ liệu vệ tinh từ hệ thống của Google để ghi lại vị trí của tàu cá và phát hiện đánh bắt cá bất hợp pháp.
Câu 6:
Đáp án: B
Giải thích: GPT-3 là mô hình ngôn ngữ lớn nổi tiếng với 175 tỉ tham số và đạt được nhiều thành tựu trong xử lý ngôn ngữ tự nhiên.
Câu 7:
Đáp án: C
Giải thích: Nghiên cứu và phát triển các phương pháp dạy học truyền thống không phải là một thành tựu của Khoa học dữ liệu. Các thành tựu của Khoa học dữ liệu bao gồm dự án Bộ gen người, phát triển trí tuệ nhân tạo, và phát hiện gian lận tài chính.
Câu 8:
Đáp án: B
Giải thích: Dự án Bộ gen người sử dụng kỹ thuật giải trình tự gen để nghiên cứu cấu trúc và chức năng của các gen trong bộ gen người.
Câu 9:
American Express đã cải thiện khả năng phát hiện gian lận bằng cách nào?
Đáp án: A
Giải thích: American Express đã cải thiện khả năng phát hiện gian lận bằng cách triển khai mô hình học máy, nâng cao hiệu quả phát hiện gian lận lên 30% so với hệ thống cũ.
Câu 10:
Đáp án: A
Giải thích: Kính thiên văn Kepler thu thập dữ liệu về độ sáng của các ngôi sao và các hành tinh quay quanh chúng, tạo ra khoảng 100 GB dữ liệu mỗi ngày.
Câu 11:
PHẦN II. Câu trắc nghiệm đúng sai. Thí sinh trả lời từ câu 1 đến câu 2. Trong mỗi ý a), b), c), d) ở mỗi câu, thí sinh chọn đúng hoặc sai
Phát biểu sau đây đúng hay sai về các khía cạnh của khoa học dữ liệu?
a) Khoa học dữ liệu chỉ liên quan đến toán học và thống kê, không bao gồm khoa học máy tính.
b) Một trong những mục tiêu chính của khoa học dữ liệu là phát hiện tri thức từ dữ liệu và phát triển kiến thức mới.
c) Trong các giai đoạn của dự án khoa học dữ liệu, việc ra quyết định và triển khai không cần dựa vào kết quả phân tích dữ liệu.
d) Để tối ưu hóa quyết định, khoa học dữ liệu sử dụng thuật toán tối ưu hóa và điều chỉnh quyết định dựa trên dữ liệu.
a) Sai: Khoa học dữ liệu không chỉ kết hợp toán học và thống kê, mà còn liên quan đến khoa học máy tính và các lĩnh vực ứng dụng khác như kinh doanh, tài chính, y tế.
b) Đúng: Một trong những mục tiêu chính của Khoa học dữ liệu là phát hiện tri thức từ dữ liệu và phát triển kiến thức mới.
c) Sai: Ra quyết định và triển khai cần phải dựa trên kết quả phân tích để đảm bảo quyết định được thông tin và chính xác.
d) Đúng: Khoa học dữ liệu sử dụng thuật toán tối ưu hóa và điều chỉnh quyết định dựa trên dữ liệu để đưa ra quyết định tốt nhất.
Câu 12:
Phát biểu sau đây đúng hay sai về thành tựu và ứng dụng của khoa học dữ liệu:
a) Dự án Bộ gen người (HGP) tiêu tốn khoảng 3 triệu USD và kéo dài trong 3 năm.
b) Kính thiên văn Kepler thu thập khoảng 678 GB dữ liệu về độ sáng của 150 triệu ngôi sao trong 9 năm.
c) Hệ thống Giám sát đánh bắt cá toàn cầu sử dụng dữ liệu vệ tinh để theo dõi và ngăn chặn đánh bắt cá bất hợp pháp.
d) Các mô hình ngôn ngữ lớn (LLM) như GPT-3 có số lượng tham số rất nhỏ, không thể xử lý ngôn ngữ tự nhiên hiệu quả.
a) Sai: Dự án Bộ gen người tiêu tốn khoảng 3 tỷ USD và kéo dài trong 13 năm.
b) Sai: Kính thiên văn Kepler thu thập khoảng 678 GB dữ liệu về độ sáng của 150 nghìn ngôi sao trong 9 năm.
c) Đúng: Hệ thống Giám sát đánh bắt cá toàn cầu sử dụng dữ liệu vệ tinh để ngăn chặn đánh bắt cá bất hợp pháp và xác định mục đích chuyến đi của tàu cá.
d) Sai: Các mô hình ngôn ngữ lớn (LLM) như GPT-3 có số lượng tham số rất lớn, giúp xử lý ngôn ngữ tự nhiên tinh vi hơn.
Câu 13:
PHẦN III. Câu trả lời ngắn. Thí sinh trả lời từ câu 1 đến câu 3
Khoa học dữ liệu bao gồm những phương pháp và lĩnh vực nào?
Đáp án: Khoa học dữ liệu kết hợp các phương pháp từ toán học, thống kê, và khoa học máy tính với kiến thức chuyên môn trong các lĩnh vực ứng dụng như kinh doanh, tài chính, y tế, và giáo dục.
Giải thích: Khoa học dữ liệu là một lĩnh vực liên ngành, sử dụng các công cụ và phương pháp từ toán học, thống kê, và khoa học máy tính để giải quyết các vấn đề trong nhiều lĩnh vực ứng dụng khác nhau.
Câu 14:
Đáp án: Mục tiêu chính của Khoa học dữ liệu bao gồm phân tích và trực quan hóa dữ liệu, xây dựng mô hình dự đoán, tối ưu hóa quyết định, và phát hiện tri thức từ dữ liệu.
Giải thích: Khoa học dữ liệu nhằm giúp hiểu và biểu diễn dữ liệu một cách trực quan, dự đoán sự kiện tương lai, điều chỉnh quyết định dựa trên dữ liệu, và phát hiện các quy luật ẩn trong dữ liệu.
Câu 15:
Đáp án: Dự án Bộ gen người kéo dài 13 năm (1990-2003) và tiêu tốn khoảng 3 tỉ USD.
Giải thích: Dự án Bộ gen người là một trong những dự án khoa học dữ liệu lớn nhất, kéo dài 13 năm với chi phí khoảng 3 tỉ USD, nhằm nghiên cứu cấu trúc và chức năng của các gen trong bộ gen người.