Câu 2: Những lợi ích chính của việc sử dụng điện toán đám mây trong khoa học dữ liệu là gì?
Đáp án: Lợi ích chính của việc sử dụng điện toán đám mây bao gồm giảm nhu cầu đầu tư vào phần cứng, cung cấp tài nguyên tính toán linh hoạt và dễ dàng mở rộng khi cần thiết.
Giải thích: Điện toán đám mây giúp giảm chi phí đầu tư vào phần cứng vì tài nguyên tính toán được cung cấp qua nền tảng đám mây. Ngoài ra, nó cung cấp khả năng mở rộng linh hoạt, cho phép điều chỉnh tài nguyên theo nhu cầu của dự án.
PHẦN III. Câu trả lời ngắn. Thí sinh trả lời từ câu 1 đến câu 3
Câu 1: Tại sao máy tính quan trọng trong quá trình phân tích dữ liệu trong khoa học dữ liệu?
Câu 6: Tính năng tự động hóa trong khoa học dữ liệu giúp đạt được điều gì?
Câu 2: Tính ưu việt của máy tính và thuật toán trong xử lý dữ liệu lớn đúng hay sai?
a) Máy tính và thuật toán có thể xử lý dữ liệu lớn một cách nhanh chóng và hiệu quả.
b) Máy tính không cần thiết trong việc đảm bảo tính chính xác của trình tự bộ gene.
c) Các thuật toán không thể tích hợp dữ liệu từ nhiều nhóm nghiên cứu khác nhau.
d) Khả năng mở rộng của cơ sở hạ tầng tính toán không quan trọng trong các dự án khoa học quy mô lớn.
Câu 8: Trong dự án HGP, vì sao cần sử dụng mạng lưới siêu máy tính?
PHẦN I. Câu trắc nghiệm nhiều phương án lựa chọn. Thí sinh trả lời từ câu 1 đến câu 10. Mỗi câu hỏi thí sinh chỉ lựa chọn một phương án.
Câu 1: Máy tính đóng vai trò gì trong quá trình thu thập và tiền xử lý dữ liệu trong khoa học dữ liệu?
Câu 4: Một trong những ưu điểm của việc sử dụng điện toán đám mây trong khoa học dữ liệu là gì?
Câu 7: Máy tính hỗ trợ gì trong việc phân tích thời gian thực của dữ liệu?
Câu 10: Lợi ích của việc tích hợp dữ liệu từ nhiều nhóm nghiên cứu trong dự án HGP là gì?
PHẦN II. Câu trắc nghiệm đúng sai. Thí sinh trả lời từ câu 1 đến câu 2. Trong mỗi ý a), b), c), d) ở mỗi câu, thí sinh chọn đúng hoặc sai
Câu 1: Phát biểu sau đúng hay sai về vai trò của máy tính trong khoa học dữ liệu ?
a) Máy tính không cần thiết trong việc trực quan hóa dữ liệu.
b) Máy tính hỗ trợ tự động hóa các tác vụ lặp lại, tăng tốc và giảm lỗi trong quy trình khoa học dữ liệu
c) Máy tính không có khả năng xử lý song song dữ liệu lớn.
d) Điện toán đám mây không cần thiết trong việc giảm nhu cầu đầu tư vào phần cứng.
Câu 3: Trong dự án Hệ gene người (HGP), máy tính đã hỗ trợ gì cho quá trình giải trình tự gene?
Câu 9: Máy tính và các thuật toán có vai trò gì trong việc giải thích dữ liệu gene?
Câu 3: Dự án Hệ gene người (HGP) đã minh họa tính ưu việt của máy tính và thuật toán trong xử lý dữ liệu lớn như thế nào?