Phiếu trắc nghiệm Khoa học máy tính 12 cánh diều Bài 3: Giới thiệu về Khoa học dữ liệu (Tiếp theo)
Bộ câu hỏi trắc nghiệm Tin học 12 - Khoa học máy tính cánh diều. Câu hỏi và bài tập trắc nghiệm Bài 3: Giới thiệu về Khoa học dữ liệu (Tiếp theo). Bộ trắc nghiệm có các phần: Nhận biết, thông hiểu, vận dụng, vận dụng cao và câu hỏi Đ/S. Hi vọng tài liệu này sẽ giúp thầy cô nhẹ nhàng hơn trong việc ôn tập. Theo thời gian, chúng tôi sẽ tiếp tục bổ sung thêm các câu hỏi.
Xem: => Giáo án Tin học 12 - Định hướng khoa học máy tính cánh diều
A. TRẮC NGHIỆM
1. NHẬN BIẾT (20 câu)
Câu 1: Đặc trưng nào sau đây không phải là đặc trưng của dữ liệu lớn?
A. Khối lượng (Volume)
B. Tốc độ (Velocity)
C. Tính đơn giản (Simplicity)
D. Tính đa dạng (Variety)
Câu 2: "Petabyte" và "exabyte" là đơn vị đo lường của đặc trưng nào trong dữ liệu lớn?
A. Tốc độ
B. Khối lượng
C. Tính đa dạng
D. Tính xác thực
Câu 3: Đặc trưng "tốc độ" (Velocity) trong dữ liệu lớn đề cập đến điều gì?
A. Độ tin cậy của dữ liệu
B. Khả năng lưu trữ dữ liệu
C. Tốc độ tạo ra và xử lý dữ liệu
D. Sự đa dạng của các nguồn dữ liệu
Câu 4: Thiết bị cảm biến và mạng xã hội là ví dụ về nguồn dữ liệu của đặc trưng nào?
A. Tốc độ
B. Khối lượng
C. Tính đa dạng
D. Tính xác thực
Câu 5: Loại phân tích dữ liệu nào tóm tắt dữ liệu quá khứ và trình bày trực quan?
A. Phân tích dự đoán
B. Phân tích mô tả
C. Phân tích hồi quy
D. Phân tích chuỗi thời gian
Câu 6: Facebook tạo ra khoảng bao nhiêu terabyte dữ liệu mỗi ngày?
A. 100 terabyte
B. 500 terabyte
C. 1 petabyte
D. 1 exabyte
Câu 7: Phân tích dự đoán nhằm mục đích gì?
A. Tóm tắt dữ liệu quá khứ
B. Xác định mối quan hệ phụ thuộc giữa các giá trị
C. Biểu diễn dữ liệu bằng sơ đồ, biểu đồ
D. Đưa ra dự đoán hoặc phân loại dữ liệu mới
Câu 8: Dữ liệu chuỗi thời gian là gì?
A. Dữ liệu được ghi lại theo chu kỳ thời gian
B. Dữ liệu được biểu diễn bằng sơ đồ, biểu đồ
C. Dữ liệu được sử dụng để phân tích hồi quy
D. Dữ liệu được sử dụng để phân tích mô tả
Câu 9: Mục đích của kiểm định giả thuyết thống kê là gì?
A. Đưa ra dự đoán
B. Phân loại dữ liệu
C. Quyết định chấp nhận hay bác bỏ giả thuyết
D. Xác định mối quan hệ phụ thuộc
Câu 10: Công cụ nào được sử dụng để biểu diễn thông tin rút ra từ tập dữ liệu trong phân tích mô tả?
A. Sơ đồ, biểu đồ, đồ thị
B. Bảng tính
C. Văn bản
D. đồ thị
Câu 11: Khai phá dữ liệu là gì?
A. Phát hiện lỗi trong dữ liệu
B. Phát hiện các mẫu và xu hướng trong tập dữ liệu
C. Làm sạch dữ liệu
D. Chuyển đổi dữ liệu
Câu 12: Trong khai phá dữ liệu thường dùng các phương pháp giao thoa giữa những lĩnh vực nào?
A. Toán học và Vật lý
B. Học máy và Thống kê
C. Hóa học và Sinh học
D. Kinh tế và Xã hội học
Câu 13: Kỹ thuật khai phá dữ liệu nào giúp nhóm các đối tượng tương tự nhau vào cùng một nhóm?
A. Phân cụm
B. Phân loại
C. Phân tích hồi quy
D. Phân tích chuỗi thời gian
Câu 14: Trước đây, việc phân tích dữ liệu chủ yếu do ai thực hiện?
A. Máy tính
B. Chuyên gia
C. Người dùng thông thường
D. Phần mềm tự động
Câu 15: Theo Harvard Business Review, công việc nào là hấp dẫn nhất của thế kỷ XXI?
A. Nhà khoa học máy tính
B. Nhà khoa học dữ liệu
C. Nhà khoa học vật lý
D. Nhà khoa học hóa học
Câu 16: Cục thống kê lao động Mỹ dự đoán mức tăng trưởng việc làm của nhà khoa học dữ liệu từ năm 2020 - 2023 là bao nhiêu?
A. 10 - 15%
B. 20 - 25%
C. 30 - 35%
D. 40 - 45%
Câu 17: Siêu máy tính có tốc độ xử lý như thế nào?
A. Hàng nghìn phép tính mỗi giây
B. Hàng triệu phép tính mỗi giây
C. Hàng tỷ phép tính mỗi giây
D. Hàng nghìn tỷ phép tính mỗi giây
Câu 18: Phân tích chuỗi thời gian cho phép làm gì?
A. Dự đoán các điểm dữ liệu trong tương lai
B. Xác định mối quan hệ phụ thuộc
C. Tóm tắt dữ liệu quá khứ
D. Biểu diễn dữ liệu bằng sơ đồ, biểu đồ
Câu 19: Công nghệ nào cho phép lưu trữ và truy cập dữ liệu mọi lúc mọi nơi chỉ cần có kết nối Internet?
A. Siêu máy tính
B. Điện toán đám mây
C. Cơ sở dữ liệu NoSQL
D. Máy tính cụm
Câu 20: Thuật toán nào thực hiện nhiều phép tính đồng thời?
A. Thuật toán tuần tự
B. Thuật toán song song
C. Thuật toán đệ quy
D. Thuật toán tìm kiếm
2. THÔNG HIỂU (7 CÂU)
Câu 1: Tại sao tính xác thực (Veracity) lại là một thách thức lớn đối với dữ liệu lớn?
A. Vì dữ liệu lớn có khối lượng quá lớn.
B. Vì dữ liệu lớn đến từ nhiều nguồn khác nhau.
C. Vì dữ liệu lớn cần được xử lý quá nhanh.
D. Vì dữ liệu lớn có quá nhiều dạng khác nhau.
Câu 2: Điều gì làm cho dữ liệu lớn trở nên có giá trị?
A. Khả năng lưu trữ dữ liệu lớn.
B. Khả năng xử lý dữ liệu nhanh chóng.
C. Khả năng trích xuất thông tin và tri thức từ dữ liệu.
D. Khả năng đảm bảo tính xác thực của dữ liệu.
Câu 3: Tại sao việc quản lý và khai phá dữ liệu lớn lại mang đến lợi ích chiến lược?
A. Vì dữ liệu lớn có thể được lưu trữ trên nhiều thiết bị.
B. Vì dữ liệu lớn có thể được xử lý bởi nhiều phần mềm khác nhau.
C. Vì dữ liệu lớn có thể cung cấp thông tin và tri thức giúp đưa ra quyết định hiệu quả.
D. Vì dữ liệu lớn có thể được tạo ra từ nhiều nguồn khác nhau.
Câu 4: Sự khác biệt chính giữa phân tích mô tả và phân tích dự đoán là gì?
A. Phân tích mô tả sử dụng sơ đồ, biểu đồ, trong khi phân tích dự đoán sử dụng bảng tính.
B. Phân tích mô tả tập trung vào quá khứ, trong khi phân tích dự đoán tập trung vào tương lai.
C. Phân tích mô tả xác định mối quan hệ phụ thuộc, trong khi phân tích dự đoán phân loại dữ liệu.
D. Phân tích mô tả sử dụng dữ liệu chuỗi thời gian, trong khi phân tích dự đoán sử dụng dữ liệu phi chuỗi thời gian.
Câu 5: Sự khác biệt chính giữa phân loại và phân cụm là gì?
A. Phân loại gán nhãn, phân cụm nhóm đối tượng tương tự nhau.
B. Phân loại nhóm đối tượng tương tự nhau, phân cụm gán nhãn.
C. Phân loại sử dụng thuật toán thống kê, phân cụm sử dụng thuật toán học máy.
D. Phân loại sử dụng dữ liệu có nhãn, phân cụm sử dụng dữ liệu không nhãn.
Câu 6: Tại sao Học máy và Thống kê lại được sử dụng nhiều trong khai phá dữ liệu?
A. Vì chúng giúp xử lý dữ liệu lớn.
B. Vì chúng giúp chuyển đổi dữ liệu.
C. Vì chúng giúp làm sạch dữ liệu.
D. Vì chúng cung cấp các phương pháp để phát hiện mẫu và xu hướng.
Câu 7: Hệ quản trị cơ sở dữ liệu NoSQL nào được đề cập là nguồn mở?
A. Amazon DynamoDB
B. Google MongoDB
C. Apache Hadoop
D. IBM Cloudant
3. VẬN DỤNG (3 CÂU)
Câu 1: Một bệnh viện muốn sử dụng dữ liệu lớn để dự đoán nguy cơ mắc bệnh của bệnh nhân. Đặc trưng nào của dữ liệu lớn sẽ quan trọng nhất trong trường hợp này?
A. Tốc độ
B. Tính xác thực
C. Khối lượng
D. Tính đa dạng
Câu 2: Một nhà quản lý muốn hiểu rõ hơn về xu hướng bán hàng của sản phẩm trong năm qua. Họ nên sử dụng loại phân tích dữ liệu nào?
A. Phân tích mô tả
B. Phân tích dự đoán
C. Phân tích hồi quy
D. Phân tích chuỗi thời gian
Câu 3: Một trung tâm nghiên cứu khoa học muốn phân tích dữ liệu gen với khối lượng lớn. Họ cần sử dụng công nghệ nào để đảm bảo tốc độ xử lý và hiệu năng cao?
A. Máy tính cụm
B. Điện toán đám mây
C. Cơ sở dữ liệu NoSQL
D. Máy tính cá nhân
4. VẬN DỤNG CAO (1 CÂU)
Câu 1: Một thành phố thông minh muốn sử dụng dữ liệu lớn để quản lý giao thông và giảm thiểu ùn tắc. Họ cần kết hợp những kỹ thuật khai phá dữ liệu nào để đạt được hiệu quả tối ưu?
A. Phân loại và phân cụm
B. Phân tích hồi quy và phân tích chuỗi thời gian
C. Phân loại, phân cụm, phân tích hồi quy và phân tích chuỗi thời gian
D. Phân tích tương quan và phân tích phương sai
B. TRẮC NGHIỆM ĐÚNG – SAI (2 CÂU)
Câu 1. Các đặc trưng cơ bản của dữ liệu lớn (Big Data) bao gồm khối lượng, tốc độ, tính đa dạng, tính xác thực và giá trị, cùng với những thách thức liên quan đến việc xử lý và khai thác dữ liệu lớn. Các khẳng định sau đây đúng hay sai?
a. Dữ liệu lớn chỉ có thể được lưu trữ và xử lý bằng các công cụ truyền thống.
b. "Petabyte" là một đơn vị đo lường tốc độ của dữ liệu lớn.
c. Facebook tạo ra khoảng 500 terabyte dữ liệu mỗi ngày.
d. Dữ liệu lớn có tiềm năng mang lại những thông tin và tri thức có giá trị.
Đáp án:
a. S
b. S
c. Đ
d. Đ
Câu 2. Quá trình phân tích dữ liệu bao gồm kiểm tra, làm sạch, chuyển đổi và lập mô hình dữ liệu để tìm ra thông tin hữu ích, cũng như các loại phân tích dữ liệu như phân tích mô tả, phân tích dự đoán, phân tích chuỗi thời gian và phân tích hồi quy. Các khẳng định sau đây đúng hay sai?
a. Phân tích dữ liệu chỉ tập trung vào việc tóm tắt dữ liệu quá khứ.
b. Phân tích dự đoán sử dụng các mô hình thống kê để dự báo.
c. Kiểm định giả thuyết thống kê giúp quyết định chấp nhận hay bác bỏ một giả thuyết.
d. Phân tích chuỗi thời gian không thể dự đoán được các điểm dữ liệu trong tương lai.
Đáp án:
a. S
b. Đ
c. Đ
d. S
=> Giáo án Khoa học máy tính 12 Cánh diều bài 3: Giới thiệu về Khoa học dữ liệu (Tiếp theo)