Câu hỏi tự luận Khoa học máy tính 12 cánh diều Bài 1: Giới thiệu về Học máy
Bộ câu hỏi tự luận Tin học 12 - Khoa học máy tính (Cánh diều). Câu hỏi và bài tập tự luận Bài 1: Giới thiệu về Học máy. Bộ tài liệu tự luận này có 4 mức độ: Nhận biết, thông hiểu, vận dụng và vận dụng cao. Phần tự luận này sẽ giúp học sinh hiểu sâu, sát hơn về môn học Tin học 12 cánh diều.
=> Giáo án Tin học 12 - Định hướng khoa học máy tính cánh diều
Các tài liệu bổ trợ
CHỦ ĐỀ FCS. GIẢI QUYẾT VẤN ĐỀ VỚI SỰ TRỢ GIÚP CỦA MÁY TÍNH
BÀI 1.1: GIỚI THIỆU VỀ MÁY HỌC
(15 CÂU)
1. NHẬN BIẾT (4 CÂU)
Câu 1: Định nghĩa máy học là gì? Nêu một số ứng dụng cơ bản của máy học trong đời sống?
Trả lời:
*Định nghĩa: Máy học (Machine Learning) là một lĩnh vực của trí tuệ nhân tạo (AI) cho phép máy tính học từ dữ liệu mà không cần lập trình cụ thể.
*Ứng dụng:
+ Nhận diện giọng nói (ví dụ: trợ lý ảo như Siri, Google Assistant).
+ Phân loại email (như phân loại spam).
+ Đề xuất sản phẩm (như Netflix, Amazon).
+ Nhận diện hình ảnh (như Facebook tự động gán thẻ bạn bè).
Câu 2: Mô tả các thành phần chính của một mô hình học máy?
Trả lời:
- Dữ liệu: Tập hợp thông tin được sử dụng để huấn luyện mô hình.
- Thuật toán: Quy trình hoặc công thức mà mô hình sử dụng để học từ dữ liệu.
- Mô hình: Kết quả của quá trình học, có thể đưa ra dự đoán hoặc phân loại.
- Dữ liệu kiểm tra: Tập dữ liệu dùng để đánh giá hiệu suất của mô hình sau khi huấn luyện.
Câu 3: Nêu quy trình cơ bản trong học máy?
Trả lời:
...........................................
Câu 4: Giải thích khái niệm “dữ liệu huấn luyện” trong học có giám sát?
Trả lời:
...........................................
2. THÔNG HIỂU (4 CÂU)
Câu 1: Phân biệt giữa học có giám sát và học không giám sát?
Trả lời:
+ Học có giám sát: Sử dụng dữ liệu đã được gán nhãn (có đầu ra cụ thể). Mục tiêu là dự đoán đầu ra cho dữ liệu mới.
+ Học không giám sát: Sử dụng dữ liệu không có gán nhãn. Mục tiêu là tìm ra cấu trúc hoặc mẫu trong dữ liệu.
Câu 2: Giải thích bài toán phân loại trong học có giám sát và đưa ra một ví dụ minh họa?
Trả lời:
- Bài toán phân loại: Là bài toán trong đó mô hình học cách phân loại dữ liệu vào các nhóm hoặc loại khác nhau dựa trên đặc điểm của chúng.
- Ví dụ: Phân loại email thành "spam" hoặc "không spam" dựa trên nội dung và các thuộc tính khác của email.
Câu 3: Mô tả quy trình huấn luyện và đánh giá mô hình trong học có giám sát?
Trả lời:
...........................................
Câu 4: Nêu rõ các bước trong bài toán phân cụm trong học không giám sát?
Trả lời:
...........................................
3. VẬN DỤNG (4 CÂU)
Câu 1: Hãy trình bày cách thức thu thập và chuẩn bị dữ liệu huấn luyện cho một bài toán phân loại?
Trả lời:
- Xác định nguồn dữ liệu: Lựa chọn nguồn dữ liệu phù hợp, có thể là từ cơ sở dữ liệu công khai, API, hoặc thu thập dữ liệu từ người dùng.
- Thu thập dữ liệu: Sử dụng các công cụ hoặc kỹ thuật để thu thập dữ liệu từ nguồn đã chọn (ví dụ: web scraping, khảo sát).
- Làm sạch dữ liệu: Xóa bỏ các dữ liệu không hợp lệ, thiếu giá trị hoặc nhiễu. Kiểm tra và xử lý các giá trị ngoại lệ.
- Gán nhãn dữ liệu: Nếu là bài toán phân loại có giám sát, cần gán nhãn cho dữ liệu (ví dụ: đánh dấu các email là spam hoặc không spam).
- Tiền xử lý dữ liệu: Chuyển đổi dữ liệu về định dạng phù hợp, chuẩn hóa hay mã hóa các thuộc tính (ví dụ: One-Hot Encoding cho biến phân loại).
- Chia dữ liệu: Chia dữ liệu thành tập huấn luyện và tập kiểm tra (ví dụ: 80% cho huấn luyện, 20% cho kiểm tra).
Câu 2: Phân tích một ứng dụng thực tế của máy học trong nhận dạng tiếng nói và mô tả quy trình thực hiện?
Trả lời:
Ứng dụng: Nhận diện giọng nói trong các trợ lý ảo như Google Assistant.
*Quy trình thực hiện:
+ Thu thập dữ liệu: Ghi âm giọng nói từ nhiều người ở các điều kiện khác nhau.
+ Tiền xử lý dữ liệu: Chuyển đổi âm thanh thành dạng sóng và tách các đặc trưng như + MFCC (Mel-frequency cepstral coefficients).
+ Huấn luyện mô hình: Sử dụng các thuật toán học sâu (deep learning) như mạng nơ-ron tích chập (CNN) để huấn luyện mô hình từ dữ liệu đã chuẩn bị.
+ Đánh giá mô hình: Sử dụng tập kiểm tra để đánh giá độ chính xác của mô hình trong việc nhận diện giọng nói.
+ Triển khai: Tích hợp mô hình vào ứng dụng thực tế để nhận diện giọng nói của người dùng.
Câu 3: Giải thích cách đánh giá hiệu suất của một mô hình học máy và nêu các chỉ số thường được sử dụng?
Trả lời:
...........................................
Câu 4: Trình bày cách thức áp dụng học không giám sát trong phân tích thị trường?
Trả lời:
...........................................
4. VẬN DỤNG CAO (3 CÂU)
Câu 1: Đánh giá các phương pháp khác nhau trong học có giám sát và nêu ưu nhược điểm của từng phương pháp?
Trả lời:
Ưu điểm | Nhược điểm | |
| Hồi quy tuyến tính | Dễ hiểu, dễ triển khai, hiệu quả với dữ liệu tuyến tính. | Không hoạt động tốt với dữ liệu phi tuyến tính. |
| Cây quyết định | Dễ hiểu, trực quan, có thể xử lý dữ liệu phi tuyến. | Dễ bị overfitting nếu không cắt tỉa đúng cách. |
| Mạng nơ-ron | Có khả năng học tốt từ dữ liệu lớn và phức tạp. | Cần nhiều tài nguyên tính toán và khó giải thích. |
| Máy vector hỗ trợ (SVM) | Hiệu quả với dữ liệu cao chiều, có thể sử dụng kernel trick. | Khó khăn trong việc chọn kernel phù hợp và không hiệu quả với dữ liệu lớn. |
Câu 2: Phân tích một tình huống cụ thể trong đó máy học có thể được sử dụng để giải quyết một vấn đề phức tạp trong doanh nghiệp?
Trả lời:
...........................................
Câu 3: Trình bày các thách thức trong việc triển khai mô hình máy học và đề xuất các giải pháp để khắc phục?
Trả lời:
...........................................
--------------- Còn tiếp ---------------