Nội dung chính Khoa học máy tính 12 Chân trời bài F14: Học máy
Hệ thống kiến thức trọng tâm bài F14: Học máy sách Tin học 12 - Định hướng Khoa học máy tính Chân trời sáng tạo. Với các ý rõ ràng, nội dung mạch lạc, đi thẳng vào vấn đề, hi vọng người đọc sẽ nắm trọn kiến thức trong thời gian rất ngắn. Nội dung chính được tóm tắt ngắn gọn sẽ giúp thầy cô ôn tập, củng cố kiến thức cho học sinh. Bộ tài liệu có file tải về. Mời thầy cô kéo xuống tham khảo.
Xem: => Giáo án Tin học 12 - Định hướng Khoa học máy tính chân trời sáng tạo
CHỦ ĐỀ F: GIẢI QUYẾT VẤN ĐỀ VỚI SỰ TRỢ GIÚP CỦA MÁY TÍNH
BÀI F14: HỌC MÁY
1. Sơ lược về học máy
- Lịch sử học máy:Bắt nguồn từ công trình Máy tính và thông minh1 của Alan Turing, nhà khoa học đã đề xuất ý tưởng về việc máy tính có thể mô phỏng các nhiệm vụ trí tuệ của con người. Trong công trình này, Turing giới thiệu ý tưởng về việc kiểm tra khả năng trí tuệ của máy tính: nếu máy tính có thể trò chuyện một cách tự nhiên với con người mà không bị con người phát hiện là đang trò chuyện với máy tính thì máy tính đã thể hiện được trí thông minh như con người. Ý tưởng này về sau được gọi tên là phép thử Turing, đặt nền móng cho sự phát triển của Trí tuệ nhân tạo và Học máy.
- Khái niệm: Học máy là một lĩnh vực trong Trí tuệ nhân tạo nhằm nghiên cứu, phát triển các thuật toán và mô hình cho phép máy tính có khả năng học từ dữ liệu để giải quyết vấn đề.
- Vai trò: Học máy giúp máy tính thực hiện được các nhiệm vụ như:
- Dự đoán kết quả dựa trên dữ liệu hiện tại.
- Phân loại các đối tượng vào các lớp khác nhau.
- Phân tích xu hướng tiêu dùng, diễn biến thị trường,…
- Tư vấn hay gợi ý sản phẩm dựa trên thói quen tìm kiếm.
- Nhận dạng văn bản, hình ảnh, âm thanh,…
- Xử lí ngôn ngữ tự nhiên trong các chatbot, dịch thuật, phần mềm trợ lí ảo.
- Tự động hoá quy trình sản xuất.
- Hỗ trợ bác sĩ trong chẩn đoán dựa trên việc phân tích hồ sơ bệnh án.
…
Hình 1. Mối quan hệ giữa
Trí tuệ nhân tạo, Học máy và Học sâu
- Thông qua quá trình “học” từ dữ liệu mà tri thức, khả năng suy luận của mô hình học máy được cập nhật, bổ sung.
- Quá trình “học” của mô hình học máy để giải quyết bài toán cụ thể thường bao gồm các bước sau:
Thu thập và chuẩn bị dữ liệu chứa các mẫu cần thiết cho bài toán cần giải quyết.
Ví dụ: Bài toán lọc thư rác:
- Thu thập các email rác và email thường.
- Dữ liệu thu thập cần đủ lớn và được chia làm hai phần.
- Phần thứ nhất dành cho mô hình học máy học.
- Phần còn lại dùng để kiểm tra hiệu suất của mô hình.
Sử dụng các thuật toán để trích xuất các đặc trưng từ dữ liệu ở Bước
để làm đầu vào cho mô hình học máy cụ thể.
Ví dụ: Trích xuất các đoạn văn bản, từ khoá, chủ đề,… chứa các đặc điểm của thư rác hay thư thường trong các email.
Mô hình học máy sẽ học các tri thức từ các mẫu dữ liệu ở Bước
nhằm có thể dự báo, dự đoán, gom cụm,… Sau quá trình này, mô hình học máy đã tích luỹ tri thức để giải quyết bài toán đã cho.
Sử dụng phần dữ liệu kiểm tra để đánh giá hiệu suất của mô hình. Nếu hiệu suất của mô hình chưa đạt, thì cần điều chỉnh mô hình để đạt kết quả tốt hơn.
Triển khai mô hình học máy.
- Trong mô hình học máy, dữ liệu đầu vào thường gồm hai loại chính:
- Dữ liệu có nhãn.
- Dữ liệu không có nhãn.
- Mỗi mẫu dữ liệu trong tập dữ liệu đầu vào được gán một nhãn hay nhận một giá trị đầu ra cụ thể được gọi là dữ liệu có nhãn.
Ví dụ: Mỗi email được gán một nhãn là Rác hay Bình thường trong bài toán lọc thư rác là dữ liệu có nhãn. Ngược lại, mỗi mẫu dữ liệu không kèm theo nhãn hay giá trị đầu ra được gọi là dữ liệu không có nhãn.
- Tương ứng với hai loại dữ liệu là hai phương pháp học máy cơ bản:
- Học có giám sát.
- Học không giám sát.
- Học có giám sát:
- Là phương pháp học máy sử dụng dữ liệu có nhãn. Trong đó, các mẫu dữ liệu được gán nhãn hoặc đầu ra xác định.
- Mục tiêu là xây dựng một mô hình có khả năng dự đoán hay phân loại đối tượng dữ liệu mới dựa trên tri thức đã được học từ các mẫu dữ liệu đã được gán nhãn.
- Thường được ứng dụng trong lọc thư rác, nhận dạng đối tượng trong hình ảnh hay video, nhận dạng tiếng nói, chẩn đoán bệnh trong y tế,…
Ví dụ: Hình 2 minh hoạ mô hình học có giám sát với dữ liệu học (Hình 2a) là các hình ảnh được gán nhãn, sau đó khi đưa hình ảnh mới (Hình 2b) thì mô hình sẽ phân loại được là con thỏ.
Hình 2a. Mô hình học hình ảnh các con vật được gán nhãn
Hình 2b. Phân loại hình ảnh
con vật mới là con thỏ
Hình 2. Minh hoạ mô hình học có giám sát
- Học không giám sát:
- Là phương pháp học máy sử dụng dữ liệu không có nhãn.
- Các mô hình trong phương pháp này phân tích mối quan hệ (tương tự hay khác biệt), tần suất cùng xuất hiện,… của dữ liệu đầu vào nhằm khám phá các thông tin ẩn chứa trong dữ liệu.
- Các kĩ thuật học không giám sát bao gồm gom cụm, giảm chiều dữ liệu,… Trong đó, kĩ thuật gom cụm thường được ứng dụng để chia dữ liệu thành các nhóm dựa trên sự tương đồng của dữ liệu.
Ví dụ: Hình 3 minh hoạ mô hình học không giám sát nhằm gom cụm hình ảnh các con vật.
Hình 3. Minh hoa mô hình
học không giám sát
- Sự đa dạng của các mô hình học máy, sự phổ biến của học sâu đã góp phần mang lại nhiều thành tựu to lớn trong lĩnh vực Trí tuệ nhân tạo. Một số ứng dụng của lĩnh vực học máy có thể kể đến như:
- Trợ lí ảo Siri của Apple hay Google Assistant của Google trên thiết bị di động sử dụng các mô hình học máy để nhận dạng giọng nói và chuyển thành văn bản, hiểu ngôn ngữ tự nhiên và cung cấp phản hồi được cá nhân hoá cho người dùng.
- Hệ thống gợi ý sản phẩm của Amazon sử dụng các mô hình học máy để đề xuất sản phẩm hoặc dịch vụ cho người dùng dựa trên hành vi hoặc sở thích trong quá khứ của họ.
______________
1 A. M. Turing, Computing Machinery and Intelligence, Mind, 1950.
2. Vai trò của học máy trong một số ứng dụng
- Học máy đóng vai trò quan trọng trong nhiều ứng dụng khác nhau như:
- Phân loại, nhận dạng hình ảnh, video, âm thanh, giọng nói và văn bản.
- Dự đoán và dự báo các giá trị hay biến cố trong tương lai.
- Xử lí và hiểu ngôn ngữ tự nhiên, phân loại văn bản và phát sinh tự động nội dung.
- Học máy giúp các ứng dụng tăng cường khả năng xử lí thông tin, tự động hoá thao tác,…
- Một số ứng dụng phổ biến của học máy có thể kể đến như: lọc thư rác, chẩn đoán bệnh, nhận dạng giọng nói, dịch tự động, phân tích thị trường.
a) Lọc thư rác
- Các mô hình học máy có thể phân loại, nhận dạng văn bản, vì vậy được ứng dụng để lọc thư rác.
Ví dụ: Nhà cung cấp dịch vụ email như Gmail của Google hay Outlook của Microsoft đã sử dụng kết hợp nhiều mô hình học máy khác nhau trong các bộ lọc thư rác với nhiệm vụ học và phân loại các email là rác dựa trên những đặc trưng của email như từ khoá, cụm từ, thông tin về người gửi, tiêu đề, liên kết,…
b) Chẩn đoán bệnh
- Với khả năng nhận dạng hình ảnh, video, văn bản,… các mô hình học máy được sử dụng để chẩn đoán nhiều loại bệnh như ung thư, tiểu đường, sốt xuất huyết,…
- Các quy trình chẩn đoán truyền thống tốn kém, mất thời gian và cần sự can thiệp của con người. Hệ thống chẩn đoán và điều trị sớm dựa trên học máy có thể giúp phát hiện bệnh sớm và tiết kiệm chi phí hơn.
Ví dụ: Trong chẩn đoán bệnh ung thư, các mô hình học máy sử dụng dữ liệu từ hồ sơ bệnh án để phát hiện, đo lường và phân tích khối u, định vị tế bào ác tính trong hình ảnh hiển vi một cách hiệu quả, chính xác, giảm chi phí và thời gian. Theo Bộ Y tế 2, phần mềm IBM Watson for Oncology đã góp phần nâng cao hiệu quả điều trị ung thư ở Việt Nam.
c) Nhận dạng giọng nói
- Những tiến bộ gần đây trong học máy cho phép các hệ thống nhận dạng giọng nói một cách chính xác, thông qua việc phân tích một lượng lớn dữ liệu để có thể hiểu rõ bối cảnh của cuộc hội thoại.
- Các mô hình học máy có thể nhận dạng được phương ngữ và giọng điệu khác nhau, cho phép hệ thống nhận dạng giọng nói hiểu nhiều ngôn ngữ và phương ngữ.
Ví dụ: Các ứng dụng như YouTube, Google Assistant, Apple Siri,… đều được tích hợp chức năng nhận dạng giọng nói nhằm tăng tính tiện dụng.
d) Dịch tự động
- Các ứng dụng học máy cho phép thực hiện dịch tức thì các tệp văn bản, âm thanh và hình ảnh từ ngôn ngữ nguồn sang ngôn ngữ đích.
Ví dụ: Các công cụ dịch tự động của Google (Google Translate) hay Microsoft (Microsoft Translator) đều sử dụng mô hình học máy, có khả năng dịch văn bản.
Hình 4. Google Translate được tích hợp các mô hình học máy để dịch tự động
- Dữ liệu phản hồi của người dùng khi xếp hạng chất lượng bản dịch cũng hỗ trợ mô hình học máy cải thiện độ chính xác.
e) Phân tích thị trường
- Dựa vào khả năng dự đoán mà học máy được sử dụng để dự đoán xu hướng, hành vi của người tiêu dùng, phản ứng của thị trường đối với việc điều chỉnh giá sản phẩm, phân tích hiệu suất chiến lược kinh doanh, phân loại khách hàng, tự động đánh giá phản hồi của khách hàng,…
Ví dụ: Công cụ phân tích thị trường được sử dụng phổ biến hiện nay là Power BI do Microsoft phát triển, sử dụng mô hình học máy để phân tích dữ liệu và đưa ra các báo cáo, kết quả theo yêu cầu của người dùng.
______________
2https://baochinhphu.vn/ung-dung-tri-tue-nhan-tao-trong-ho-tro-dieu-tri-ung-thu-10225
5179.htm
Trên chỉ là 1 phần của giáo án. Giáo án khi tải về có đầy đủ nội dung của bài. Đủ nội dung của học kì I + học kì II
Hệ thống có đầy đủ các tài liệu:
- Giáo án word (350k)
- Giáo án Powerpoint (400k)
- Trắc nghiệm theo cấu trúc mới (200k)
- Đề thi cấu trúc mới: ma trận, đáp án, thang điểm..(200k)
- Phiếu trắc nghiệm câu trả lời ngắn (200k)
- Trắc nghiệm đúng sai (200k)
- Lý thuyết bài học và kiến thức trọng tâm (200k)
- File word giải bài tập sgk (150k)
- Phiếu bài tập để học sinh luyện kiến thức (200k)
- .....
Nâng cấp lên VIP đê tải tất cả ở tài liệu trên
- Phí nâng cấp VIP: 900k
=> Chỉ gửi 500k. Tải về dùng thực tế. Nếu hài lòng, 1 ngày sau mới gửi phí còn lại
Cách tải hoặc nâng cấp:
- Bước 1: Chuyển phí vào STK: 1214136868686 - cty Fidutech - MB(QR)
- Bước 2: Nhắn tin tới Zalo Fidutech - nhấn vào đây để thông báo và nhận tài liệu