Nội dung chính Khoa học máy tính 12 Chân trời bài F15: Khoa học dữ liệu

Hệ thống kiến thức trọng tâm bài F15: Khoa học dữ liệu sách Tin học 12 - Định hướng Khoa học máy tính Chân trời sáng tạo. Với các ý rõ ràng, nội dung mạch lạc, đi thẳng vào vấn đề, hi vọng người đọc sẽ nắm trọn kiến thức trong thời gian rất ngắn. Nội dung chính được tóm tắt ngắn gọn sẽ giúp thầy cô ôn tập, củng cố kiến thức cho học sinh. Bộ tài liệu có file tải về. Mời thầy cô kéo xuống tham khảo.

Xem: => Giáo án Tin học 12 - Định hướng Khoa học máy tính chân trời sáng tạo

Xem toàn bộ:

CHỦ ĐỀ F: GIẢI QUYẾT VẤN ĐỀ VỚI SỰ TRỢ GIÚP CỦA MÁY TÍNH

BÀI F15: KHOA HỌC DỮ LIỆU

 

1. Giới thiệu và mục tiêu của Khoa học dữ liệu

- Ngày nay, dữ liệu được thu thập và phát sinh từ nhiều lĩnh vực như mạng xã hội, máy tìm kiếm, thương mại điện tử,... 

- Sự gia tăng số lượng cùng với sự phức tạp của các loại dữ liệu dẫn tới vai trò ngày càng quan trọng của Khoa học dữ liệu (data science) với mục đích tạo ra giá trị từ dữ liệu. 

- Khái niệm: Khoa học dữ liệu là lĩnh vực nghiên cứu và ứng dụng các phương pháp để thu thập, xử lí, phân tích dữ liệu. 

- Khoa học dữ liệu và các lĩnh vực liên quan: Khoa học dữ liệu ứng dụng các kĩ thuật từ nhiều lĩnh vực khác nhau như Toán học, Thống kê, Khoa học máy tính, Trí tuệ nhân tạo, Học máy,… để khám phá tri thức, trích xuất thông tin hữu ích từ dữ liệu. 

BÀI F15: KHOA HỌC DỮ LIỆU

Hình 1. Mối quan hệ giữa khoa học dữ liệu 
và các lĩnh vực liên quan

- Một số mục tiêu cụ thể của Khoa học dữ liệu:

+ Khám phá tri thức: 

  • Giúp hiểu rõ hơn về tính chất, cấu trúc, đặc điểm, xu hướng, mối quan hệ và thông tin ẩn trong dữ liệu. 
  • Một số kĩ thuật thường được sử dụng để khám phá các mẫu dữ liệu (data patterns), quy luật ẩn trong dữ liệu, giúp tìm kiếm thông tin, các ngoại lệ trong dữ liệu, rút trích tri thức từ dữ liệu,…: 
  • Khai phá luật kết hợp (association rule mining).
  • Gom cụm (clustering).
  • Phát hiện ngoại lệ (outlier detection). 
  • Giảm chiều dữ liệu (dimensionality reduction).

Ví dụ: Khám phá tri thức để hiểu rõ hơn về mối quan hệ giữa dữ liệu, các phương pháp điều trị và kết quả điều trị của bệnh nhân. 

+ Phân tích dữ liệu:

  • Nhằm trích xuất thông tin và hiểu rõ dữ liệu, từ đó giúp đưa ra những hành động và quyết định hợp lí. 
  • Giúp khám phá các đặc điểm, thuộc tính, ý nghĩa và quan hệ giữa các thành phần dữ liệu. 

Ví dụ: Phân tích dữ liệu doanh số bán hàng theo thời gian giúp xác định được xu hướng và chu kì, từ đó có thể điều chỉnh số lượng hay loại mặt hàng cần kinh doanh phù hợp.

+ Tối ưu hoá quyết định: 

  • Nhằm làm cho quyết định trở nên hiệu quả và có ảnh hưởng tích cực đối với mục tiêu cụ thể. 
  • Việc kết hợp với mô hình học máy, thuật toán tối ưu hoá giúp đưa ra các quyết định hợp lí. 

Ví dụ: Phân tích dữ liệu phản hồi từ khách hàng cho chiến lược tiếp thị đã thực hiện và phản hồi sau mua sắm để đưa ra quyết định tiếp thị hay chiến lược bán hàng hợp lí. 

+ Trực quan hoá dữ liệu:

  • Là quá trình biểu diễn dữ liệu thông qua đồ hoạ, biểu đồ và hình ảnh để hiểu rõ hơn về các mẫu, xu hướng và quan hệ trong dữ liệu. 
  • Giúp quan sát được dữ liệu dưới dạng hình ảnh, để hiểu rõ hơn về tính chất, phân bố, mức độ phân tán và sự tương quan giữa các thuộc tính của dữ liệu phân tích.
  • Có thể sử dụng các công cụ trực quan hoá dữ liệu như biểu đồ, biểu đồ cột hay biểu đồ tương quan để hiển thị thông tin một cách rõ ràng.

2. Một số thành tựu của Khoa học dữ liệu

- Dữ liệu đa dạng như văn bản, hình ảnh, âm thanh, video,… được sinh ra với khối lượng rất lớn hàng ngày, vì vậy vai trò của Khoa học dữ liệu cùng với các lĩnh vực liên quan như Trí tuệ nhân tạo, Học máy rất quan trọng để thực hiện được các mục tiêu phân tích, khám phá tri thức, tối ưu hoá quyết định, dự đoán hay trực quan hoá. 

- Các thành tựu của Khoa học dữ liệu thường gắn liền với thành tựu của Trí tuệ nhân tạo, Học máy,... trong việc giải quyết các bài toán có khối lượng dữ liệu lớn. 

- Ngành Khoa học dữ liệu không chỉ làm việc với “số lượng lớn” dữ liệu mà còn nghiên cứu, phát triển công nghệ về việc lưu trữ và xử lí dữ liệu, cách dữ liệu được phân tích, khai phá và trực quan hoá. 

- Một số thành tựu nổi bật của Khoa học dữ liệu: 

a) Khám phá tri thức và nâng cao năng lực ra quyết định 

- Khám phá tri thức: Khoa học dữ liệu đã giúp tạo ra các phát hiện mới và tri thức từ dữ liệu, từ việc tìm ra các mẫu dữ liệu (data patterns) và mối liên hệ giữa chúng đến khám phá tri thức mới. 

- Nâng cao năng lực ra quyết định:

+ Cùng với Học máy, Khoa học dữ liệu đã giúp tạo ra các mô hình mở ra khả năng khám phá tri thức từ nhiều nguồn dữ liệu, từ đó tăng hiệu quả quyết định dựa trên dữ liệu. 

+ Khả năng dự đoán, dự báo xu hướng và sự kiện trong tương lai từ dữ liệu hiện tại đã nâng cao hiệu quả của quá trình ra quyết định. 

Ví dụ: Các ứng dụng như SAS của SAS Institute, SPSS Modeler của IBM thường được các tổ chức tài chính và ngân hàng sử dụng để phân tích, khai phá dữ liệu về các giao dịch để xác định được xu hướng hay các bất thường nhằm đưa ra quyết định liên quan lãi suất hay phát hiện kịp thời các rủi ro,...

b) Tự động hoá 

Khoa học dữ liệu cùng với các mô hình học máy đã giúp tự động hoá các tác vụ lặp đi lặp lại. 

Ví dụ: 

+ Robot thông minh Amazon Robotic Drive Units (RDU) được tích hợp các mô hình học máy để phân tích dữ liệu camera, vận tốc, hướng di chuyển, cảm biến,... nhằm tự động hoá việc vận chuyển hàng hoá và sắp xếp các sản phẩm trong kho, giảm thời gian cần thiết để vận chuyển từ các khu vực lưu trữ đến khu vực đóng gói dùng trong các kho hàng của Amazon.

BÀI F15: KHOA HỌC DỮ LIỆU

Amazon Robotic Drive Units (RDU)

+ Hệ thống kiểm soát môi trường sử dụng trong nông nghiệp nhằm phân tích dữ liệu về độ ẩm, nhiệt độ, ánh sáng, cảm biến,... để tối ưu hoá điều kiện cho sự phát triển của cây trồng hay vật nuôi. 

c) Cá nhân hoá dịch vụ 

Khoa học dữ liệu đã đóng góp đáng kể vào việc phát triển và triển khai các phương pháp cá nhân hoá, từ việc hiểu biết rõ người dùng đến việc tạo ra trải nghiệm cá nhân hoá trong nhiều lĩnh vực khác nhau. 

Ví dụ: 

+ Các ứng dụng truyền thông như Netflix, YouTube có thể đề xuất nội dung phù hợp với sở thích và lịch sử xem của người dùng. 

BÀI F15: KHOA HỌC DỮ LIỆU

Đề xuất nội dung trên Netflix

BÀI F15: KHOA HỌC DỮ LIỆU

Đề xuất nội dung trên YouTube

+ Các trang thương mại điện tử như Amazon, Ebay,... sử dụng dữ liệu lịch sử mua sắm và đánh giá của người dùng để đề xuất sản phẩm hay chương trình giảm giá phù hợp với từng khách hàng hay nhóm khách hàng. 

d) Dự đoán 

Khoa học dữ liệu đóng vai trò quan trọng trong phát triển các mô hình học máy có dùng trong phân loại và dự đoán. 

Ví dụ: Các mô hình học máy sử dụng dữ liệu y tế, hình ảnh y khoa để hỗ trợ chẩn đoán, phân tích xu hướng bệnh, dự đoán tình trạng sức khoẻ cá nhân. Một số thành tựu có thể kể đến như phần mềm IBM Watson for Oncology giúp góp phần nâng cao hiệu quả điều trị ung thư và đã được ứng dụng ở Việt Nam.

Giới thiệu phần mềm IBM Watson for Oncology: https://www.youtube.com/watch?
v=qG6jfHI4ucw

Trên chỉ là 1 phần của giáo án. Giáo án khi tải về có đầy đủ nội dung của bài. Đủ nội dung của học kì I + học kì II

Hệ thống có đầy đủ các tài liệu:

  • Giáo án word (350k)
  • Giáo án Powerpoint (400k)
  • Trắc nghiệm theo cấu trúc mới (200k)
  • Đề thi cấu trúc mới: ma trận, đáp án, thang điểm..(200k)
  • Phiếu trắc nghiệm câu trả lời ngắn (200k)
  • Trắc nghiệm đúng sai (200k)
  • Lý thuyết bài học và kiến thức trọng tâm (200k)
  • File word giải bài tập sgk (150k)
  • Phiếu bài tập để học sinh luyện kiến thức (200k)
  • .....

Nâng cấp lên VIP đê tải tất cả ở tài liệu trên

  • Phí nâng cấp VIP: 900k

=> Chỉ gửi 500k. Tải về dùng thực tế. Nếu hài lòng, 1 ngày sau mới gửi phí còn lại

Cách tải hoặc nâng cấp:

  • Bước 1: Chuyển phí vào STK: 1214136868686 - cty Fidutech - MB(QR)
  • Bước 2: Nhắn tin tới Zalo Fidutech - nhấn vào đây để thông báo và nhận tài liệu

Xem toàn bộ:

Tài liệu giảng dạy

Xem thêm các bài khác

Chat hỗ trợ
Chat ngay