Xây dựng nền tảng lưu trữ và phân tích dữ liệu lớn với apache hadoop và spark - Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ

Đăng nhập

Giáo dục và đào tạo cùng với khoa học và công nghệ là quốc sách hàng đầu.

Các số đã xuất bản

Bài báo khoa học

Lĩnh vực nghiên cứu

Danh mục

Xây dựng nền tảng lưu trữ và phân tích dữ liệu lớn với apache hadoop và spark

Số tạp chí:Số 3 (78) 2022

Tác giả: Vũ Bảo Tạo, Đặng Văn Nam, Nông Thị Oanh, Hoàng Thị Ngát, Nguyễn Thị Ánh Tuyết

Tạp chí xuất bản:Tạp chí NCKH - Đại học Sao Đỏ, quý 3.2022

Ngày đăng tạp chí:2022/10/03

Tóm tắt:

Hiện nay, dữ liệu đã và đang trở nên ngày càng quan trọng. Dữ liệu là yếu tố quyết định, ảnh hưởng tới hầu hết các lĩnh vực như tài chính – ngân hàng, y tế, giáo dục, nông nghiệp, năng lượng…. Tốc độ sinh dữ liệu ngày càng nhanh với khối lượng ngày càng lớn và thuật ngữ Dữ liệu lớn (Big data) cũng ra đời. Dữ liệu lớn là một trong những công nghệ chủ chốt của cuộc Cách mạng công nghiệp 4.0; Tuy nhiên, việc lưu trữ và phân tích dữ liệu lớn cũng đòi hỏi những kiến thức và công nghệ phù hợp. Chúng ta không thể sử dụng các kỹ thuật lưu trữ và phân tích dữ liệu truyền thống với dữ liệu lớn được. Trong bài báo này, nhóm tác giả sẽ trình bày việc triển khai xây dựng nền tảng lưu trữ dữ liệu lớn sử dụng Apache Hadoop trên một cụm (cluster) các máy tính và Apache Spark để phân tích dữ, trích rút các thông tin có ích (insights) từ tập dữ liệu lưu trữ trên các máy tính này.

Từ khóa:Dữ liệu lớn; phân tích dữ liệu lớn; cụm máy tính; Hadoop; Spark.

Tệp đính kèm: Tải về

Các bài báo khác

Phân lớp người dùng tiềm năng của hệ thống học trực tuyến vuihoc
Số tạp chí: Số 2 (81) 2023
Tác giả: Hoàng Thị Ngọc Diệp, Trần Duy Khánh, Phạm Huy Hoàng, Trần Đình Khang
Tạp chí xuất bản: Tạp chí NCKH - Đại học Sao Đỏ

Sử dụng phương pháp toán thống kê đánh giá và dự đoán chất lượng để nâng cao hiệu quả quản lý các chương trình giáo dục chuyên nghiệp
Số tạp chí: Số 1 (80) 2023
Tác giả: Nguyễn Phúc Hậu, Nguyễn Thị Thu
Tạp chí xuất bản: Tạp chí NCKH - Đại học Sao Đỏ

Nhận diện cảm xúc người học thời gian thực trong lớp học trực tuyến
Số tạp chí: Số 2 (77) 2022
Tác giả: Phạm Thị Hường, Đặng Thành Trung, Phạm Quang Huy
Tạp chí xuất bản: Tạp chí NCKh - Đại học Sao Đỏ