Danh Mục Sản Phẩm

BIG DATA (DỮ LIỆU LỚN) LÀ GÌ? TẦM QUAN TRỌNG VÀ ỨNG DỤNG CỦA BIG DATA TRONG THỰC TIỄN

Mã Sản Phẩm
: BV11_SEEACT
Tên Sản Phẩm
: BIG DATA (DỮ LIỆU LỚN) LÀ GÌ? TẦM QUAN TRỌNG VÀ ỨNG DỤNG CỦA BIG DATA TRONG THỰC TIỄN
Danh Mục
: Kiến thức
Thương Hiệu
: Công Nghệ IoT-4.0
Giá

: Liên Hệ



Hiện nay, rất nhiều các thuật ngữ hiện đại được nhắc đến trong cuộc sống và công việc. Trong số đó Big Data là thuật ngữ có nghĩa rộng và khá khó hiểu. Bài viết dưới đây, chúng tôi sẽ giúp bạn tìm hiểu phần nào Big Data là gì? Và vai trò của Big Data với đời sống con người

Chi Tiết Sản Phẩm


BIG DATA (DỮ LIỆU LỚN) LÀ GÌ? TẦM QUAN TRỌNG VÀ ỨNG DỤNG CỦA BIG DATA TRONG THỰC TIỄN

Hiện nay, rất nhiều các thuật ngữ hiện đại được nhắc đến trong cuộc sống và công việc. Trong số đó Big Data là thuật ngữ có nghĩa rộng và khá khó hiểu. Bài viết dưới đây, chúng tôi sẽ giúp bạn tìm hiểu phần nào Big Data là gì? Và vai trò của Big Data với đời sống con người.

vai trò của Big Data với đời sống con người

 

  1. BIG DATA (DỮ LIỆU LỚN) LÀ GÌ?

Dữ liệu là mãi mãi, đây là sự thật. Bạn có đang dùng 1 ứng dụng được xây dựng cách đây 5 năm? Bạn có đang dùng các phần cứng được tạo ra cách đây 10 năm? Câu trả lời đa phần là không. Tuy nhiên nếu hỏi: Bạn có đang dùng dữ liệu đã có các đây 50 năm? Câu trả lời chắc chắn là có. Ví dụ, nhìn vào lịch sử phát triển của dân tộc, hay như dữ liệu ngày sinh nhật của chúng ta, ít nhất chúng ta đang sử dụng nó đến ngày hôm nay.

Các tổ chức ngày càng phát triển, dữ liệu liên quan cũng phát triển và ngày càng phức tạp hơn. Dữ liệu dàn trải rất khó để phân loại chỉ với 1 thuật toán duy nhất. Các tổ chức đang thực sự đối mặt với thách thức để giữ tất cả dữ liệu trên 1 nền tảng để cho họ một cái nhìn tổng quát và nhất quán. Và Big Data ra đời như 1 xu thế tất yếu.

Một sai lầm phổ biến thường gặp đối với những người mới tìm hiểu về Big Data đó là coi Big data (dữ liệu lớn) là dữ liệu có kích thước lớn. Điểm khác biệt duy nhất giữa dữ liệu lớn và dữ liệu có kích thước lớn và có sự đa dạng đó là công nghệ sử dụng để giúp đẩy nhanh tốc độ xử lý dữ liệu

Big Data là tài sản thông tin dữ liệu, mà những dữ liệu này có khối lượng lớn, tốc độ gia tăng dữ liệu cao, có tính đa dạng, tính xác thực và mang lại giá trị, đòi hỏi phải có công nghệ mới để xử lý hiệu quả nhằm đưa ra được các quyết định hiệu quả, khám phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hóa được quá trình xử lý dữ liệu.

Khi nhắc đến thuật ngữ Big Data người ta sẽ nghĩ đến ngay đặc trưng của nó gắn liền với 5V: Volume, Variety, Velocity, Veracity và Value. Theo đó lần lượt là khối lượng, mức độ đa dạng, tốc độ phân tích xử lý dữ liệu, tính xác thực của dữ liệu và giá trị thông tin.

5Vs trong Big Data

  • Volume – Khối lượng kích thước

Khi nói đến big data – dữ liệu lớn thì chữ V đầu tiên bạn nên biết đó là Volume (Khối lượng).

Trên thực tế, lượng dữ liệu được tạo ra chỉ trong vài năm năm gần đây đã bằng 90% khối lượng dữ liệu được tạo ra từ thuở sơ khai tính tới 2003. Và theo dự báo trong những năm tới lượng dữ liệu còn tăng gấp nhiều lần. Lượng dữ liệu được tạo ra đến hết năm 2020 sẽ gấp 50 lần lượng dữ liệu được tạo 10 năm trước đó.

  • Thực tế là lượng dữ liệu sẽ siêu siêu lớn khi mà IOT ngày càng được ứng dụng rộng rãi hơn với hàng triệu tỉ cảm biến điện tử được sử dụng
  • Những chiếc máy bay có thể tạo ra khoảng 2.5 tỉ Terabyte dữ liệu mỗi năm
  • Square Kilometer Array Telescope có thể tạo ra 1 Exabyte dữ liệu mỗi ngày

Ngày càng nhiều dữ liệu được tạo ra, lưu trữ và xử lý là nhờ những công nghệ đột phá như điện toán đám mây, bộ siêu vi xử lý…

  • Variety – Mức độ đa dạng

Theo cách hiểu truyền thống thì dữ liệu (data) được hiểu là dữ liệu có cấu trúc.

Dữ liệu được lưu vào các cột (fields) và các dòng (rows) như trong excel vậy. Tuy nhiên, quan điểm về dữ liệu trong thời đại mới đã mở rộng hơn rất nhiều, nó có thể là:

  • Âm thanh
  • Hình ảnh
  • Video
  • Email
  • Like/ share

Đa số dữ liệu là dữ liệu phi cấu trúc. Điều này khiến cho dữ liệu trở nên quá đa dạng đến mức phức tạp và tốn kém hơn.

big data du lieu lon va ung dung trong nha may san xuat

  • Velocity – Tốc độ

Đây là thuật ngữ quan trọng trong big data, nó đề cập tới tốc độ dữ liệu được tạo ra, lưu trữ, xử lý và truy vấn. Trong quá khứ thì dữ liệu được cập nhật thường xuyên nhưng thời gian phân tích, xử lý và lên báo cáo thường là định kỳ. Có thể là hàng tuần hoặc hàng tháng mới thu thập được đầy đủ dữ liệu phục vụ báo cáo. Nhưng hiện tại với sự phát triển mạnh mẽ về công nghệ: Lưu trữ online, băng thông internet, tốc độ xử lý của bộ vi xử lý, … dữ liệu được tạo ra, lưu trữ, xử lý và truy vấn gần như - hay thậm chí - là theo thời gian thực.

Một vài ví dụ về tính chất Velocity của Big Data:

- Theo youtube: Mỗi phút có khoảng 100 giờ video được up lên hệ thống

- Mỗi phút có khoảng 200 triệu thư điện tử được gửi đi

- Theo Flickr: Có khoảng 20 triệu bức ảnh được xem và 30 nghìn ảnh được tải lên trang Flickr

- Theo Google: Mỗi phút có khoảng 2.5 triệu lượt truy vấn trên toàn hệ thống.

Với bằng đó ví dụ, bạn có thể thấy được lượng dữ liệu được tạo ra nhiều và nhanh như thế nào. Sự thực là dữ liệu được tạo ra theo cấp số nhân với tốc độ chóng mặt.

BIG DATA (DỮ LIỆU LỚN) LÀ GÌ?

  • Veracity: tính xác thực của dữ liệu

Với xu hướng Social ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ của người dùng làm cho bức tranh xác định về độ tin cậy & chính xác của dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của Big Data.

  • Value: Giá trị thông tin

Giá trị là đặc điểm quan trọng nhất của dữ liệu lớn, vì khi bắt đầu triển khai xây dựng dữ liệu lớn thì việc đầu tiên chúng ta cần phải làm đó là xác định được giá trị của thông tin mang lại như thế nào, khi đó chúng ta mới có quyết định có nên triển khai dữ liệu lớn hay không. Nếu chúng ta có dữ liệu lớn mà chỉ nhận được 1% lợi ích từ nó, thì không nên đầu tư phát triển dữ liệu lớn.

2. VÀI THÔNG TIN VỀ TÌNH HÌNH BIG DATA HIỆN NAY

  • Theo tài liệu của Intel vào tháng 9/2013, hiện nay thế giới đang tạo ra 1 petabyte dữ liệu trong mỗi 11 giây và nó tương đương với một đoạn video HD dài 13 năm. Bản thân các công ty, doanh nghiệp cũng đang sở hữu Big Data của riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình.
  • Nhà bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng một hệ thống Linux và hồi năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB.
  • Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên quan.

  • du lieu lon - big data la gi

 

  • Còn theo tập đoàn SAS, chúng ta có một vài số liệu thú vị về Big Data như sau:
    - Các hệ thống RFID (một dạng kết nối tầm gần, như kiểu NFC nhưng có tầm hoạt động xa hơn và cũng là thứ dùng trong thẻ mở cửa khách sạn) tạo ra lượng dữ liệu lớn hơn 1.000 lần so với mã vạc truyền thống
    - Chỉ trong vòng 4 giờ của ngày “Black Friday” năm 2012, cửa hàng Walmart đã phải xử lí hơn 10 triệu giao dịch tiền mặt, tức là khoản 5.000 giao diện mỗi giây.
    - Dịch vụ chuyển phát UPS nhận khoảng 39,5 triệu yêu cầu từ khách hàng của mình mỗi ngày
    - Dịch vụ thẻ VISA xử lí hơn 172.800.000 giao dịch thẻ chỉ trong vòng một ngày mà thôi
    - Trên Twitter có 500 triệu dòng tweet mới mỗi ngày, Facebook thì có 1,15 tỉ thành viên tạo ra một mớ khổng lồ dữ liệu văn bản, tập tin, video…

3. ỨNG DỤNG CỦA BIG DATA TRONG THỰC TIỄN

Do tầm quan trọng của Big Data, việc biết, hiểu và ứng dụng tốt Dữ liệu lớn sẽ tạo ra lợi thế rất lớn cho bất kỳ doanh nghiệp, tổ chức nào. Dưới đây là 1 số ví dụ:

  • Ứng dụng phân tích Big Data trong hoạt động chính trị

Cựu Tổng thống Obama đã sử dụng dữ liệu dữ liệu lớn để phục vụ cho cuộc tranh cử Tổng thống của mình. Ông xây dựng một đội ngũ nhân viên chuyên đi thu thập thông tin và phân tích dữ liệu thu được trong dự án triển khai về dữ liệu lớn. Đội ngũ nhân viên này thu thập tất cả thông tin về người dân ở các khu vực, sau đó phân tích và chỉ ra một số thông tin quan trọng về người dân Mỹ như: Thích đọc sách gì, thích mua loại thuốc gì, thích sử dụng phương tiện gì… Thậm chí còn biết được cả thông tin về người đó đã bỏ phiếu tín nhiệm ai ở lần bầu cử trước. Trên cơ sở những thông tin này, Obama đã đưa ra kế hoạch vận động phù hợp, giúp ông tái đắc cử Tổng thống lần 2 của nước Mỹ.

  • Ứng dụng phân tích Big Data để quản lý xã hội

Hiện nay Chính phủ đang ứng dụng số hóa vào quản lý xã hội bằng cách tạo ra những kho Big Data Dữ liệu lớn để cho người dân và các cơ quan hành chính thuận tiện trong việc nhập, tìm kiếm, kiểm tra và lưu trữ dữ liệu bằng cách triển khai Căn cước công dân gắn chip, sổ hộ khẩu điện tử, hộ chiếu điện tử, bảo hiểm xã hội điện tử, ... Việc này giúp giảm các thủ tục hành chính giấy tờ rườm rà cho người dân, đề cao sự minh bạch, trong suốt và tin cậy.

  • Ứng dụng Big Data trong an toàn giao thông

ung dung cua big dataHệ thống phân tích tử vong của Cơ quan An toàn Giao thông đường cao tốc quốc gia Hoa Kỳ

Sử dụng số liệu CDR trong quá khứ để ước lượng các dòng giao thông trong thành phố vào các giờ cao điểm, từ đó có những bản đồ tai nạn giao thông, kế hoạch phân luồng giao thông ... chi tiết, hợp lý giúp giảm thiểu tai nạn và kẹt xe. Ngoài ra còn đưa ra thông tin cho người tham gia giao thông được biết nếu muốn đi từ nơi này đến nơi khác thì nên đi vào giờ nào để tránh kẹt xe, hoặc đi đường nào là ngắn nhất… Ngoài ra dữ liệu lớn còn giúp phân tích định vị người dùng thiết bị di động, ghi nhận chi tiết cuộc gọi trong thời gian thực; và giảm thiểu tình trạng ùn tắc giao thông.

  • Ứng dụng Dữ liệu lớn trong Y tế

Trong y học các bác sĩ dựa vào số liệu trong các bệnh án để đưa ra dự đoán về nguy cơ mắc bệnh. Đồng thời cũng đưa ra được xu hướng lây lan của bệnh. Ví dụ, ứng dụng Google Flu Trend là một trong những ứng dụng thành công của Google, ứng dụng này dựa trên từ khóa tìm kiếm về dịch cúm H5N1 năm 2009 ở các khu vực tại Mỹ, sau đó bộ máy phân tích của Google sẽ phân tích và đối chiếu kết quả tìm kiếm đó, sau cùng là đưa ra dự báo về xu hướng dịch cúm tại khu vực đó. Qua đó cho biết tình hình cúm H5N1 tại khu vực đó sẽ diễn ra như thế nào để đưa ra các giải pháp phòng tránh. Những kết quả mà Google Flu Trend đưa ra, hoàn toàn phù hợp với báo cáo của Tổ chức y tế thế giới WHO về tình hình bệnh cúm H5N1 tại khu vực đó của Mỹ.

  • Ứng dụng Dữ liệu lớn trong tài chính

Từ những dữ liệu chính xác, định kỳ, kịp thời thu thập được thông qua các giao dịch của khách hàng giúp tiến hành phân tích, xếp hạng và quản lý các rủi ro trong đầu tư tài chính, tín dụng.

ung dung big data trong cuoc song

  • Ứng dụng Big Data trong thương mại

Trong thương mại dữ liệu lớn giúp cho chúng ta thực hiện được một sốcông việc sau: Phân khúc thị trường và khách hàng; phân tích hành vi khách hàng tại cửa hàng; tiếp thị trên nền tảng định vị; phân tích tiếp thị chéo kênh, tiếp thị đa kênh; quản lý các chiến dịch tiếp thị và khách hàng thân thiết; So sánh giá; Phân tích và quản lý chuỗi cung ứng; Phân tích hành vi, thói quen người tiêu dùng.

  • Ứng dụng Big Data trong dự báo thời tiết

Trong bối cảnh khí hậu đang thay đổi chóng mặt vì con người, một hệ thống có khả năng dự đoán chính xác và đưa ra cảnh báo sớm có khả năng cứu sống hàng triệu sinh linh. Bằng cách sử dụng Big Data, các nhà khoa học dự báo với độ chính xác tương đối trong vòng 1 tuần cho đến 1 tháng. Và gần đây, các nhà khoa học của Cục Khí tượng thủy văn Úc đang nghiên cứu đưa ra dự đoán chính xác thời tiết trước vài năm thậm chí vài chục năm. 

Tiến sĩ Peter May - Giám đốc nghiên cứu của cục, cho biết: "Chúng tôi đang nghiên cứu một lượng dữ liệu khổng lồ lên đến 4 petabyte. Tính tời thời điểm này, hệ thống vẫn đang được vận hành tốt và đi đúng hướng; thậm chí một số sự kiên lớn như El Nino đã được dự báo chuẩn xác. Nếu không có gì sai sót, chúng tôi rất tự tin vào khả năng thành công của nghiên cứu này”.

big data va cong nghiep 4.0

Từ những ứng dụng trên đây, có thể nói, Big Data tạo nên ảnh hưởng rộng lớn đến đời sống của tất cả con người trong thời đại số. Nhiều ngành kinh tế như ngân hàng, giao thông vận tải, thương mại điện tử hay chăm sóc sức khỏe đã có những bước nhảy vọt, cải tiến công nghệ, sản phẩm của mình.

 4. KẾT LUẬN

Cùng với Internet vạn vật (IoT), Trí tuệ nhân tạo (AI) Điện toán đám mây (Cloud), Big data tiếp tục là một trong những lĩnh vực đang nổi lên cho tất cả các ngành công nghiệp & có mặt ở khắp mọi nơi.

Hi vọng với bài viết trên, DACO đã cung cấp cho bạn hiểu hơn về khái niệm về Big Data là gì và tầm quan trọng của nó ảnh hưởng như thế nào trong đời sống. 

Công ty TNHH DACO là công ty đi đầu trong lĩnh vực giải pháp số hóa nhà máy tại Việt Nam và đồng thời là nhà phân phối chính thức tại Việt Nam của nhiều thương hiệu sản phẩm công nghiệp tự động hóa. DACO đã nghiên cứu và phát triển SEEACT là 1 hệ thống giải pháp toàn diện phù hợp với mô hình của các nhà máy sản xuất tại Việt Nam với các module như hệ thống quản lý trạng thái hoạt động của máy móc, mô hình quản lý năng suất, phương pháp gọi hỗ trợ, giải pháp cải tiến trong quản lý kho hàng, phần mềm quản lý tài sản, hệ thống báo giờ tự động, phương pháp giám sát điện năng, nhiệt độ - độ ẩm , … 

Với nhiều Dự án tiêu biểu tại các nhà máy có vốn đầu tư nước ngoài trong các khu công nghiệp trên khắp cả nước, hãy liên hệ DACO để được TƯ VẤN MIỄN PHÍ cách thức ứng dụng công nghiệp 4.0 cùng với Big Data phù hợp doanh nghiệp sản xuất của bạn ngay bây giờ nhé.

 


Tin Mới

Sản Phẩm Nổi Bật