Khoa học dữ liệu và phân tích dữ liệu

Theo một báo cáo mới được công bố tại Diễn đàn Kinh tế Thế giới, những thay đổi về nhân khẩu học và tiến bộ kỹ thuật có thể dẫn đến việc 5 triệu việc làm sẽ biến mất vào năm 2020. Tuy nhiên, ngược lại có một số công việc lại được dự đoán sẽ có sự tăng trưởng đáng kể, trong đó có nghề phân tích dữ liệu.

Phân tích dữ liệu – data analyst là gì?

Phân tích dữ liệu là quá trình phát hiện, giải thích và truyền đạt các mô hình có ý nghĩa trong dữ liệu. Đặc biệt có giá trị trong các lĩnh vực có nhiều thông tin được ghi lại, phân tích dựa vào sự ứng dụng đồng thời của số liệu thống kê, lập trình máy tính và nghiên cứu hoạt động để định lượng hiệu suất.

Khi dữ liệu được thu thập và sắp xếp bằng các công cụ này, kết quả sẽ được diễn giải để đưa ra quyết định. Kết quả cuối cùng có thể được phân phối dưới dạng tóm tắt hoặc dưới dạng trực quan như biểu đồ hoặc đồ thị.

Chuyên viên phân tích dữ liệu (Data Analyst) là người thực hiện các phân tích sâu dữ liệu ở dạng đồ thị, biểu đồ, sơ đồ, bảng biểu và báo cáo; sau đó sử dụng các dữ liệu đó để xác định xu hướng và tạo mô hình dự đoán những gì có thể xảy ra trong tương lai.

Nghề phân tích dữ liệu là một chuyên ngành hẹp của ngành Khoa học dữ liệu.

Nhiệm vụ chính của Data Analyst: Phân tích dữ liệu khách hàng

Dữ liệu khách hàng (Customer Data) là thông tin khách hàng cung cấp cho doanh nghiệp khi mua hàng tại cửa hàng, qua website, khảo sát, qua ứng dụng di động, các phương tiện truyền thông, chiến dịch tiếp thị hoặc các kênh bán trực tuyến khác.

Dữ liệu khách hàng là nền tảng cho một chiến lược kinh doanh thành công.

Dựa vào những cơ sở thu thập dữ liệu khách hàng cũng như đặc điểm của dữ liệu, dữ liệu khách hàng được chia ra thành 4 dạng phổ biến:

  • Dữ liệu thông tin và nhân khẩu học (Information & Demographic Data): Dạng dữ liệu này còn được gọi tắt là dữ liệu cá nhân, như danh tính cá nhân (họ tên, giới tính, nhóm tuổi, ngày tháng năm sinh…). hoặc thông tin ẩn danh và không dùng để nhận dạng mọi đối tượng (địa chỉ IP, ID thiết bị hoặc cookies…).
  • Dữ liệu tương tác (Engagement Data): Dữ liệu tương tác của khách hàng là những thông tin khách tương tác với thương hiệu thông qua nhiều kênh, phương thức tiếp thị khác nhau. Dữ liệu này sẽ chính là tất cả hành vi của khách hàng trên website, trên các trang mạng xã hội hoặc dịch vụ bán hàng.
  • Dữ liệu hành vi khách hàng (Onsite Behavior Data): Dữ liệu hành vi khách hàng cung cấp thông tin chi tiết về trải nghiệm sản phẩm đối với doanh nghiệp. Những dữ liệu hành vi này có thể kể đến như đăng ký dùng thử miễn phí, đăng ký tài khoản người dùng, sử dụng tính năng, hủy kích hoạt hoặc bổ sung giấy phép cho người dùng. 
  • Dữ liệu thái độ (Attitudinal Data): Dữ liệu thái độ khách hàng chính là dữ liệu giúp thúc đẩy bởi cảm xúc của khách hàng về doanh nghiệp, đó là cảm nhận riêng của họ về thương hiệu. Dữ liệu này thường mang tính chủ quan và định tính nên cần kết hợp với dữ liệu định lượng để đưa ra kết quả chính xác.

Thế giới thiếu 6 triệu chuyên viên phân tích dữ liệu

Theo ông Trần Thế Trung – Viện trưởng Viện Nghiên cứu Công nghệ FPT, các vị trí làm việc với phân tích dữ liệu phải hội tụ được nhiều kỹ năng cùng một lúc. Hơn nữa, họ còn cần có hiểu biết về doanh nghiệp hoặc các ngành công nghiệp cụ thể, nơi các kết quả phân tích được ứng dụng. 

Để làm việc với giới doanh nghiệp không có nền tảng kỹ thuật, họ cần kỹ năng giao tiếp tốt, kỹ năng trình bày báo cáo dễ hiểu, dễ giúp doanh nghiệp ra quyết định. Vì thế, người đứng được với nghề phân tích dữ liệu không phải dễ tìm. Viện nghiên cứu của Accenture nhận định, riêng tại Mỹ, 80% các công việc liên quan đến khoa học dữ liệu mới được sinh ra trong khoảng năm 2010 – 2011 vẫn chưa tìm được ứng viên.

Sự khan hiếm nhân lực trên thị trường quốc tế là cơ hội cho các nước có nền tảng toán học và các ngành khoa học tự nhiên tốt ở bậc phổ thông như Việt Nam trong đào tạo và cung ứng nhân lực. 

Ông Trương Gia Bình

“Thế giới vẫn còn thiếu 6 triệu chuyên gia phân tích dữ liệu, cơ hội nằm ở những bộ não linh hoạt, điều mà người trẻ Việt Nam có lợi thế. “

Ông Trương Gia Bình (nguyên Chủ tịch HĐQT FPT) – Thời báo kinh doanh

Khoa học dữ liệu ra làm gì

Vai trò quan trọng nhất của một nhà phân tích dữ liệu đó là thu thập, phân loại và nghiên cứu các bộ thông tin khác nhau. Mục tiêu là để xác định giá trị cho một số quá trình hoặc chức năng để có thể được đánh giá và so sánh theo thời gian. Dữ liệu này được điều chỉnh và chuẩn hóa để có thể đưa ra khỏi ngữ cảnh và sử dụng như thông tin độc lập hoặc kết hợp với các dữ liệu khác mà không làm mất tính toàn vẹn của nó.

Các chuyên gia phân tích thường được giao nhiệm vụ rút ra kết luận từ dữ liệu và giúp những người khác trong doanh nghiệp hiểu làm thế nào để sử dụng nó. Họ thường là những người hiểu rõ nhất cội nguồn và bản chất của các con số.

ngành khoa học dữ liệu

Các khối kiến thức cần thiết của người làm khoa học dữ liệu

Để trở thành chuyên gia phân tích dữ liệu, người theo nghề phải có kiến thức về toán học thống kê cũng như máy học, kiến thức về lập trình, kiến thức về cơ sở dữ liệu.

8 kỹ năng để trở thành nhà khoa học dữ liệu:

  1. Tư duy phản biện.
  2. Thống kê
  3. Kỹ năng lập trình.
  4. Kiến thức về Học máy, Học sâu và AI.
  5. Kỹ năng làm việc với dữ liệu phi cấu trúc.
  6. Kỹ năng tiền xử lý dữ liệu.
  7. Kỹ năng trực quan hóa dữ liệu.

Các trường đào tạo ngành Khoa học dữ liệu

Theo nghề này, học sinh tốt nghiệp THPT có thể chọn các ngành trong chương trình đại học như: công nghệ thông tin hoặc toán học ứng dụng, khoa học máy tính, kỹ thuật phần mềm, hệ thống thông tin… Đặc biệt, nếu có điều kiện học các chương trình bằng tiếng Anh, sinh viên sẽ có lợi thế lớn, vì nghề phân tích dữ liệu có môi trường làm việc toàn cầu.

Các chuyên ngành – các trường đào tạo ngành khoa học dữ liệu:

  1. Hệ thống thông tin quản lý: Viện Đào tạo quốc tế, Trường ĐH Kinh tế – luật (ĐHQG TP.HCM), Trường ĐH Kinh tế (ĐH Huế/ĐH Đà Nẵng), Trường ĐH Kinh tế TP.HCM, Trường ĐH Ngân hàng TP.HCM, Trường ĐH Nha Trang, Trường ĐH Tài chính – marketing, Trường ĐH Hoa Sen, Trường CĐ Kinh tế đối ngoại…;
  2. Hệ thống thông tin: Viện Đào tạo quốc tế, Trường ĐH Khoa học tự nhiên, Trường ĐH Công nghệ thông tin (ĐHQG TP.HCM), Trường ĐH Cần Thơ, Trường ĐH Kỹ thuật – công nghệ Cần Thơ, Trường ĐH Thủ Dầu Một, Trường ĐH Bách khoa Hà Nội…
  3. Ngành công nghệ thông tin- Khoa học máy tính- Phần mềm: Trường ĐH Bách khoa TPHCM/Hà Nội, ĐH Khoa học tự nhiên TPHCM/ Hà Nội, ĐH Công nghệ thông tin, Trường ĐH Quốc tế Hồng Bàng, ĐH Văn Lang…

Tổ hợp xét tuyển thông dụng vào các nhóm ngành này là A00, A01, D01. Điểm chuẩn xét theo kết quả kỳ thi THPT quốc gia dao động từ 15 – 28 điểm tùy năm, tùy trường. Một số trường còn sử dụng cả phương thức xét tuyển theo học bạ.

Đọc thêm các bài viết sau:

You might also like

Comments are closed.

Nhận bài viết mỗi ngày    Nhận Lần khác