Dấn thân vào lĩnh vực Data ngành Khoa học dữ liệu, người trẻ cần gì?
Khả năng thấu hiểu và chuyển tải câu chuyện của data (dữ liệu) vào hoạt động kinh doanh – sản xuất một cách trực quan, sinh động, từ đó giúp doanh nghiệp thiết lập hoặc điều chỉnh chiến lược là điều mà bất cứ ai làm về lĩnh vực liên quan đến dữ liệu đều phải có, đặc biệt là một Data Engineer (DE), Data Scientist (DS), hay Data Analyst (DA).
DE/DS/DA – những người biết kể chuyện thông qua dữ liệu
Năm 2008, ngay sau khi tốt nghiệp Đại học, anh Nguyễn Duy Khương (AIC.LAB), thay vì trở thành kỹ sư phần mềm, anh rẽ hướng nghiên cứu trí tuệ nhân tạo (AI) để trở thành một nhà khoa học dữ liệu. Mặc cho thời điểm đó, ngành này vẫn còn khá mơ hồ tại Việt Nam. Quyết định này được thôi thúc khi anh Khương nhận thấy “dữ liệu và trí tuệ nhân tạo rất quan trọng, mang tính quyết định đến số phận của bất cứ doanh nghiệp nào”.
Bám trụ với định hướng này, anh dành 6 năm theo học Thạc sĩ, Tiến sĩ, sau đó thực chiến tại các công ty lớn, nổi bật là Rakuten – công ty thương mại điện tử và Internet hàng đầu Nhật Bản. Trải qua một hành trình liên tục đào sâu nghiên cứu tìm tòi và áp dụng vào những dự án thực tế với quy mô ngày càng lớn, đến nay, anh Khương có 12 năm đồng hành cùng khoa học dữ liệu – ngành được xem là “sexy” nhất thế kỷ 21 này.
Với từng đó trải nghiệm, Tiến sĩ AI Nguyễn Duy Khương chỉ ra rằng để trở thành một Data Engineer/Data Scientist hay Data analysts, điều mấu chốt là phải nhạy bén với dữ liệu, hiểu câu chuyện của dữ liệu, “data story” trong lĩnh vực mình làm. Mỗi loại dữ liệu đều ẩn chứa một câu chuyện riêng, và những insight đắt giá về chính công ty hoặc về phía khách hàng. Việc thấu hiểu từng loại dữ liệu sẽ giúp doanh nghiệp xây dựng kế hoạch, điều chỉnh hướng kinh doanh – sản xuất doanh nghiệp.
Trong quá trình làm việc, anh Khương từng là “key person” phụ trách nhiều dự án lớn với tập dữ liệu đến từ hàng trăm triệu khách hàng. Dữ liệu từ phía khách hàng có nhiều loại như dữ liệu nhân khẩu học (demographic data), lịch sử giao dịch… Thông thường, sau khi thu thập dữ liệu, các DE/DS/DA sử dụng những công cụ chuyên dụng trên một nền tảng dữ liệu lớn (big data platform) và các thuật toán AI để phân tích dữ liệu, lấy ra insights quý giá từ những con số khô khan, sau đó cung cấp cho các phòng ban liên quan như Marketing hoặc Ban giám đốc để áp dụng vào các sản phẩm cụ thể hoặc để sử dụng trong việc hoạch định chiến lược phát triển công ty. Với việc phân tích nguồn dữ liệu từ chính công ty, nhiều dự án tăng gấp 2~4 lần doanh số so với việc dùng dữ liệu từ Google hay Facebook.
“Hãy sử dụng tối đa dữ liệu từ công ty để hiểu về chính công ty và khách hàng”, anh Khương nhấn mạnh.
Qua đây, anh Khương kết luận, dữ liệu thực sự đắt giá nếu đi theo lộ trình sau: Từ lượng dữ liệu khổng lồ sinh ra bởi hệ thống các ứng dụng, Data Engineer bóc tách, xử lý, làm sạch dữ liệu và dựng lên data warehouse. Từ đây, các Data Scientist/Data Analyst với hiểu biết sâu sắc về ngành có thể phân tích, tìm ra insights quý giá. Chuyển đến tay của đội ngũ Marketing, Sales… Khi quá trình này được tự động hóa, chiến lược kinh doanh của công ty có thể được điều chỉnh dựa trên phản hồi của thị trường gần như ngay lập tức.

Cơ hội của cho DE/DS/DA trong tương lai
Chia sẻ về tương lai của các ngành liên quan đến dữ liệu, anh Khương khẳng định: “Không thể khác được, trong vài thập kỷ tới đây, tất cả các ngành về dữ liệu sẽ ngày càng phát triển”.
Xu hướng tất yếu của thế giới là thu thập tất cả nguồn dữ liệu về công ty mình rồi tiến hành phân tích, xử lý để giúp business hoạt động hiệu quả hơn. Ví như Microsoft có thống kê nếu các công ty tham gia chuyển đổi số, hiệu quả làm việc sẽ tăng 21%. Con số biết nói trên đã chứng minh cho hiệu quả của dữ liệu trong hoạt động kinh doanh – sản xuất.
Trong bối cảnh Covid-19, nhiều ngành nghề trên bờ vực phá sản, riêng ngành dữ liệu vẫn giữ nguyên sức nóng. Dù nhu cầu DE/DS/DA lớn là vậy, song đội ngũ này vô cùng khan hiếm, đặc biệt là DE, so với các ngành liên quan đến data khác. Nguyên nhân chủ yếu được xác định là DE chưa có trường lớp đào tạo hoặc đào tạo chưa bài bản.
“Không có một môi trường nào đào tạo bài bản ngành này. Do vậy, hầu hết các bạn trẻ trở thành một DE đều phải tự học. Nếu không có điều kiện học tại trường, hãy tham gia vào một dự án lớn có liên quan để được thử sức”, anh Khương nói.
Bên cạnh một số điểm chung về dữ liệu, 3 ngành DE/DS/DA cũng có những đặc thù riêng. Với Data Engineering, bên cạnh những kỹ năng bắt buộc của một Software Engineer, DE cần nuôi dưỡng niềm đam mê, sự kiên trì, giỏi thuật toán, và kinh nghiệm thực chiến với dữ liệu lớn. Trong khi đó, vị trí DA yêu cầu nhẹ nhàng hơn về toán và lập trình, song lại đòi hỏi sự nhạy cảm về dữ liệu và hiểu biết sâu sắc về một lĩnh vực bất kỳ nào đó. Riêng các Data Scientist cần có kiến thức tốt về khoa học máy tính và Toán, đặc biệt là thuật toán, đại số tuyến tính, giải tích, xác suất thống kê. Hiện nay, các tập đoàn và trường đại học lớn trên thế giới đều có chương trình đào tạo DE/DS/DA, đó là cơ hội để sinh viên và kỹ sư trẻ học hỏi và đạt được thành tựu trong lĩnh vực “sexy” nhất thời đại này…
QueDT



